使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置

2024-01-09

我正在尝试建造一个可以通过基本的眼球运动来控制的机器人。我将网络摄像头对准我的脸，根据我瞳孔的位置，机器人会以某种方式移动。如果瞳孔位于眼睛的上、下、左、右角，机器人将分别向前、向后、向左、向右移动。

我最初的计划是使用眼哈尔级联来找到我的左眼。然后我会在眼睛区域使用霍夫圆来找到瞳孔的中心。我会通过找到从霍夫圆中心到一般眼睛区域边界的距离来确定瞳孔在眼睛中的位置。

因此，对于我的代码的第一部分，我希望能够跟踪眼睛瞳孔的中心，如本视频所示。https://youtu.be/aGmGyFLQAFM?t=38 https://youtu.be/aGmGyFLQAFM?t=38

但是当我运行我的代码时，它无法始终找到瞳孔的中心。霍夫圆经常画在错误的区域。即使眼睛移动，我怎样才能让我的程序始终找到瞳孔的中心？

我是否可以/更好/更容易地告诉我的程序学生一开始在哪里？我研究过其他一些眼球追踪方法，但我无法形成通用算法。如果有人可以帮助形成一个，那将不胜感激！https://arxiv.org/ftp/arxiv/papers/1202/1202.6517.pdf https://arxiv.org/ftp/arxiv/papers/1202/1202.6517.pdf

import numpy as np
import cv2

face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
eye_cascade = cv2.CascadeClassifier('haarcascade_righteye_2splits.xml')

#number signifies camera
cap = cv2.VideoCapture(0)

while 1:
    ret, img = cap.read()
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    #faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    eyes = eye_cascade.detectMultiScale(gray)
    for (ex,ey,ew,eh) in eyes:
        cv2.rectangle(img,(ex,ey),(ex+ew,ey+eh),(0,255,0),2)
        roi_gray2 = gray[ey:ey+eh, ex:ex+ew]
        roi_color2 = img[ey:ey+eh, ex:ex+ew]
        circles = cv2.HoughCircles(roi_gray2,cv2.HOUGH_GRADIENT,1,20,param1=50,param2=30,minRadius=0,maxRadius=0)
        try:
            for i in circles[0,:]:
                # draw the outer circle
                cv2.circle(roi_color2,(i[0],i[1]),i[2],(255,255,255),2)
                print("drawing circle")
                # draw the center of the circle
                cv2.circle(roi_color2,(i[0],i[1]),2,(255,255,255),3)
        except Exception as e:
            print e
    cv2.imshow('img',img)
    k = cv2.waitKey(30) & 0xff
    if k == 27:
        break

cap.release()
cv2.destroyAllWindows()

从我之前所做的一些工作中，我可以看到两种选择：

训练 Haar 检测器来检测眼球，使用以瞳孔中心为中心、眼球宽度为宽度的训练图像。我发现这比使用霍夫圆或 OpenCV 的原始眼检测器（代码中使用的那个）更好。
使用Dlib的面部标志点来估计眼睛区域。然后利用眼球的白色和黑色区域引起的对比度以及轮廓来估计瞳孔的中心。这产生了更好的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置的相关文章

如何检测图像是否像素化

之前有人在 SO 上提出过这样的问题在Python中检测像素化图像 https stackoverflow com questions 12942365 detecting a pixelated image in python还有关于q
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
python类型中的__flags__有什么用

我最近阅读了pickle源代码以下代码在copy reg让我很困惑 HEAPTYPE 1 lt lt 9 def reduce ex self proto assert proto lt 2 for base in self class
在 CSV 文件的最上面一行写入

我有这个sample csv 文件 a 1 apple b 2 banana c 3 cranberry d 4 durian e 5 eggplant 并有以下代码 samplefile open sample csv rb rows s
Python 2.7 中四舍五入到小数点后两位？

使用Python 2 7如何将我的数字四舍五入到小数点后两位而不是它给出的10位左右 print financial return of outcome 1 str out1 使用内置函数round https docs python or
NoneType 类型的对象没有 len

def medianeven L while len L gt 2 L L 1 len L 1 return average L def medianodd L while len L gt 1 L L 1 len L 1 return L
相机校准：如何正确进行

我正在尝试使用棋盘格通过众所周知的张氏方法进行校准然后进行捆绑调整该方法在 Matlab 和 OpenCV 中都可用有很多经验指南但从我个人的经验来看准确性是相当随机的它有时可能非常好但有时也可能非常糟糕实际上只需将棋盘放
如何用OpenCV解决图像处理相机IO延迟

我有一个 OpenCV 程序其工作原理如下 VideoCapture cap 0 Mat frame while true cap gt gt frame myprocess frame 问题是如果myprocess耗时较长超过相机的I
我如何使用字符串来表示 sqlalchemy 对象属性？

我正在使用 SQLalchemy 和 WTForms 编写 Flask 应用程序数据库更新出现问题我有许多对象表字段正在尝试更新所以我从这个开始 this works great but needs many lines of cod
如何使用FeatureUnion转换PipeLine中的多个特征？

我有一个 pandas 数据框其中包含有关用户发送的消息的信息对于我的模型我感兴趣的是预测消息的缺失收件人即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分我正在使用 OneVsRestClassifier 和
Python argparse：需要两个并存的位置参数

使用 argparse 如何指定我希望两个位置参数一起出现或根本不出现 IE 我希望我的使用字符串看起来像 Usage FooBar py h FOO BAR 正如 hpaulj 所建议的这是您可以使用的解决方案 In 1 import
为什么我无法从多处理队列中捕获 Queue.Empty 异常？

我试图捕获 multiprocessing Queue 为空时引发的 Queue Empty 异常以下不起作用 import multiprocessing f multiprocessing Queue try f get True 0
在 Tensorflow-lite Android 中将位图转换为 ByteBuffer（浮点）

在用于图像分类的tensorflow lite android演示代码中图像首先转换为ByteBuffer格式以获得更好的性能这种从位图到浮点格式的转换以及随后到字节缓冲区的转换似乎是一个昂贵的操作循环按位运算符 float mem
OpenCV Sobel 滤波器 - 为什么它看起来这么糟糕，尤其是与 Gimp 相比？

我正在尝试使用 OpenCV 重建一些我之前在 Gimp 中完成的预处理第一级是用于边缘检测的 Sobel 滤波器它在 Gimp 中运行得很好现在这是我对 OpenCV 的尝试 opencv imgproc Sobel src sca
在 python matplotlib 中用多种颜色填充多边形

我正在使用 matplotlib 绘制多边形补丁并希望表示每个多边形的部分以特定颜色填充即制作一个饼图但形状为三角形正方形或六边形有没有办法改变饼图的形状或表示多边形的多种填充颜色 Thanks 更新这是我的意思的模拟您可以创
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s

随机推荐

Selenium 未填写表单上的密码属性

我有一个非常简单的硒脚本来尝试调试我遇到的问题我所做的就是填写用户名然后填写密码然后检查我输入的密码是否在密码字段中我这样做的原因是我无法让它进行一般身份验证当密码正确时始终会出现密码不正确问题表单 html
ec2:RunInstances 的最低 IAM 策略

我正在尝试缩小运行预定义机器映像的最小策略范围该映像基于两个快照我只想启动 m1 medium 实例类型在此基础上并在以下方面的帮助下这一页 http docs aws amazon com AWSEC2 latest APIRefe
为 ng-bootstrap modal (NgbModal) 编写单元测试 [Angular 6]

我在为应用程序中的确认模式编写单元测试时遇到一些问题这是我想测试的一段代码 confirmModal prompt Are you sure title Confirm Observable
硬盘读取性能问题

我有一个 C 程序它从硬盘读取文件并对文件中的数据进行一些处理我正在使用标准 Win32 API 来读取文件我的问题是这个程序有时速度非常快然后突然减慢到之前速度的 1 6 如果我在多次运行中一次又一次地读取相同的文件那么通常第一
Azure Function V3 无法加载文件或程序集“Microsoft.Extensions.DependencyModel，版本=3.1.6.0”

我们尝试使用 DependencyContext Default RuntimeLibraries 来获取所有项目程序集并将我们想要的类型加载到 ServiceCollection 中此代码在 asp net core Web 应用程序上
如何在 Unix 中交换文件名？

有什么方法可以在不使用临时变量的情况下快速完成此操作有内置函数吗编辑谢谢你们的回答看起来我需要澄清我的问题但在大多数情况下你们假设是正确的有两个文件并且文件名是相反的文件 A 的名称为 B name file 文件 B 的
如何从另一个应用程序访问字符串资源

我有一个应用程序 A 和 B 应用程序假设我在应用程序 A 中有一个字符串资源 lt string name abc gt ABCDEF lt string gt 如何从 B 中的活动访问 abc 的值我尝试了以下方法 try Pack
在 C# 中异步处理项目队列

我正在尝试创建一个处理工作队列的系统该系统具有以下规格该系统有两个组件工作分配器和工作人员同时运行的worker数量有一个设定的上限该上限大于一为了避免同一任务被执行两次的问题只有一个工作分配者您会使用什么设计来创建这样的系
Windows 上 Sublime Text 2 的键盘列选择

我一直在尝试通过 Windows 上的键盘绑定来选择列 The 默认 Windows sublime 键盘映射说 keys ctrl alt up command select lines args forward false keys c
为什么 IEnumerable 会丢失更新的数据？

你能向我解释一下为什么执行以下代码后Selected属性未更新为true The ListItem使用的类型来自System Web UI WebControls命名空间并且是一个类不是结构我相信FirstOrDefault函数返回对实
Android：以编程方式将 apk 复制到 /system/app

我正在尝试从我的 java 代码安装系统应用程序但到目前为止我还没有取得任何成功以下是我到目前为止所做的我的设备已植根我的安装程序应用程序作为系统应用程序安装手动将其复制到 system app 我已经使用平台密钥签署了安装
mediaelement.js - RTMP 支持音频流？

目前是否支持使用本机 HTML5 或 Flash 回退与 MediaElement 通过 RTMP 流式传输音频我看到视频标签 data mejsoptions 属性中使用 flashStreamer 选项看起来像是对视频的支持我知道你
使用 Mockito-core 创建最终类的模拟？

I 在github上找到 https github com relayr android sdk blob master tests src androidTest java io relayr ble service OnBoarding
GWT - 具有简单寻呼机问题的单元格

单元格表分页行为异常检查 GWT 的示例http gwt google com samples Showcase Showcase html CwCellTable http gwt google com samples Showcase
如何在表单寄存器中添加一些文本字段（laravel 生成器 infyom）？

我在这里阅读了教程 http labs infyom com laravelgenerator docs 5 3 installation http labs infyom com laravelgenerator docs 5 3 ins
为什么视频观看速度这么慢？

我在我的应用程序中放置了一个视频视图它工作正常但是当您打开页面时它需要永远加载缓冲无论如何我可以解决这个问题吗我的意思是这是一个3秒视频加载时间应该不会太长正确的 code package jslsoftware co nr
是否可以为命名类型/结构定义相等性？

读完一篇后相关问题 https stackoverflow com questions 20297503 slice as a key in map关于在映射中使用切片我对 Go 中的相等性感到好奇我知道可以覆盖equalsJava 的
检测亮图像和暗图像

我从 stackoverflow 答案中得到了这段代码来检测明亮和黑暗的图像问题是它不起作用我不知道为什么例如如果我打电话 IsDark bitmap 40 0 9 this always sees the image as brig
我可以在 C++ 中嵌套 try-catch 块吗？

我可以嵌套 try catch 块吗例如 void f try Some code try Some code catch ExceptionA a Some specific exception handling Some code c
使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置

我正在尝试建造一个可以通过基本的眼球运动来控制的机器人我将网络摄像头对准我的脸根据我瞳孔的位置机器人会以某种方式移动如果瞳孔位于眼睛的上下左右角机器人将分别向前向后向左向右移动我最初的计划是使用眼哈尔级联来找到我的左

使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置

使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置 的相关文章

随机推荐

热门标签

使用网络摄像头、OpenCV 和 Python 跟踪眼瞳位置的相关文章