如何使用 OpenCV 检测图像帧中的对象？

2024-05-05

我正在使用 Raspberry Pi 开发一个漫游器，它将清扫房间并捡起掉落在地上的物体。为了检测物体，我使用了在流动站操作开始时拍摄的参考图像，以及每 10 秒单击一次的图像（新图像）。为了确定图像帧是否发生变化，我在参考图像和新图像之间进行了图像减法。如果发现任何差异，它会在其周围绘制轮廓，如果轮廓面积大于某个阈值（警告步骤），则得出存在对象的结论。

我正在使用以下代码 -

import numpy as np
import cv2,time

img=cv2.imread("object1.jpg")
img1=cv2.imread("object2.jpg")
sub=cv2.subtract(img,img1)

gray=cv2.cvtColor(sub,cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray,(3,3),0)
_, contours, _= cv2.findContours(blur,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
c=max(contours,key=cv2.contourArea)
print(cv2.contourArea(c))

if cv2.contourArea>20000:
   print("Object detected !")

上面的代码仅使用 2 个图像来计算它们的差异并确定是否存在对象。请注意，我没有在这里发布我将在我的项目中使用的原始代码。

现在，上面的代码适用于非常受控的情况，例如，当图像背景非常恒定或其中不存在阴影时。但考虑到流动站将在房间内移动，即使框架中没有真实物体，照明变化也有可能触发错误的物体检测。这种差异可能是由于阴影效果的错误轮廓而引发的。

我想知道是否有其他方法可以在不进行前景/背景图像减法的情况下实现此对象检测。我还考虑过使用超声波传感器来检测物体的存在，但这不是一个非常可靠的选择。我更喜欢基于图像处理的解决方案。

谢谢。

=================================================== =======================

EDIT 1 -

所以，我决定稍微改变一下算法。我对前景和背景图像都进行了阈值处理，然后在二进制图像之间执行absdiff，以获得任何帧变化（对象）。代码如下——

import numpy as np
import cv2,time

img1=cv2.imread("back.jpeg")
blur1 = cv2.GaussianBlur(img1,(5,5),0)
gray1=cv2.cvtColor(blur1,cv2.COLOR_BGR2GRAY)
ret,thresh1 = cv2.threshold(gray1,65,255,cv2.THRESH_BINARY_INV)

img2=cv2.imread("front.jpeg")
blur2 = cv2.GaussianBlur(img2,(5,5),0)
gray2=cv2.cvtColor(blur2,cv2.COLOR_BGR2GRAY)
ret,thresh2 = cv2.threshold(gray2,65,255,cv2.THRESH_BINARY_INV)

diff=cv2.absdiff(thresh2,thresh1)
diff=cv2.bitwise_xor(diff,thresh1)

kernel = np.ones((2,2),np.uint8)
diff=cv2.erode(diff,kernel,iterations = 1)
diff=cv2.dilate(diff,kernel,iterations = 8)

_, contours, _= cv2.findContours(diff,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
c=max(contours,key=cv2.contourArea)
x,y,w,h = cv2.boundingRect(c)
cv2.rectangle(diff,(x,y),(x+w,y+h),(125,125,125),2)


cv2.imshow("thresh",diff)
cv2.waitKey(0)

“absdiff”之后是 Erosion 和 Dilation 。之后，我找到最大的轮廓并确定是否存在物体。算法中使用的图像如下 -

背景图 -背景图 https://i.stack.imgur.com/3uRGM.jpg
前景图像 -前景图像 https://i.stack.imgur.com/fC8xG.jpg
前景阈值 -前景阈值图像 https://i.stack.imgur.com/OmW5k.png
背景阈值 -背景阈值图像 https://i.stack.imgur.com/ogQ3w.png
差异图像 -具有轮廓及其边界的最终图像。 https://i.stack.imgur.com/iYA9r.png

正如您所看到的，检测工作正常。我几乎没有用来测试算法的其他前景图像。他们给出了令人满意的结果。我想知道是否有其他方法可以以更高的效率达到相同的结果。

PS-所有前景图像都是在闪光灯打开的情况下拍摄的。我尝试过关闭闪光灯，但图像中似乎存在很多噪点。

=================================================== ===========

EDIT 2-

使用其他图片的算法的性能 -

注意：- 背景图像保持不变。

对象 1 -前景图像 1 https://i.stack.imgur.com/pzupl.jpg
对象 1 检测 -前景图像 1 结果 https://i.stack.imgur.com/3KMxm.png

我怀疑这个问题是否像您在问题中描述的那么简单，当我们进入现实世界场景时，它会变得非常复杂。

但无论如何，假设你的小物体只出现在房间里，那么你可以通过识别来识别它们连接的组件在捕获的二值图像中，并根据它们的相对像素大小选择它们。

下面是相同的 Python 实现：

img = cv2.imread('D:/Image/objects.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# binarize the image
ret, bw = cv2.threshold(gray, 128, 255, 
cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)

# find connected components
connectivity = 4
nb_components, output, stats, centroids = 
cv2.connectedComponentsWithStats(bw, connectivity, cv2.CV_32S)
sizes = stats[1:, -1]; nb_components = nb_components - 1
min_size = 250 #threshhold value for objects in scene
img2 = np.zeros((img.shape), np.uint8)
for i in range(0, nb_components+1):
    # use if sizes[i] >= min_size: to identify your objects
    color = np.random.randint(255,size=3)
    # draw the bounding rectangele around each object
    cv2.rectangle(img2, (stats[i][0],stats[i][1]),(stats[i][0]+stats[i][2],stats[i][1]+stats[i][3]), (0,255,0), 2)
    img2[output == i + 1] = color

包含对象的图像：

使用连接组件标签检测到的对象：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 OpenCV 检测图像帧中的对象？的相关文章

Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
import matplotlib.pyplot 给出 AttributeError: 'NoneType' 对象没有属性 'is_interactive'

我尝试在 Pycharm 控制台中导入 matplotlib pyplt import matplotlib pyplot as plt 然后作为回报我得到 Traceback most recent call last File D Pr
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
如何应用一个函数 n 次？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案假设我有一个函数它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以

随机推荐

JVM 是否会内联对象的实例变量和方法？

假设我有一个非常紧密的内部循环每次迭代都会访问和改变一个簿记对象该对象存储有关算法的一些简单数据并具有用于操作它的简单逻辑簿记对象是私有的和最终的并且它的所有方法都是私有的最终的和 inline 下面是一个示例 Scala 语法
使用java服务中的Zxing库从单个图像文件中读取多个条形码

您好我已经创建了一个java服务用于从此处的图像中读取条形码我使用Zxing库来解码此处的文本挑战是如果一个带有单个条形码的文件工作正常如果有多个条形码它会产生不相关的结果我在下面给出了我的代码 pom xml
dataframe KeyError，尽管它存在

鉴于数据 rows x 1 y 2 z 3 x 2 y 2 z 3 如果我尝试构建这样的数据框 frame pd DataFrame from records rows index x 效果很好然而这 frame pd DataFram
如何在 Selenium 中定位具有特定文本的跨度？（使用Java）

我在使用 java 查找 Selenium 中的 span 元素时遇到问题 HTML 看起来像 div class settings padding span Settings span div 我尝试了以下方法但没有成功 By xpath
将 $lookup 结果合并到现有数组

我是 mongo 新手我需要你的帮助我有收藏学习计划这是示例文档 id dGFY garranti typ sk garant en Chairman of study board id 1025769 typ sk predseda
Bootstrap 3 网格，一行中有多少列“真的”重要吗？

我有一个表单布局上面有 Bootstrap 3 表单组我希望这些表单组在我显然让它工作得很好但是在这里阅读了一些内容后我所做的似乎违反了假设的规则即一行中的每一列加起来必须等于 12 但是我能找到的每个教程和文档总是使用诸如应
尝试将过滤器添加到 Grizzly+Jersey 应用程序时出现问题

我有这个服务器初始化类 package magic app main import org glassfish grizzly http server HttpServer import org glassfish jersey grizz
在 Objective-C 中从异步块增加变量

我在 Objective C 中开发的服务遇到了一些难题该服务的目的是解析核心数据实体列表并为每个对象下载相应的图像文件该服务的原始设计因太多同时下载请求而阻塞了我的网络服务器为了解决这个问题我将负责执行下载请求的代码移至递归方法中
按组保留行，直到列中值第一次出现为止。不允许存在值的组

我有一个像这样的数据框 gt df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a 我想保留每个组 id 的所有行直到类型列中第一次出现值 b 为止
如何防止双斜杠被编码？

我正在发出类似于以下内容的 get 请求 https endpoint com path to what want param value https endpoint com path to what want param value 我
Windows Phone 7 浏览器 - 单击链接时关闭灰色阴影

使用 Windows Phone 7 浏览器当用户单击链接时该链接会显示一个灰色矩形阴影大约 0 5 秒一般来说这很好但是如果您有动态页面行为例如单击链接会更新 DOM 以便该链接不再可见则在链接本身消失后不透明的灰色矩
JavaScript：字符串连接性能低下？ Array.join('')?

我读过如果我有一个for循环我不应该使用字符串连接因为它很慢例如 for i 0 i lt 10000000 i str a 相反我应该使用Array join 因为它更快 var tmp for i 0 i lt 10000000
在 Visual Studio 2010 DBML 设计器 (MS SQL/ASP.NET MVC) 中默认设置 UpdateCheck.Never 模式

在我的网络应用程序中我做了很多更新因此除主键之外的所有列唯一可接受的 UpdateCheck 模式是 NEVER 但不幸的是 DBML 设计器自动设置 ALWAYS 模式因此我必须手动更改数十列并且当我必须更新 DBML 文件时
GIT Rebase 对多个 0.5GB 二进制文件致命

这个问题本质上是重新开rebase 期间 git 崩溃 https stackoverflow com q 7692944 1286639从来没有答案我正在尝试从我的 secc 分支进行变基 git rebase main First r
int 到 long 赋值

我一直在尝试这个 int 和 long 转换我尝试分配一个int变量为along多变的代码如下 public static void main String args int i 1024 long j i long k i i i i
如何使用 cURL（或任何命令行工具）通过 OAuth 身份验证将 HTTP Post 发送到 Twitter？

我希望使用命令行应用程序例如cURL http en wikipedia org wiki CURL cURL 在我的测试 Twitter 帐户上发布一些测试帖子我也希望通过 OAuth 身份验证来做到这一点我怎样才能做到这一点假设
Azure 存储上的连接池

我开始使用 Azure 存储将文件保存到应用程序上的 blob 由于我的应用程序可能访问不同存储上的不同容器我想知道如何实现一个可以优化资源的连接池我想保持对不同容器的连接打开而不是每次尝试下载 blob 时都打开连接谁能为我提供实
R：函数中使用的 ggplot2 未反映字体大小变量的变化

我经常需要将多个不同大小的相同 ggplot2 图表输出到 png 文件通过使用输出高度和宽度以像素为单位的变量可以轻松生成每个 png 文件的大小对于 ggplot2 部分我使用字体大小和某些其他元素的变量并设置一个简单的循
从网站保存嵌入的 pdf

我正在编写一个小型 C 应用程序来管理供应商提供的化学品安全数据表目前我手动搜索该化学品并保存 pdf 并在我的程序中添加指向 pdf 的链接问题是我还有很多化学品需要处理所以最好将过程自动化例如化学品的部件号如下 2710
如何使用 OpenCV 检测图像帧中的对象？

我正在使用 Raspberry Pi 开发一个漫游器它将清扫房间并捡起掉落在地上的物体为了检测物体我使用了在流动站操作开始时拍摄的参考图像以及每 10 秒单击一次的图像新图像为了确定图像帧是否发生变化我在参考图像和新图像之间进

如何使用 OpenCV 检测图像帧中的对象？

如何使用 OpenCV 检测图像帧中的对象？ 的相关文章

随机推荐

热门标签

如何使用 OpenCV 检测图像帧中的对象？的相关文章