查找彼此接近的对象边界

2024-05-06

我正在研究一个计算机视觉问题，其中问题的第一步是找到物体彼此靠近的位置。例如，在下图中，我感兴趣的是找到灰色标记的区域。

Input :

Output :

我目前的方法是首先反转图像，然后通过侵蚀进行形态梯度跟随，然后删除一些不感兴趣的轮廓。脚本如下：

img = cv2.imread('mask.jpg', 0)
img = (255 - img)

kernel = np.ones((11,11), np.uint8) 
gradient = cv2.morphologyEx(img, cv2.MORPH_GRADIENT, kernel)

kernel = np.ones((5,5), np.uint8) 
img_erosion = cv2.erode(gradient, kernel, iterations=3) 

img_erosion[img_erosion > 200] = 255
img_erosion[img_erosion <= 200] = 0

def get_contours(mask):
    contours, hierarchy = cv2.findContours(mask,cv2.RETR_TREE,cv2.cv2.CHAIN_APPROX_NONE)
    return contours

cnts = get_contours(img_erosion)

img_new = np.zeros_like(img_erosion)
img_h, img_w = img_erosion.shape
for i in cnts:
    if cv2.contourArea(i) > 30:
        print(cv2.boundingRect(i), cv2.contourArea(i))
        x, y, h, w = cv2.boundingRect(i)
        if h/w > 5 or w/h > 5 or cv2.contourArea(i) > 100:  ## Should be elongated 
            if (x - 10 > 0) and (y - 10 > 0): ## Check if near top or left edge
                if (img_w - x > 10) and (img_h - y > 10): ## Check if near bottom or right edge

                    cv2.drawContours(img_new, [i], -1, (255,255,255), 2)
kernel = np.ones((3,3), np.uint8) 
img_new = cv2.dilate(img_new, kernel, iterations=2)
plt.figure(figsize=(6,6))
plt.imshow(img_new)

结果是：

但是，使用这种方法，我需要调整许多参数，并且在许多情况下，当方向不同或边缘稍远，或者“L”形边缘等时，它会失败。

我是图像处理新手，有其他方法可以帮助我有效地解决此任务吗？

编辑：附加一些更多图像

（主要是矩形多边形，但大小和相对位置有很多变化）

The best做到这一点的方法可能是通过笔画宽度变换 https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/1509.pdf。这不在 OpenCV 中，尽管它在其他一些库中，并且您可以在互联网上找到一些实现。笔划宽度变换查找图像中每个像素的最近边缘之间的最小宽度。请看论文中的下图：

对该图像进行阈值处理可以告诉您哪里有相隔一小段距离的边缘。例如，所有值

因此，正如可能清楚的那样，这非常接近您想要的答案。这里会有一些额外的噪音，就像你还会得到形状边缘的方形脊之间的值一样......你必须过滤掉或平滑掉这些值（轮廓近似是一种简单的方法）例如，将它们作为预处理步骤进行清理）。

然而，虽然我确实编写了一个 SWT 原型，但它并不是一个很好的实现，而且我还没有真正测试过它（实际上已经忘记了它几个月了......也许一年），所以我'我现在不打算把它放出来。但是，我确实有另一个想法，它更简单一些，并且不需要阅读研究论文。

您的输入图像中有多个斑点。想象一下，如果您将每个斑点单独放在自己的图像中，并且将每个斑点按您愿意在它们之间放置的距离增加。如果将每个斑点增大 10 像素，并且它们重叠，那么它们彼此之间的距离将在 20 像素以内。然而，这并没有给我们完整的重叠区域，只是两个区域的一部分expanded斑点重叠。一种不同但相似的衡量方法是，如果斑点增长 10 个像素并重叠，并且在扩展之前与原始斑点重叠，则这两个斑点彼此的距离在 10 像素以内。我们将使用第二个定义来查找附近的斑点。

def find_connection_paths(binimg, distance):

    h, w = binimg.shape[:2]
    overlap = np.zeros((h, w), dtype=np.int32)
    overlap_mask = np.zeros((h, w), dtype=np.uint8)
    kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (distance, distance))

    # grows the blobs by `distance` and sums to get overlaps
    nlabels, labeled = cv2.connectedComponents(binimg, connectivity=8)
    for label in range(1, nlabels):
        mask = 255 * np.uint8(labeled == label)
        overlap += cv2.dilate(mask, kernel, iterations=1) // 255
    overlap = np.uint8(overlap > 1)

    # for each overlap, does the overlap touch the original blob?
    noverlaps, overlap_components = cv2.connectedComponents(overlap, connectivity=8)
    for label in range(1, noverlaps):
        mask = 255 * np.uint8(overlap_components == label)
        if np.any(cv2.bitwise_and(binimg, mask)):
            overlap_mask = cv2.bitwise_or(overlap_mask, mask)
    return overlap_mask

现在输出并不完美——当我扩展斑点时，我用一个圆圈（膨胀内核）将它们向外扩展，因此连接区域并不是非常清晰。然而，这是确保它适用于任何方向的事物的最佳方法。您可以将其过滤掉/剪辑下来。一个简单的方法是获取每个连接块（以蓝色显示），并重复将其侵蚀一个像素，直到它doesn't与原始斑点重叠。其实没问题，我们补充一下：

def find_connection_paths(binimg, distance):

    h, w = binimg.shape[:2]
    overlap = np.zeros((h, w), dtype=np.int32)
    overlap_mask = np.zeros((h, w), dtype=np.uint8)
    overlap_min_mask = np.zeros((h, w), dtype=np.uint8)
    kernel_dilate = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (distance, distance))

    # grows the blobs by `distance` and sums to get overlaps
    nlabels, labeled = cv2.connectedComponents(binimg)
    for label in range(1, nlabels):
        mask = 255 * np.uint8(labeled == label)
        overlap += cv2.dilate(mask, kernel_dilate, iterations=1) // 255
    overlap = np.uint8(overlap > 1)

    # for each overlap, does the overlap touch the original blob?
    noverlaps, overlap_components = cv2.connectedComponents(overlap)
    for label in range(1, noverlaps):
        mask = 255 * np.uint8(overlap_components == label)
        if np.any(cv2.bitwise_and(binimg, mask)):
            overlap_mask = cv2.bitwise_or(overlap_mask, mask)

    # for each overlap, shrink until it doesn't touch the original blob
    kernel_erode = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
    noverlaps, overlap_components = cv2.connectedComponents(overlap_mask)
    for label in range(1, noverlaps):
        mask = 255 * np.uint8(overlap_components == label)
        while np.any(cv2.bitwise_and(binimg, mask)):
            mask = cv2.erode(mask, kernel_erode, iterations=1)
        overlap_min_mask = cv2.bitwise_or(overlap_min_mask, mask)

    return overlap_min_mask

当然，如果您仍然希望它们更大或更小一点，您可以对它们做任何您喜欢的事情，但这看起来非常接近您要求的输出，所以我将其留在那里。另外，如果你想知道，我不知道右上角的斑点去了哪里。稍后我可以再看一遍这最后一篇文章。请注意，最后两个步骤可以合并；检查是否有重叠，如果有，酷——将其缩小并存放在掩模中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

查找彼此接近的对象边界的相关文章

为什么 Python 在导入脚本时只保存脚本的字节码？

既然执行Python字节码会比运行原始源代码更快因为Python不需要重新编译为什么Python在导入脚本时只保存编译后的字节码呢为每个执行的脚本保存 pyc 文件不是更好吗无论如何 Python 解释器的启动时间都需要时间即使您
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
在 Visual Studio C++ 2008 中包含 dll

有没有办法将 dll 包含在项目中这样我就不必在编译后将这些 dll 与可执行文件放在同一文件夹中这样我就可以用它们编译我的项目这是否有可能如果是有人可以指导我我的项目是一个 opencv 项目有很多 dll 我必须包含在文件
为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发

随机推荐

以静默方式安装应用程序，并授予 INSTALL_PACKAGES 权限

我正在尝试将 apk 静默安装到系统中我的应用程序位于 system app 并成功授予权限 android permission INSTALL PACKAGES 但是我在任何地方都找不到如何使用此权限我尝试将文件复制到 data a
UITextView 格线背景但行高错误

我有一个 UITextView 用户可以在其中创建注释并保存到 plist 文件中我希望能够像普通笔记本一样显示线条我遇到的问题是文本无法正确对齐下图很好地解释了这个问题 This is the background I use t
Google 脚本图表默认排除标题

使用以下脚本 function chartCreation var ss SpreadsheetApp getActive var sheet ss getSheetByName Sheet1 var chart sheet newChar
IBM.EntityFrameworkCore - 未调用 DbContext.OnConfiguring 和 DbContext.OnModelCreating

一旦我解决了一期 https stackoverflow com questions 45782871 net standard 2 0 entityframeworkcore db2 ibm entityframeworkcore iss
Google Apps 脚本无法从托管的 GAS 转换为特定的云项目

我有一个 GAS 管理的项目我想将其转换为特定的谷歌标准云项目我有身份证我将其输入到资源云托管项目中然后得到项目不存在或者您需要对其进行编辑访问它确实存在并且我拥有权限因为我是所有者该错误有些误导性我花了一段时间才弄
通过相同的 Makefile 生成 Makefile 的包含文件

在我的程序中我有一个有点复杂的构建过程目前在我使用的一个目录中include in Makefile am对于一个文件该文件不存在但必须自行构建原因是这个包含文件相当长此外在实际程序中它不仅仅是一个文件而是多个文件并且
JBoss 7.2 版本使用什么日志记录？

java 中可以使用多种日志记录变体最流行的是 log4j 和 JDK 日志记录我想知道 JBoss Application Server 7 2 版本默认使用什么日志记录通过查看模块或配置文件很难找到所使用的记录器如果有人可以在这
在什么情况下会在快速测试中使用expectationForNotification

我有点困惑什么什么时候做expectationForNotification as opposed to期望与描述我无法在 swift 中找到任何明确的示例来说明您何时以及如何处理此调用我假设它可能是为了测试通知但看起来它可能只是整
文件 ReadAllLines 将外语变成乱码 (�)

我正在创建一个工具来替换文本文件中的某些文本我的问题是 File ReadAllLines 将希伯来字符变成乱码奇怪的问号有谁知道为什么会发生这种情况请注意我在游戏等中确实遇到希伯来语问题在记事本中我无法保存希伯来语文档我可
使用文件名将文件一个文件夹复制到 Google 云端硬盘中的另一个文件夹

我的谷歌云端硬盘帐户中有两个文件夹文件夹 1 和文件夹 2 文件夹1 内有多个文件假设有一个文件名Test txt我想复制Test txt使用 Driveapp 将文件保存到文件夹 2 我找到了代码但它仅适用于文件唯一 ID 我
在linux x86平台上学习ARM所需的工具[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 x86 linux 机器在阅读一些关于 ARM 的各种信息时我很好奇现在我想花一些时间学
从服务定期更新 AppWidget

这就是我想要从我的 AppWidget 中得到的当小部件添加到屏幕时配置活动就会出现到目前为止还不错保存配置后将启动一个更新小部件的服务到目前为止一切顺利定期安排警报以运行更新小部件的服务这里遇到麻烦了这已经严重让我的头发
崩溃的 Visual Studio Live 单元测试

我是新用户堆栈溢出这是我的问题作为我工作的一部分我们最近安装了 VS 2017 企业版一切都很好直到几周前实时单元测试模块停止工作有谁能够解决此类问题吗这是输出控制台 17 26 23 170 Info Live Unit Te
为什么我可以在 Ruby 中使用 Object#send 访问私有/受保护的方法？

班上 class A private def foo puts foo end public def bar puts bar end private def zim puts zim end protected def dib puts
Django：生成 CSV 文件并将其存储到 FileField 中

在我的 Django 视图文件中我需要从元组列表生成 CSV 文件并将 CSV 文件存储到模型的 FileField 中 class Bill models Model billId models IntegerField bill m
如何在IntelliJ中快速输入记录器定义？

是否有一些实时模板或其他东西可以将记录器定义添加到类中在 Eclipse 中我有一个模板 private static final Logger log LoggerFactory getLogger enclosing type cla
将元素追加到 Angular QueryList

有没有办法将新元素追加到 QueryList 中例如我有一个像这样的查询列表 ContentChildren SysColumn syscolumns QueryList
Ruby 枚举器链接

在这个例子中 1 2 3 each with index map i j i j gt 0 2 6 我的理解是既然each with index枚举器链接到map map表现得像each with index通过在块内传递索引并返回一个
Adobe Reader 命令行参考

有没有official不同版本的命令行开关参考Adobe 以前称为 Acrobat Reader 我没有找到任何东西Adobe 开发人员连接 http www adobe com devnet 我特别想启动 Reader 并打开文件
查找彼此接近的对象边界

我正在研究一个计算机视觉问题其中问题的第一步是找到物体彼此靠近的位置例如在下图中我感兴趣的是找到灰色标记的区域 Input Output 我目前的方法是首先反转图像然后通过侵蚀进行形态梯度跟随然后删除一些不感兴趣的轮廓脚本如下

查找彼此接近的对象边界

查找彼此接近的对象边界 的相关文章

随机推荐

热门标签

查找彼此接近的对象边界的相关文章