使用 OpenCV 和 Python 查找数独网格

2023-11-25

我正在尝试使用 OpenCV 检测数独谜题中的网格，但我在最后一步中遇到了麻烦（我猜）。

我正在做的是：

对图像进行下采样
Blur it
应用高通滤波器（双边）
使用自适应阈值对图像进行阈值处理
一些膨胀和腐蚀

所有这些给了我以下图像：

从现在开始，我需要检测网格，我找到了一些方法来实现这一点，但没有一个让我有信心足够强大。

第一个是使用霍夫变换查找线条，但我发现了很多虚假线条。

另一种是使用连接组件，这给了我最好的结果。我尝试实现 RANSAC 作为获得正确质心的方法，但我没有得到好的结果，而且还需要一段时间才能得到答案（“一会儿”不到 2 秒，但后来我想在实时视频）。

知道如何做到这一点吗？我的意思是，我怎样才能丢弃错误的质心并开始解决数独？

霍夫变换绝对是正确的选择。事实上，网格检测是介绍该技术时最流行的示例之一（请参阅here and here).

我建议采取以下步骤：

下采样
blur
应用 Canny（您应该从使用的角度很好地猜测网格线的最小/最大可能长度）
膨胀边缘图像（canny 发现网格中分隔符的两个边界作为不同的边缘，膨胀将使这些再次合并）
侵蚀（现在我们的边框太粗了，霍夫会发现太多的线条）
应用霍夫线
合并相似的线

在最后一步，您有多种可能的方法可以选择，这很大程度上取决于您之后想要对结果做什么。例如，您可以使用找到的图像创建一个新的边缘图像，并再次应用侵蚀和霍夫，您可以使用基于傅立叶的东西，或者您可以只是简单地通过一些任意阈值（仅举几个）过滤线条。我实现了最后一个（因为从概念上讲这是最容易做的），这就是我所做的（尽管我完全不确定这是否是最好的方法）：

为 rho 和 theta 值定义任意阈值
检查一条边在另一条边的这些阈值中出现的次数
从最相似的一行开始，我开始删除与其相似的行（这样我们将保留在某种意义上是相似组中“中间”行的行）
其余行是最终候选行

看代码，玩得开心：

import cv2
import numpy as np


filter = False


file_path = ''
img = cv2.imread(file_path)

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray,90,150,apertureSize = 3)
kernel = np.ones((3,3),np.uint8)
edges = cv2.dilate(edges,kernel,iterations = 1)
kernel = np.ones((5,5),np.uint8)
edges = cv2.erode(edges,kernel,iterations = 1)
cv2.imwrite('canny.jpg',edges)

lines = cv2.HoughLines(edges,1,np.pi/180,150)

if not lines.any():
    print('No lines were found')
    exit()

if filter:
    rho_threshold = 15
    theta_threshold = 0.1

    # how many lines are similar to a given one
    similar_lines = {i : [] for i in range(len(lines))}
    for i in range(len(lines)):
        for j in range(len(lines)):
            if i == j:
                continue

            rho_i,theta_i = lines[i][0]
            rho_j,theta_j = lines[j][0]
            if abs(rho_i - rho_j) < rho_threshold and abs(theta_i - theta_j) < theta_threshold:
                similar_lines[i].append(j)

    # ordering the INDECES of the lines by how many are similar to them
    indices = [i for i in range(len(lines))]
    indices.sort(key=lambda x : len(similar_lines[x]))

    # line flags is the base for the filtering
    line_flags = len(lines)*[True]
    for i in range(len(lines) - 1):
        if not line_flags[indices[i]]: # if we already disregarded the ith element in the ordered list then we don't care (we will not delete anything based on it and we will never reconsider using this line again)
            continue

        for j in range(i + 1, len(lines)): # we are only considering those elements that had less similar line
            if not line_flags[indices[j]]: # and only if we have not disregarded them already
                continue

            rho_i,theta_i = lines[indices[i]][0]
            rho_j,theta_j = lines[indices[j]][0]
            if abs(rho_i - rho_j) < rho_threshold and abs(theta_i - theta_j) < theta_threshold:
                line_flags[indices[j]] = False # if it is similar and have not been disregarded yet then drop it now

print('number of Hough lines:', len(lines))

filtered_lines = []

if filter:
    for i in range(len(lines)): # filtering
        if line_flags[i]:
            filtered_lines.append(lines[i])

    print('Number of filtered lines:', len(filtered_lines))
else:
    filtered_lines = lines

for line in filtered_lines:
    rho,theta = line[0]
    a = np.cos(theta)
    b = np.sin(theta)
    x0 = a*rho
    y0 = b*rho
    x1 = int(x0 + 1000*(-b))
    y1 = int(y0 + 1000*(a))
    x2 = int(x0 - 1000*(-b))
    y2 = int(y0 - 1000*(a))

    cv2.line(img,(x1,y1),(x2,y2),(0,0,255),2)

cv2.imwrite('hough.jpg',img)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 OpenCV 和 Python 查找数独网格的相关文章

在Python中，如何将矩阵逆时针旋转90度？

gt gt gt def rotate matrix k List List int For example if I have m 1 2 3 2 3 3 5 4 3 rotate matrix m should give me 3 3
str.translate 与 str.replace - 何时使用哪一个？

何时以及为什么使用前者而不是后者反之亦然目前尚不完全清楚为什么有些人使用前者以及为什么有些人使用后者它们有不同的目的 translate只能用任意字符串替换单个字符但一次调用可以执行多次替换它的参数是一个特殊的表它将单个字符映射
通过 python 中的另外两个修改数组[重复]

这个问题在这里已经有答案了假设我们有三个一维数组 A 长度为 5 B 长度相同示例中为5 C 更长比如长度为 100 C最初用零填充 A给出索引C应更改的元素它们可能会重复以及B给出应添加到初始零的值C 例如如果A 1 3 3
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
如何在Windows中的Python 3.9下pip安装pickle？

我需要pickle https docs python org 3 9 library pickle html module pickle包安装在我的下面Python 3 9在 Windows 10 下我尝试过的当尝试与pip inst
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
Django 多对多关系（类别）

我的目标是向我的 Post 模型添加类别我希望以后能够按不同类别有时是多个类别查询所有帖子模型 py class Category models Model categories 1 red 2 blue 3 black title
设置高亮大括号的 vim 颜色主题

如何更改突出显示大括号的 vim 配色方案我希望实际编辑 vim 主题文件以使更改永久生效问候克雷格匹配括号的自动高亮颜色称为MatchParen 您可以通过执行以下操作来更改 vimrc 中的颜色 highlight MatchP
如何使用网格分割图像并保留透明度边界框

我有一些 png 图像我想将其分成几个部分例如按网格或大小但每个部分应具有与原始图像相同的边界框透明度 Example 将图像分成两部分原来的 200 89 Output 部分 1 png 200 89 第2部分 png 200
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
在 Matlab 中保存 Kinect 深度图像？

通过使用 Kinect 我可以获得深度图像其中每个深度图像像素存储相机和物体之间的距离以毫米为单位现在我想保存它们以便以后使用最好的推荐是什么我正在考虑将深度图像保存为图像 jpg png等然而该值通常是从50毫米到10000
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

我正在尝试通过电子邮件激活用户电子邮件有效编码有效我使用了 django1 11 中的方法该方法运行成功在 Django 1 11 中以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

Bootstrap 3 Glyphicons CDN

注意 Bootstrap 图标又回来了 after 这个拉取请求合并经过过去几周的反复思考我决定将 Glyphicons 图标字体恢复到主存储库考虑到图标在 UI 中的流行程度如果不将它们或其他一些图标字体包含在与 CSS 和
Javafx旋转标签问题

当我尝试将标签旋转 270 度时遇到问题label setRotate 270 但标签文字消失这就是代码示例 LineChart chart new LineChart new CategoryAxis new NumberAxis ch
Visual Studio 自动格式损坏

我在 Windows 7 Build 7100 32 位上运行 Visual Studio 2008 sp1 我以前从未遇到过这个问题即使是在不同的 Windows 7 RC 安装上也是如此当我用结束一个语句时或或其他东西通常VS
Visual Basic，如何读取数据网格中的每一行？

我有一个名为 DataGridView1 的数据网格 A 列包含名称 B 列包含文件路径如何为每一行运行一些代码以这种方式遍历数据网格的正确术语是什么我需要的示例 For each row in DataGridView1 Messa
如何对因素水平进行分组？

我有一个包含足球位置缩写的因子列大约有 17 个唯一值和 220 个观察值我只想拥有包含 17 个唯一值的三个因子级别 levels nfldraft Pos lt list Linemen c C OG OT TE DT DE Sma
如何将 Twitter Bootstrap 工具提示绑定到动态创建的元素？

我正在使用带有 JavaScript 的 Twitter 引导工具提示如下所示 a rel tooltip tooltip 我的标记如下所示 a title Not implemented class btn i class icon f
如何使用 Playground 在 Swift 中读取数据并将其写入文本文件？ [复制]

这个问题在这里已经有答案了我通读了这些SO链接来寻找答案 1 在 Swift 中逐行读取文件 URL 2 从文本文件中读取和写入数据链接 2 为我提供了解决方案但问题是目录默认是当前项目的Document目录所以如果我想从中读取文
XCode 6.3 警告：“myObject”地址不等于空指针的比较始终为 true

更新到 XCode 6 3 后编译器开始发出此警告 Comparison of address of myObject not equal to null pointer is always true 这是我的一段代码挠头但没有找到任
为什么 quarto 的 pdf 输出中没有显示从属关系？

In the yaml of a quarto我有的文件 title Hey author name Birdy Bird affiliations University of Birds University of Hummingbird
用于在 iOS 中扫描条形码（代码 39 格式）的免费 SDK [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我想使用 iphone ipad 的相机扫描 Code 39 格式的 VIN 条形码我尝试了 zxing 和 zbar 但它们效果不佳大多数时候
应用程序未显示在最近使用的应用程序列表中

每当我将以下代码放入活动的清单条目中时我的应用程序永远不会显示在最近使用的应用程序列表中
在 OS X 上调试 MacPorts GCC 的问题

对于使用 GCC 4 7 MacPorts 构建编译的程序我似乎无法获得可读的调试输出我尝试过 GDB 6 3 和 GDB 7 3 每个都有自己的问题尝试使用 GDB 7 3 MacPorts 使用 GDB 7 3 我在启动时得到以下
Spark - 读取带有引号的 csv 文件

我有一个 CSV 文件其中的数据包含在双引号中 0001 A 001 2017 01 01 12 0001 B 002 2017 01 01 13 我只想读取纯数据没有符号 spark read option encoding en
Android Room 一对多关系

我正在尝试建立一对多关系我在线检查了各种文章和教程但所有示例都显示一个表与另一个表具有一对多关系在我的要求中我有两个表与另一个表具有一对多关系检查下图学生表有来自班级和学校表的 FK 大多数示例通过班级学生或学校学生解释一对
此表单不安全自动填充仅在 Chrome 中关闭

I get this error when trying to fill the form from chrome in my website 这是我提交表格后的结果这种情况在任何其他浏览器中都不会发生我需要做什么才能确保表单安全我已
glDrawArrays 与 glDrawElements

好吧我仍然在努力让它发挥作用我的代码的重要部分是 def init self vertices normals triangles self bufferVertices glGenBuffersARB 1 glBindBufferAR
Android：跟踪鼠标指针移动

假设我使用通用鼠标是否可以在android中跟踪鼠标指针的X和Y坐标你需要一个OnGenericMotionListener OnGenericMotion MotionEvent me if me getToolType 0 Moti
如何在Python脚本运行时操作图形？

介绍因为我来自matlab 我习惯了交互式界面其中脚本可以在运行时更新图形在处理过程中每个图形都可以调整大小甚至关闭这可能意味着每个图形都在自己的线程中运行这显然不是这样的绘图库 IPython可以使用magic命令模仿Matl
Laravel 无法在 404 错误页面查看用户是否登录

我创建了一个自定义 404 错误页面并使用 app layout 来包装它但这很奇怪因为当我收到 404 错误页面时即使我已登录也会看到登录和注册链接这是为什么 update 当我登录我的页面并写入不存在的路由时我得到带有扩展
使用 OpenCV 和 Python 查找数独网格

我正在尝试使用 OpenCV 检测数独谜题中的网格但我在最后一步中遇到了麻烦我猜我正在做的是对图像进行下采样 Blur it 应用高通滤波器双边使用自适应阈值对图像进行阈值处理一些膨胀和腐蚀所有这些给了我以下图像从现在开始

使用 OpenCV 和 Python 查找数独网格

使用 OpenCV 和 Python 查找数独网格 的相关文章

随机推荐

热门标签

使用 OpenCV 和 Python 查找数独网格的相关文章