改进文本区域检测（OpenCV、Python）

2024-01-07

我正在开发一个项目，要求我检测图像中的文本区域。这是我到目前为止使用下面的代码实现的结果。

Original Image

Result

代码如下：

import cv2
import numpy as np

# read and scale down image
img = cv2.pyrDown(cv2.imread('C:\\Users\\Work\\Desktop\\test.png', cv2.IMREAD_UNCHANGED))

# threshold image
ret, threshed_img = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY),
                                  127, 255, cv2.THRESH_BINARY)
# find contours and get the external one
image, contours, hier = cv2.findContours(threshed_img, cv2.RETR_TREE,
                                         cv2.CHAIN_APPROX_SIMPLE)

# with each contour, draw boundingRect in green
# a minAreaRect in red and
# a minEnclosingCircle in blue
for c in contours:
    # get the bounding rect
    x, y, w, h = cv2.boundingRect(c)
    # draw a green rectangle to visualize the bounding rect
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), thickness=1, lineType=8, shift=0)

    # get the min area rect
    #rect = cv2.minAreaRect(c)
    #box = cv2.boxPoints(rect)
    # convert all coordinates floating point values to int
    #box = np.int0(box)
    # draw a red 'nghien' rectangle
    #cv2.drawContours(img, [box], 0, (0, 0, 255))

    # finally, get the min enclosing circle
    #(x, y), radius = cv2.minEnclosingCircle(c)
    # convert all values to int
    #center = (int(x), int(y))
    #radius = int(radius)
    # and draw the circle in blue
    #img = cv2.circle(img, center, radius, (255, 0, 0), 2)

print(len(contours))
cv2.drawContours(img, contours, -1, (255, 255, 0), 1)

cv2.namedWindow('contours', 0)
cv2.imshow('contours', img)
while(cv2.waitKey()!=ord('q')):
    continue
cv2.destroyAllWindows()

正如你所看到的，这比我需要的更多。如果您需要更多内容，请查找注释部分。

顺便说一句，我需要的是将每个文本区域绑定在一个矩形中，而不是（靠近）脚本找到的每个字符。过滤单个数字或字母并将所有内容四舍五入到一个框中。

例如，一个框中的第一个序列，另一个框中的第二个序列，依此类推。

我搜索了一下，发现了一些关于“过滤矩形区域”的内容。我不知道这对我的目的是否有用。

还查看了谷歌上的一些第一个结果，但其中大多数效果都不是很好。我想代码需要稍微调整一下，但我是 OpenCV 世界的新手。

使用以下代码解决。

import cv2

# Load the image
img = cv2.imread('image.png')

# convert to grayscale
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# smooth the image to avoid noises
gray = cv2.medianBlur(gray,5)

# Apply adaptive threshold
thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2)
thresh_color = cv2.cvtColor(thresh,cv2.COLOR_GRAY2BGR)

# apply some dilation and erosion to join the gaps - change iteration to detect more or less area's
thresh = cv2.dilate(thresh,None,iterations = 15)
thresh = cv2.erode(thresh,None,iterations = 15)

# Find the contours
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

# For each contour, find the bounding rectangle and draw it
for cnt in contours:
    x,y,w,h = cv2.boundingRect(cnt)
    cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
    cv2.rectangle(thresh_color,(x,y),(x+w,y+h),(0,255,0),2)

# Finally show the image
cv2.imshow('img',img)
cv2.imshow('res',thresh_color)
cv2.waitKey(0)
cv2.destroyAllWindows()

需要修改得到下面结果的参数是迭代次数erode and dilate功能。较低的值将在（几乎）每个数字/字符周围创建更多的边界矩形。

Result

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

ComputerVision

boundingbox

mser

改进文本区域检测（OpenCV、Python）的相关文章

Json.dump 失败并显示“必须是 unicode，而不是 str”TypeError

我有一个 json 文件其中恰好有大量中文和日文以及其他语言字符我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
TCP打孔问题

我尝试使用 Python 3 中概述的原则为防火墙编写一个基本的 TCP 打孔器本文 http www bford info pub net p2pnat index html 不过我无法连接任何东西这是代码 usr bin pytho
Python实时读取串口数据

我正在使用 Python 中的脚本通过串行端口以 2Mbps 的速度从 PIC 微控制器收集数据 PIC 在 2Mbps 下完美定时工作 FTDI USB 串行端口在 2Mbps 下工作也很好均通过示波器验证我每秒发送消息大小约为 1
使用 Matplotlib 的范围绘制图像的 3D 轮廓

正如我所介绍的here https stackoverflow com questions 18792624 fits image input to a range in plot python 在二维中我想知道如何缩放要绘制到绘图中
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
Django“模型”对象不可迭代

我有一张表其中显示了已注册的员工我想根据他们的数据库生成一个简单的 HTML 页面其中包括他们的姓名 id 职称等为此我将一个 id 传递给视图以便它可以获取相应用户的详细信息并向我显示一切正常直到出现错误对象不可迭代下面
self.__dict__.update(**kwargs) 的风格是好是坏？

在 Python 中假设我有一些类 Circle 它继承自 Shape Shape 需要 x 和 y 坐标此外 Circle 需要半径我希望能够通过执行类似的操作来初始化 Circle c Circle x 1 y 5 r 3 Cir
使用 argparse 指定默认文件名，但不使用 --help 打开它们？

假设我有一个对文件执行一些操作的脚本它在命令行上获取此文件的名称但如果未提供则默认为已知文件名 content txt 说与蟒蛇的argparse 我使用以下内容 parser argparse ArgumentParser des
是否可以在 Jupyter 笔记本中显示控制台？

我希望能够使用 Jupyter 笔记本中的控制台在环境中进行摆弄添加额外的单元格意味着我总是必须滚动到最底部或在我想要类似控制台文本字段的任何地方创建新单元格是否可以有一个永久的控制台窗口例如在窗口底部 Thanks 您可以启动连
如何使直方图列的宽度都相同

我在操作直方图时遇到了一些麻烦我有一个包含两列的 df 我将它们绘制为堆叠直方图我将它们放入特定的垃圾箱中请参阅下面的代码但我想在最后制作一个大垃圾箱 4000 10000 但是默认情况下大垃圾箱的列宽很大有没有办法让这个大垃
自适应支付 API 错误 580001

我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
Tkinter 如何根据此组合框自动更新第二个组合框

我在 Tkinter Python 中遇到了组合框更新的问题我有两个组合框组合框A with values A B C and 组合框B 我想要的是当值A在组合框中选择A然后在组合框中B显示值 1 2 3 当值B在组合框中选择A然后在
收到“/：未找到事件。”使用 PyCharm 远程调试器时

当我使用 PyCharm 通过 ssh 进行远程调试时tcsh shell 服务器很多时候它停止工作并显示未找到事件更具体地说我在 pycharm 调试控制台中遇到以下内容 ssh username hostserver 22 p
如何连接多个字符串？ [复制]

这个问题在这里已经有答案了如何将 stringList 中的所有字符串合并为一个而不打印它例如 s joinStrings very hot day returns string print s Veryhotday 感觉有点倒退但是
执行许多插入重复键更新错误：未使用所有参数

所以我一直在尝试使用 python 2 7 15 使用 mysql connector 执行此查询但由于某种原因它似乎不起作用并且总是返回错误并非所有参数都被使用表更新有一个主键即 ID 这是我尝试运行此 SQL 的查询 sql
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
对 Python 列表元素进行分组

我有一个 python 列表如下所示 my list 25 1 0 65 25 3 0 63 25 2 0 62 50 3 0 65 50 2 0 63 50 1 0 62 我想根据以下规则对它们进行排序 1 gt 0 65 0 62 l
Python 对列表中的值求和（如果它存在于另一个列表中）

我有一个列表和一组 a list 1 2 2 1 1 1 b list 1 2 我正在寻找对应 b list 中的项目并将它们从 a list 中的值相加以便输出为 1 3 2 1 我尝试过的 sum 0 for i in a list
设置字符串中单词或字符数的限制

假设我有一个字符串元素列表 wordlist hi what s up home diddle mc doo Oh wise master kakarot hello have a da 我希望列表中的每个元素最多包含 3 个单词或 20
float() 参数必须是字符串或数字，而不是“时间戳”

我无法使 scilearn 与日期时间系列一起工作找到了这篇文章但对我没有帮助 Pandas 类型错误 float 参数必须是字符串或数字 https stackoverflow com questions 41256626 panda

随机推荐

R 绘图标题大写和斜体

我正在尝试使用斜体和大写文本制作标题现在我有这个代码行 main substitute paste italic S aureus 10 6 growth inhibition 知道如何将 6 变成大写吗我们可以尝试 plot 1 ma
Mysql 事件不工作

我通过 phpmyadmin 在我的 mysql 数据库上添加了以下简单的测试事件 CREATE DEFINER root localhost EVENT my event ON SCHEDULE EVERY 1 MINUTE STARTS
根据 Pig 中的数据将关系拆分为不同的输出文件

目前我的数据如下所示 1 A a 1 A b 2 B b 2 B c 3 A a 3 B b 3 C c 我想根据第一列中的数据将它们存储在不同的文件中所以我希望我的输出与此类似 1 out包含 A a A b 2 out包含 B b
如何像 Hive 表分区一样在 Hbase 表中创建分区

我们计划从 CDH3 迁移到 CDH4 作为迁移的一部分我们还计划将 HBASE 引入我们的系统因为它也会更新数据在 CDH3 中我们使用 Hive 作为仓库这里我们遇到了迁移的主要问题 Hive 支持表分区我们的系统有许多不同模
如何将图像的所有像素值转换为一定范围-python

我有一个包含 12 种不同颜色的 RGB 图像但我事先不知道颜色像素值我想转换 0 到 11 之间的所有像素值每个像素值象征原始 RGB 图像的唯一颜色例如所有 230 100 140 转换为 0 0 0 所有 130 90 10
如何以专业、可靠的方式以编程方式发送短信？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于我正在从事的项目我需要以可靠的方式发送短信因为这是一个生产应用程序我遇到的问题是应用程序在云上运行我无法使用短信网关等额外硬件
设置边框样式模板，但允许灵活使用值

我有这个Border style
如何在 Cmdlet 中隐藏参数

我想对用户隐藏 PowerShell Cmdlet 参数在 C 中有什么办法可以做到这一点吗我想在我的代码中使用此参数来触发具有隐藏参数的相同 cmdlet 我使用 PowerShell 2 0 Thanks 在 PowerShell
自动调整面板上呈现的多个表单的大小

我有这个带有面板的表格该表格具有三个面板一个面板是可折叠的充当侧边栏另一个面板位于顶部用于显示标题最后一个面板是通过单击面板一中提供的项目之一打开的表单的占位符现在我想做的是根据面板一的状态调整增大和缩小占位符面板和在面板
Java 9模块，静态是否意味着浅反射？

为了能够更好地判断移植到Java 9时的反射风险我想知道是否浅反射 http mail openjdk java net pipermail jpms spec experts 2016 October 000431 html只要它引用可访
Python：关于变量范围。为什么我不需要将 x 传递给 Y？

考虑下面的代码为什么我不需要将 x 传递给 Y class X def init self self a 1 self b 2 self c 3 class Y def A self print x a x b x c x X y Y y
关闭第二个modal后在一个modal中使用modal，滚动指的是body

我是一名新的前端开发人员我在执行项目时遇到问题我在模态中使用了模态并且它有效我的第一个模式是一个长模式需要滚动才能看到整个内容 a a
自动续订订阅在测试模式下自动续订时是否会发送 SKPaymentTransactionStatePurchased/Restored 交易？

我正在寻找this https stackoverflow com questions 5396348 do auto renewable subscriptions send an skpaymenttransactionstatepur
C# 用字典替换字符串

我有一根绳子我需要对其进行一些替换我有一个Dictionary
LinearLayout：layout_width 与 minWidth

我试图使用特定宽度的布局layout width属性但是当膨胀时布局的宽度取自子级它小于layout width我说这是一个例子
C++从嵌套类方法访问变量

如何从其嵌套类方法访问类属性 class Class1 public int attribute void Method1 class Class2 public void Method2 here I need to access att
Javascript - 从字符串数组访问对象上的嵌套属性

我有一个这样的对象 metadata correlationId b24e9f21 6977 4553 abc7 416f8ed2da2d createdDateTime 2021 06 15T16 46 24 247Z 我有一系列我想要访
R ggmap 等高线图：将 ..level.. 转换为每平方距离面积的事件

使用中的示例ggmap 使用 ggplot2 进行空间可视化作者 David Kahle 和 Hadley Wickham https journal r project org archive 2013 1 kahle wickham
如何使用“rails s puma”通过配置文件运行 Rails puma 服务器

我可以使用以下任一方法在 Rails 中运行 puma 服务器rails s puma要不就puma 根据这个答案 https stackoverflow com a 21218048 2511083 跑步rails s puma使服务器了
改进文本区域检测（OpenCV、Python）

我正在开发一个项目要求我检测图像中的文本区域这是我到目前为止使用下面的代码实现的结果 Original Image Result 代码如下 import cv2 import numpy as np read and scale dow

改进文本区域检测（OpenCV、Python）

改进文本区域检测（OpenCV、Python） 的相关文章

随机推荐

热门标签

改进文本区域检测（OpenCV、Python）的相关文章