如何从图像中仅提取字符？

2024-02-20

我有这种类型的图像，我只想从中提取字符。

二值化后，我得到这个图像

img = cv2.imread('the_image.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 9)

然后找到该图像上的轮廓。

(im2, cnts, _) = cv2.findContours(thresh.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
for contour in cnts[:2000]:
    x, y, w, h = cv2.boundingRect(contour)
    aspect_ratio = h/w
    area = cv2.contourArea(contour)
    cv2.drawContours(img, [contour], -1, (0, 255, 0), 2)

我正进入（状态

我需要一种方法来过滤轮廓，以便它只选择字符。所以我可以找到边界框并提取 roi。

我可以找到轮廓并根据区域的大小对其进行过滤，但源图像的分辨率不一致。这些图像是从移动相机拍摄的。

此外，由于盒子的边界已断开。我无法准确地检测到这些盒子。

Edit:

如果我取消选择长宽比小于 0.4 的框。然后它会在一定程度上发挥作用。但我不知道它是否适用于不同分辨率的图像。

for contour in cnts[:2000]:
    x, y, w, h = cv2.boundingRect(contour)
    aspect_ratio = h/w
    area = cv2.contourArea(contour)

    if aspect_ratio < 0.4:
        continue
    print(aspect_ratio)
    cv2.drawContours(img, [contour], -1, (0, 255, 0), 2)

没那么难...

import cv2

img = cv2.imread('img.jpg')

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('gray', gray)

ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_OTSU)
cv2.imshow('thresh', thresh)

im2, ctrs, hier = cv2.findContours(thresh.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
sorted_ctrs = sorted(ctrs, key=lambda ctr: cv2.boundingRect(ctr)[0])

for i, ctr in enumerate(sorted_ctrs):
    x, y, w, h = cv2.boundingRect(ctr)

    roi = img[y:y + h, x:x + w]

    area = w*h

    if 250 < area < 900:
        rect = cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
        cv2.imshow('rect', rect)

cv2.waitKey(0)

Result

您可以根据需要调整代码（这里可以使用原始图像保存 ROI；为了最终进行 OCR 识别，您必须将它们保存为二进制格式 - 可以使用比按区域排序更好的方法）

Source: 使用 Python 和 OpenCV 从图像中提取 ROI http://cvisiondemy.com/extract-roi-from-image-with-python-and-opencv/以及我的一些知识。

开玩笑，看看我的问题/答案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

imageprocessing

ComputerVision

MNIST

如何从图像中仅提取字符？的相关文章

此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

Tomcat 中的会话管理

我开发了一个简单的 Web 应用程序其中包含 2 个 servlet A 和 B 我对 Tomcat 的网络应用程序的会话管理有一些疑问注意在访问网络应用程序时我在网络浏览器 Chrome 中禁用了 cookie 1 当第一次访问
更改 WordPress 图像 URL

在我的 WordPress 网站上我的所有图像都显示为损坏的链接它们还在 WordPress 后端的媒体库中显示为损坏的链接我使用 Google Chrome 检查了这些图像发现它们都像这样显示 img src http firou
平台 pinvoke 教程 msdn

以下是来自的教程msdn http msdn microsoft com en us library aa288468 28v vs 71 29 aspx 在教程中 flushall 的输出是 Test 但我通过使用 console wri
仅包含与递归差异中给定模式匹配的文件

如何对两个目录 a 和 b 中的文件执行递归比较 diff r a b 但只查看名称与给定模式匹配的文件例如使用 find 命令中可用的相同语法如下所示 diff r a b name crazy 这将显示 a 和 b 中具有相同名称
在 Rails 中的视图之间传递变量

我一直在试图弄清楚如何在两个视图之间传递变量并且我已经查看了堆栈溢出的所有示例但似乎无法使其工作我的用户中有这个 gt index html erb tr td td td td td td td td td td td td tr
如何等待异步委托

在 MVA 视频之一中我看到了下一个构造 static void Main string args Action testAction async gt Console WriteLine In await Task Delay 100
使用多字符分隔符分割字符串

假设我有以下字符串 Hello there My name is Fred I am 25 5 years old 我想把它分成句子这样我就有了以下列表 Hello there My name is Fred I am 25 5 year
Gitlab 部署脚本 - envsubst：找不到命令

我有一个带有 CI CD 管道的 gitlab 存储库它有deploy sh脚本该脚本可以顺利运行直到envsubst命令 bin bash set e lt gt deploy via ssh SSH ssh o UserKnown
在 xml 内的图像上绘制视图

你能帮助我分享你关于如何在android中的图像顶部绘制一个小矩形的知识吗我有 main xml 和一些小部件在顶部有一个图像我想在该图像上绘制一个矩形并在应用程序运行时显示这两个矩形我的 xml 文件如下所示
验证 Rails 中多对多关联的唯一性

说我有Project 即与多对多关联Tag 我在用着有许多通过所以我有单独的连接模型如何创建验证来检查连接模型的唯一性现在我只有 has many tags through gt taggings uniq gt true 但这并不在
MVC 应用程序调试时出错：视图状态 MAC 验证失败

现在开始表单第一次当我开始调试 MVC 应用程序时我收到此错误视图状态 MAC 验证失败如果该应用程序由 Web 托管农场或集群确保配置指定相同的validationKey和validation 算法无法使用自动生成
如何使用 NHibernate 高效地进行 TDD？

在我看来大多数人在使用 NHibernate 时都会针对内存中进程内数据库例如 SQLite 编写测试我已经启动并运行了它但我的第一个测试使用 NHibernate 总是需要 3 4 秒才能执行下一个测试运行得更快我使用 F
是否有 gist.github.com 的内部替代方案可以在防火墙后面运行？

gist github com 非常方便但我希望能够运行类似的东西来与我工作的防火墙后面的其他开发人员在内部共享代码示例因此我不需要一直清理我的代码只讲代码示例有这样的事情存在吗我并不追求大型项目管理工具只是一种制作一次性要点并
OpenShift 无法处理某些 Nodejs 依赖项 (Koa)

我已经结账了如何在 Openshift 中设置 KoaJS https stackoverflow com questions 26924967 how to setup koajs in openshift但它仍然不起作用这是我的一部分
Apache 作为 ubuntu 上的 root

好的我需要运行我的 Apache Web 服务器root 为此我输入了whoami 在终端它给了我输出 root 但是当我通过执行以下 php 脚本检查我的 apache 服务器是否以 root 用户身份运行时它给了我输出 nobod
从终端安装 npm 错误

我正在尝试在我的 mac 中安装节点我收到以下错误我从节点站点下载了节点并运行了该包你们能告诉我为什么我会遇到这个错误当我执行 npm install 时 MacBook Pro Raj npm install npm ERR in
Pickle 无法与 tkinter 一起使用

我正在用 Tkinter 制作一个小游戏它有一个使用 pickle 的保存功能但是当我尝试保存时它会弹出以下消息 Exception in Tkinter callback Traceback most recent call la
具有嵌套列表的 Terraform 动态块

我需要使用 Terraform 在 Pagerduty 中创建升级策略我想动态创建rule块然后在其中target块的值来自rule 我不知道如何在目标块内进行第二次调用以使其动态我有一个列表中的团队列表 locals teams d
React Native - 动态列出/需要目录中的文件

我正在使用 Redux 并希望动态包含目录中的所有文件 redux index js Actions import as authActions from auth authActions import as deviceActions f
如何从图像中仅提取字符？

我有这种类型的图像我只想从中提取字符二值化后我得到这个图像 img cv2 imread the image jpg gray cv2 cvtColor img cv2 COLOR BGR2GRAY thresh cv2 adapti

如何从图像中仅提取字符？

如何从图像中仅提取字符？ 的相关文章

随机推荐

热门标签

如何从图像中仅提取字符？的相关文章