使用 Python 删除字母图像中的残留物

2023-12-31

我有一组图像，代表从单词图像中提取的字母。在某些图像中，有相邻字母的残留物，我想消除它们，但我不知道如何消除。

一些样品

我正在使用 openCV，我尝试了两种方法，但都不起作用。

使用 findContours：

def is_contour_bad(c):
    return len(c) < 50

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
edged = cv2.Canny(gray, 50, 100)

contours = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
contours = contours[0] if imutils.is_cv2() else contours[1]

mask = np.ones(image.shape[:2], dtype="uint8") * 255

for c in contours:
    # if the c  ontour is bad, draw it on the mask
    if is_contour_bad(c):
        cv2.drawContours(mask, [c], -1, 0, -1)

# remove the contours from the image and show the resulting images
image = cv2.bitwise_and(image, image, mask=mask)
cv2.imshow("After", image)
cv2.waitKey(0)

我认为它不起作用，因为图像位于边缘 cv2.drawContours 无法正确计算面积并且没有消除内部点

使用connectedComponentsWithStats：

cv2.imshow("Image", img)
cv2.waitKey(0)
nb_components, output, stats, centroids = cv2.connectedComponentsWithStats(img)
sizes = stats[1:, -1];
nb_components = nb_components - 1

min_size = 150

img2 = np.zeros((output.shape))
for i in range(0, nb_components):
    if sizes[i] >= min_size:
        img2[output == i + 1] = 255

cv2.imshow("After", img2)
cv2.waitKey(0)

在这种情况下，我不知道为什么侧面的小元素不将它们识别为连接的组件

嗯..我将非常感谢任何帮助！

在问题的一开始你就提到了字母已从单词图像中提取出来.

所以我认为，您可以正确地完成提取。那么你就不会遇到这样的问题了。我可以为您提供一个解决方案，适用于从原始图像中提取字母或从您给出的图像中提取并分离字母。

解决方案：

您可以使用convex hull像这样分隔字符的坐标。

code:

import cv2
import numpy as np

img = cv2.imread('test.png', 0)
cv2.bitwise_not(img,img)
img2 = img.copy()

ret, threshed_img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
image, contours, hier = cv2.findContours(threshed_img, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)

#--- Black image to be used to draw individual convex hull ---
black = np.zeros_like(img)
contours = sorted(contours, key=lambda ctr: cv2.boundingRect(ctr)[0])

for cnt in contours:
    hull = cv2.convexHull(cnt)

    img3 = img.copy()
    black2 = black.copy()

    #--- Here is where I am filling the contour after finding the convex hull ---
    cv2.drawContours(black2, [hull], -1, (255, 255, 255), -1)
    r, t2 = cv2.threshold(black2, 127, 255, cv2.THRESH_BINARY)
    masked = cv2.bitwise_and(img2, img2, mask = t2)
    cv2.imshow("masked.jpg", masked)
    cv2.waitKey(0)

cv2.destroyAllWindows()

outputs:

因此，正如我所建议的，更好的办法是在从原始图像中提取字符时使用此解决方案，而不是在提取后去除噪声。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

imageprocessing

opencv

outliers

使用 Python 删除字母图像中的残留物的相关文章

键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
jpegtran 优化而不更改文件名

我需要优化一些图像但不更改它们的名称 jpegtran copy none optimize image jpg gt image jpg 但是这似乎创建了 0 的文件大小当我对不同的文件名执行此操作时大小仍然完全相同怎么样 jp
使用 MPI 的 Allreduce 对 Python 对象求和

我正在使用使用 Python 中的字典和计数器构建的稀疏张量数组操作我想让并行使用这个数组操作成为可能最重要的是我最终在每个节点上都有计数器我想使用 MPI Allreduce 或另一个不错的解决方案将其添加在一起例如使用计数
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

在未安装 Tensorflow 的情况下运行 Tensorflow 模型

我有一个运行良好的 TF 模型是用 Python 和 TFlearn 构建的有没有办法在另一个系统上运行这个模型而不需要安装 Tensorflow 它已经经过预先训练所以我只需要通过它运行数据即可我知道 tfcompile 在这里发
QLineEdit python 方式大写输入

我使用 QT Designer 绘制了一个 UI 但发现没有参数可供我将 QLineEdit 输入设置为大写经过一些在线搜索后我只看到了极少数满足我需求的结果但所有结果都是用 Qt 编写的例如这个link http www qtf
Spring Initializr 项目导致不支持的类文件主要版本 64

当我使用创建一个新项目时弹簧初始化 https start spring io Gradle 不会构建该项目我使用 IntelliJ IDEA 错误信息是 Exception is org gradle cache CacheOpenEx
从 Scipy 稀疏矩阵中获取唯一行

我正在 python 中处理稀疏矩阵我想知道是否有一种有效的方法来删除稀疏矩阵中的重复行并且只保留唯一的行我没有找到与之相关的函数并且不知道如何在不将稀疏矩阵转换为密集矩阵并使用 numpy unique 的情况下执行此操作没有快
执行许多数据帧连接时出现 PySpark OutOfMemoryErrors

关于这个问题的帖子很多但没有一个回答我的问题我遇到了OutOfMemoryError在 PySpark 中尝试将许多不同的数据帧连接在一起我的本地机器有 16GB 内存我的 Spark 配置如下 class SparkRawCons
一次更改 pandas DataFrame 的多列中的某些值

假设我有以下数据框 In 1 df Out 1 apple banana cherry 0 0 3 good 1 1 4 bad 2 2 5 good 这按预期工作 In 2 df apple df cherry bad np nan In
Spring Batch：组装作业而不是配置它（可扩展作业配置）

背景我正在设计一个文件读取层它可以读取分隔文件并将其加载到List 我决定使用 Spring Batch 因为它提供了许多可扩展性选项我可以根据文件的大小将其用于不同的文件集要求我想设计一个通用的作业 API 可用于读取任何分隔文
为什么 Ruby 中的方法内部不能有类？

我可以在函数体内创建 Ruby 类吗我似乎收到错误告诉我这是不允许的但我认为应该是这样因为这里的类太对象了 class A def method class B end end end 这会失败并出现错误方法体内的类定义如果我们
浮点模*完全*“错误”

我的意思不是一个微小的精度误差 https stackoverflow com q 588004 12671057 我的意思是一个完全地对于看似无害的计算结果为错误 expected 1 7306687640440686 got 0 0
回滚时实体框架 InvalidOperationException

我正在将我的 Windows 应用程序与 nopcommerce 集成因此当我从 nopcommerce 注册客户时所有信息都应保存到新表中Customer我的 Windows 应用程序为此我在表上插入后创建了触发器Generic
如果从锚链接重定向，Rails 不会重新加载本地 JavaScript

我有一个foo js from FoosController 如果我输入 localhost 3000 foos 那么 jquery onready 函数将被加载但是如果我点击 a href foos or link to jquery
如何在 eclipse 中的 tomcat 上部署 Maven 项目严重：启动时子容器失败 java.util.concurrent.ExecutionException

我在获取从 svn 存储库中拉取的 Maven 项目以将其部署到 Eclipse 中的 Tomcat 服务器上时遇到问题我对整个过程很陌生并且一整天都在努力让它发挥作用我不确定此时问题是什么任何方向将不胜感激这是服务器的控制台输出
C# 如果项目不在数组中

我有一个包含这 3 项的数组 string departmentArray Warranty Service Representative Warranty Service Administrative Manager Warranty a
在Android中设置TextView跨度的颜色

是否可以设置 TextView 中文本范围的颜色我想做一些类似于 Twitter 应用程序的事情其中文本的一部分是蓝色的见下图 source twimg com https g twimg com blog s1600 ss loc
为什么浮点上的简单数学运算会在 VB.Net 和 Python 中返回意外（不准确）的结果？ [复制]

这个问题在这里已经有答案了 x 4 2 0 1 vb net 给出4 1000000000000005蟒蛇给出4 1000000000000005 Excel 给出4 1 谷歌计算 http www google com search q
有没有 Visual Studio 2008 运行时版本的摘要？

我一直在研究一个奇怪的问题即在某些系统上加载我们的应用程序的 dll 之一失败使用全局标志加载器快照标志显示它位于 LoadLibraryEx 中的某处 Windbg中的日志显示似乎有几个不同的版本MSVCR90 DLL被引用我们的清
获取 CXF 客户端的端点以实现 ws-security

我正在写一个 CXF 客户端现在我必须集成安全性我从 wsdl2java 生成这些类 MyService MyServiceProxy MyServiceHttpBindingStub MyServiceHttpService and
用于验证日期时间格式的正则表达式（MM/DD/YYYY）[重复]

这个问题在这里已经有答案了我正在尝试验证日期时间格式 MM DD YYYY 这是我正在尝试的代码请帮助 function ValidateDate testdate var Status var reg 0 1 9 12 d 3 01 0
为什么 scanf("%i",a) 不像 0b101 那样采用二进制？

我对二进制表达式感到困惑例如0b10101 include
使用 Python 删除字母图像中的残留物

我有一组图像代表从单词图像中提取的字母在某些图像中有相邻字母的残留物我想消除它们但我不知道如何消除一些样品我正在使用 openCV 我尝试了两种方法但都不起作用使用 findContours def is contour

使用 Python 删除字母图像中的残留物

使用 Python 删除字母图像中的残留物 的相关文章

随机推荐

热门标签

使用 Python 删除字母图像中的残留物的相关文章