如何去除给定图像中的噪声，使 ocr 输出完美？

2024-05-15

我已经对这个孟加拉文本图像进行了大津阈值处理，并使用 tesseract 进行 OCR，但输出非常糟糕。我应该应用什么预处理来消除噪音？我也想校正图像，因为它有轻微的倾斜。我的代码如下

import tesserocr
from PIL import Image
import cv2
import codecs
image = cv2.imread("crop2.bmp", 0)
(thresh, bw_img) = cv2.threshold(image, 128, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

img = Image.fromarray(bw_img)
text = tesserocr.image_to_text(img, lang='ben')
file = codecs.open("output_text", "w", "utf-8")
file.write(text)
file.close()

您可以通过删除小的连接组件来消除噪声，这可能会提高准确性。您还需要获得噪声组件阈值的最佳值。

import cv2 
import numpy as np

img = cv2.imread(r'D:\Image\st5.png',0)
ret, bw = cv2.threshold(img, 128,255,cv2.THRESH_BINARY_INV)

connectivity = 4
nb_components, output, stats, centroids = cv2.connectedComponentsWithStats(bw, connectivity, cv2.CV_32S)
sizes = stats[1:, -1]; nb_components = nb_components - 1
min_size = 50 #threshhold value for small noisy components
img2 = np.zeros((output.shape), np.uint8)

for i in range(0, nb_components):
    if sizes[i] >= min_size:
        img2[output == i + 1] = 255

res = cv2.bitwise_not(img2)

去噪图像：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

imageprocessing

OCR

Tesseract

如何去除给定图像中的噪声，使 ocr 输出完美？的相关文章

使用 Kivy 应用程序进行 Tesseract OCR

是否可以将 Tesseract OCR 或 Tess Two 与 Kivy 应用程序集成我正在寻找使用 Kivy 框架创建一个用于基于 OCR 的文本识别的 Android 应用程序我在我的 PC 上使用 Tesseract API 一
Python：Urllib2 和 OpenCV

我有一个程序可以将图像保存在本地目录中然后从该目录中读取图像但我不想保存图像我想直接从url读取它这是我的代码 import cv2 cv as cv import urllib2 url http cache2 allposte
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
如何在Matlab中将图像从笛卡尔坐标更改为极坐标？

我正在尝试将图像的像素从 x y 坐标转换为极坐标但我遇到了问题因为我想自己编写该函数这是我到目前为止所做的代码 function newImage PolarCartRot read and show the image image
MATLAB：图像角坐标和引用元胞数组

我在比较不同元胞数组中的元素时遇到一些问题这个问题的背景是我正在使用bwboundariesMATLAB 中的函数可追踪图像的轮廓该图像是结构横截面我试图找出整个部分是否具有连续性即只有一个轮廓由bwboundaries命令完成
图像处理方面的空间和时间表征有什么区别？

我是学习图像处理的初学者我对空间和时间表征的概念有点困惑那么对于空间表征来说是不是像一张二维地图包含了一些关于地图的统计信息呢就时间特征而言值是相对于时间的吗这意味着什么以及我们为何关心谢谢当您在不同时间拍摄一系列图像时
HoughLinesP后如何合并线？

My task is to find coordinates of lines startX startY endX endY and rectangles 4 lines Here is input file 我使用下一个代码 img c
未加载库：@rpath/libopenblasp-r0.2.19.dylib

我应该如何解决这个问题 Monas MacBook Pro 02 02 mona python Python 3 6 1 Anaconda custom x86 64 default May 11 2017 13 04 09 GCC 4 2
在Python中从整个图像中检测表格部分

我有一张尺寸为 3500x5000 的图像现在我只想检测整个图像中的表格部分如果不能直接进行 OCR 处理则对其进行裁剪和旋转经过所有搜索后我想到了使用裁剪图像中的每个单元格的想法https medium com coinmonk
我的 Opencv 应用程序处理速度非常慢

我正在构建一个 OpenCV 应用程序它从相机捕获视频并在删除背景后将其覆盖在另一个视频上我无法达到合理的速度因为它以大约 1 fps 的速度播放输出而我的背景去除以 3 fps 的速度工作有没有办法以正常速度显示背景视频并以
在哪里可以找到有关双三次插值和 Lanczos 重采样的好读物？

我想用 C 实现上述两种图像重采样算法双三次和 Lanczos 我知道现有的实现有几十种但我仍然想制作自己的实现我之所以这么做部分原因是我想了解它们是如何工作的部分原因是我想为它们提供一些主流实现中没有的功能例如可配置的多 CP
估计 libGD 操作所需的内存

在尝试使用 libGD 在 PHP 中调整图像大小之前我想检查是否有足够的内存可用于执行该操作因为内存不足会完全终止 PHP 进程并且无法捕获我的想法是原始图像和新图像中的每个像素 RGBA 需要 4 字节内存 check av
相机校准：如何正确进行

我正在尝试使用棋盘格通过众所周知的张氏方法进行校准然后进行捆绑调整该方法在 Matlab 和 OpenCV 中都可用有很多经验指南但从我个人的经验来看准确性是相当随机的它有时可能非常好但有时也可能非常糟糕实际上只需将棋盘放
Alpha 混合可消除图像中的接缝

我缝合了两张图像但在最终图像中存在可见的接缝我正在尝试使用阿尔法混合去除那条接缝我知道 Alpha 混合是使用cvAddweight 函数但在此函数参数是两个图像 alpha beta gamma和目的地我正在服用gamma 0
在 opencv 中一次性将旋转和平移结合起来

我有一段用于旋转和平移图像的代码 Point2f pt 0 in rows double angle atan trans c trans b 180 M PI Mat r getRotationMatrix2D pt angle 1 0
在matlab中融合2个以上的图像

在 MATLAB 中如何融合两个以上的图像例如我想要做什么imfuse但对于超过 2 个图像使用两张图像这是我的代码 A imread file1 jpg B imread file2 jpg C imfuse A B blend
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
OpenCV Sobel 滤波器 - 为什么它看起来这么糟糕，尤其是与 Gimp 相比？

我正在尝试使用 OpenCV 重建一些我之前在 Gimp 中完成的预处理第一级是用于边缘检测的 Sobel 滤波器它在 Gimp 中运行得很好现在这是我对 OpenCV 的尝试 opencv imgproc Sobel src sca
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使

随机推荐

理解 JavaScript 的单线程本质

我一直在阅读 John Resig 的 JavaScript Ninja 的秘密它解释了 JavaScript 是单线程的但是我尝试对此进行测试但我不确定要从这里删除什么 executing this in browser func
OpenMP：无法并行化嵌套 for 循环

我想将循环与其中的内循环并行化我的代码如下所示 pragma omp parallel for private jb ib shared n Nb lb lastBlock jj W WT schedule dynamic private
Oracle内置函数元数据

有没有办法获取 Oracle 内置聚合和其他功能的元数据例如AVG STDDEV SQRT ETC 我需要知道对象 id 和参数元 In the SYS ALL OBJECTS查看我找不到任何有用的东西我也尝试过搜索SYS ALL AR
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
如何在ReactJS中定义常量

我有一个将文本映射到字母的函数 sizeToLetterMap function return small square s large square q thumbnail t small 240 m small 320 n medium
Azure Graph API 身份验证_MissingOrMalformed

我正在使用 Azure Graph API 从 Azure AD 导入用户在天蓝色门户中我添加了多个应用程序我从 protal 获取 clientId tenantId 并创建一个有效期为一年的密钥使用这些值我创建一个 acces
无法理解表达式 *(uint32_t*) 的作用

我无法理解这个表达是什么 uint32 t does 我已将声明分解为一个声明各个部分的示例以便我可以尝试解释每个部分的作用 uint32 t ptr uint32 t num uint32 t ptr num lt what does
从 Android 打印，无需系统对话框

我想从我的 Android 应用程序打印图像打印机 canon selphy cp910 带 wifi direct 我尝试使用 Google API 和 android support v4 print PrintHelper 类它有
git diff 在尖括号中显示 unicode 符号

我有一个带有 unicode 符号俄语文本的文件当我修复一些拼写错误时我使用git diff color words 看看我所做的改变如果是 unicode 西里尔文符号尖括号会造成一些混乱如下所示 cat p1 cat p
Django 子应用程序和模块结构

我正在开发一个 Django 应用程序这是一个大型系统需要多个子应用程序来保持整洁因此我有一个顶级目录它是 Django 应用程序因为它有一个空的models py文件和多个子目录它们本身也是应用程序我以这种方式布局应用程
Linux shell 脚本中的 while 循环超时

这工作正常无限循环 while TRUE do printf done 我在尝试着timeout this while loop与timeout命令所有这些都不起作用 timeout 5 while TRUE do printf don
如何更改 Firefox 插件上的脚本位置？

制作 Firefox 插件的最简单方法是什么它重复了这个 chrome 功能 chrome webRequest onBeforeRequest addListener function info if info url indexOf
在 AngularJS 中设置应用程序范围的 HTTP 标头

有没有办法设置 httpProvider标题之外angular module myApp config 登录用户后我从服务器获取身份验证令牌我需要将其作为 HTTP 标头添加到所有后续请求中您可以使用角度的默认标题1 0 x http
subprocess.Popen('start') 失败

在 python 中运行此命令将导致 WindowsError 指出找不到指定的文件 FAILS import subprocess subprocess Popen start notepad exe 在命令窗口中它可以工作 start
Python Pandas to_datetime AttributeError：'tuple'对象没有属性'lower'

我有一个由 6 列组成的 csv 第一列具有特定的日期格式因此我需要将其转换为美国格式 YYYY mm dd 阅读 CSV 文件的内容后我继续修改日期列但不断收到以下错误 CSV Gmt time Open High Low Cl
如何将当前源文件名添加到 gulp-header

我缩小并连接供应商文件最好将vendor min js 中的脚本与一些信息如原始文件名分开我正在使用 gulp header 将标头添加到我的输出文件中 Minify vendor JS gulp task minify vendo
一列中唯一对的数量 - pandas

我在为 pandas 中的数据框生成统计数据时遇到了一些问题我的数据框如下所示我省略了索引 id type 1 A 2 B 3 A 1 B 3 B 2 C 4 B 4 C 各有什么重要的id有两个type分配的值如上例所示我想数一数
ASP.Net 4.0 与 TinyMCE 和 XML 编码在回发时重新编码内容

我有一个基于 ASP NET 4 0 的 CMS 我在其中通过 jQuery 使用 TinyMCE 3 4 来编辑一个文本框除此之外我还有其他几个文本框页面上还有另一个下拉列表用于控制内容类型该控件启用了自动回发并设置有关所选项目
无法从代码隐藏更改 CSSClass

这一定是世界上最简单的事情但它就是行不通我有一个外部 div 我想对其应用一个类以使其显示样式 none 以便隐藏其中的所有内容它实际上是一个 asp panel 元素所以我假设我可以在后面的代码中设置 control CssCla
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i

如何去除给定图像中的噪声，使 ocr 输出完美？

如何去除给定图像中的噪声，使 ocr 输出完美？ 的相关文章

随机推荐

热门标签

如何去除给定图像中的噪声，使 ocr 输出完美？的相关文章