收据褪色部分可以恢复吗？

2024-05-05

我有一些包含一些扫描收据的文件，我需要使用 OCR 从中提取文本。由于收据上打印的文字在一段时间后会褪色，导致收据上的某些文字不清晰，影响OCR结果。

褪色单词的一些示例：

有什么方法可以恢复褪色的部分，以便提高 OCR 结果吗？

我在OpenCV中尝试过图像阈值处理和图像平滑，但结果不是很令人满意。图像可以进一步处理吗？

Averaging then Gaussian Threshold

Gaussian Blur then Gaussian Threshold

这种方法并不完美，并不适合所有字符（最好指定字符范围，将它们分开，然后在单独的字符上尝试此方法）。这是一个基本的想法；也许你可以完成它。最终的字符看起来不像原始字体，可能只是更易读。考虑到所选择的方法，这似乎很自然；由于字符的损坏，识别初始字体的名称和类型并不容易。

import sys
import cv2
import numpy as np

# Load and resize image
im = cv2.imread(sys.path[0]+'/im.png')
H, W = im.shape[:2]
S = 4
im = cv2.resize(im, (W*S, H*S))

# Convert to binary
msk = im.copy()
msk = cv2.cvtColor(msk, cv2.COLOR_BGR2GRAY)
msk = cv2.threshold(msk, 200, 255, cv2.THRESH_BINARY)[1]

# Glue char blobs together
kernel1 = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (11, 13))
kernel2 = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (4, 5))
msk = cv2.medianBlur(msk, 3)
msk = cv2.erode(msk, kernel1)
msk = cv2.erode(msk, kernel2)

# Skeletonization-like operation in OpenCV
thinned = cv2.ximgproc.thinning(~msk)

# Make final chars
msk = cv2.cvtColor(msk, cv2.COLOR_GRAY2BGR)
thinned = cv2.cvtColor(thinned, cv2.COLOR_GRAY2BGR)
thicked = cv2.erode(~thinned, np.ones((9, 15)))
thicked = cv2.medianBlur(thicked, 11)

# Save the output
top = np.hstack((im, ~msk))
btm = np.hstack((thinned, thicked))
cv2.imwrite(sys.path[0]+'/im_out.png', np.vstack((top, btm)))

有关模块及其许可证的更多信息：OpenCV https://github.com/opencv, NumPy https://numpy.org/about/

请注意，thinning算法位于opencv_contrib存储库；因此，请考虑其使用许可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

imageprocessing

OCR

Receipt

收据褪色部分可以恢复吗？的相关文章

如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
如何用 JavaScript 修复图像透视变形和旋转？

我有一些用手机拍摄的图像有没有可以拉直纸张照片并将其压平的 JavaScript 库例如我想创建一个矩形图像该图像没有任何失真换句话说我想知道如何用 JavaScript 修复透视变形和旋转例如我发现下面的示例图像来自this
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

在 Scala 中将 Map[String, String] 转换为 Map[String, Int]

我有一个 Map 其中键是 String 值是 Int 但表示为 String scala gt val m Map a gt 1 b gt 2 c gt 3 m scala collection immutable Map String
使用相位相关和对数极坐标变换获得旋转位移

我一直在编写一个脚本它使用 cv2 计算两个图像之间的旋转位移phaseCorrelate method 我有两张图像第二张是第一张图像的 90 度旋转版本加载图像后我将它们转换为对数极坐标然后将它们传递到phaseCorrela
当 docker 处于分离状态或前台时，日志不会发送到 AWS Cloudwatch

当我以交互模式运行 docker 脚本时它可以工作我可以在控制台和 AWS CloudWatch Logs 中查看日志下面的 docker 脚本以交互模式运行我添加了 awslogs 配置以便日志进入 cloudwatch doc
无论如何，您是否可以检查 Azure CLI 在后台执行哪些 API 调用？

我正在使用适用于 Azure 的 Python SDK 但我可以看到文档缺乏正确的信息和示例我知道 Azure CLI 是在 Azure 的 Python SDK 之上构建的因此我想知道是否有任何方法可以知道在执行以下操作时正在调用什么
Hibernate 和 Spring - 具有从同一父级继承的多个成员的实体会导致 JDBCException、@Transactional 怪异

这是重写我的另一个问题 https stackoverflow com questions 7800054 spring mvc app hibernate genericjdbcexception 我有一个 Spring WebMVC 应
SwiftUI • 如何实现半屏ShareSheet？

我在我的项目中实现了一个 ShareSheetSwiftUI App using UIViewControllerRepresentable Code struct ShareView UIViewControllerRepresentab
如何在android中对Log.e进行单元测试？

我需要执行单元测试在应用程序中发生特定情况时我需要检查是否记录错误消息 try do something catch ClassCastException IndexOutOfBoundsException e Log e INFOTA
iPhone - UITextView 应该看起来像 UITextField

我需要一个文本字段以便用户可以编写多行不幸的是 UITextField 不提供多行所以我想我必须使用 UITextView 但两者的设计并不相同是否可以像 UITextfield 标准一样设计具有白色背景和圆角的 UITextVie
ADO.NET 实体框架的实际好处是什么？

我正在读这篇关于ADO NET 实体框架 http msdn microsoft com en us library bb399572 aspx并发现它非常有趣尽管在第一个镜头中我无法破译很多东西我再次阅读这篇文章以了解其背后的真正逻
为什么 __instancecheck__ 并不总是根据参数调用？

有这样的代码 class Meta type def instancecheck self instance print instancecheck return True class A metaclass Meta pass a A i
Python串口通信

我正在开发一个 Arduino 项目由于内存限制我将其与 Python 脚本连接起来在Python方面我有一个二维矩阵其中包含各自的x y坐标值并且在此列表中有26000个坐标对因此为了向大家澄清数据结构 pathlist
空指针异常 - findViewById()

谁能帮我找出这个程序可能存在的问题在里面onCreate 方法findViewById 为所有 id 返回 null 这会导致稍后出现空指针异常我不明白为什么findViewById 找不到视图有什么建议么这是主要代码 public
反向 P/Invoke 教程？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个旧的 C C 类我想使用 PInvoke 重构并从 net 访问它所有 P Invoke
如何生成带logo的二维码？

我正在为 Android 设备开发应用程序我想生成带有徽标的二维码 With ZXing I know how to generate simple QR codes like this one But I want to generat
Facebook URL 调试：抱歉，出了点问题。我们正在尽快努力修复这个

https developers facebook com tools debug https developers facebook com tools debug 有谁知道为什么某些 URL 会出现此错误而其他 URL 则不会错误
使用 python (openpyxl) 从 Excel 中删除网格线

我正在尝试从使用 openpyxl 创建的 Excel 工作表中删除网格线但它不起作用我正在这样做 wb Workbook ws wb get active sheet ws show gridlines False print ws
setState 没有在 Dart / Flutter 中重新加载状态？

我遵循了 Google CodeLabs 的 Flutter 教程 Part 1 https codelabs developers google com codelabs first flutter app pt1 Part 2 http
当`enableProdMode()`时到底发生了什么[重复]

这个问题在这里已经有答案了我正在与Angular2 quick start演示使用TypeScript 一切正常但在演示完成后我在浏览器控制台中看到一条消息 Angular 2 正在开发模式下运行调用enableProdMode 启
模板类中的模板函数 is_same

为什么这段代码会产生错误的输出 this type cpp include
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC

收据褪色部分可以恢复吗？

收据褪色部分可以恢复吗？ 的相关文章

随机推荐

热门标签

收据褪色部分可以恢复吗？的相关文章