屏幕截图中低分辨率文本的 OCR

2024-05-04

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符。目前，我只关注数字。我的方法部分基于这篇博文：http://blog.damiles.com/2008/11/basic-ocr-in-opencv/ http://blog.damiles.com/2008/11/basic-ocr-in-opencv/.

我可以使用一些巧妙的阈值成功提取每个单独的字符。事情变得有点棘手的是匹配角色。即使字体和大小固定，也有一些变量（例如背景颜色和字距调整）会导致相同的数字以略有不同的形状出现。例如，下面的图像被分割成3部分：

顶部：我从屏幕截图中成功提取的目标数字
中：模板：我的训练集中的一个数字
底部：顶部和中间图像之间的误差（绝对差）

这些部分都已缩放（两条绿色水平线之间的距离代表一个像素）。

您可以看到，尽管顶部和中间的图像都清楚地表示 2，但它们之间的误差相当高。这会在匹配其他数字时导致误报 - 例如，不难看出，位置合适的 7 比中间图像更好地匹配上图中的目标数字。

目前，我正在通过为每个数字提供一堆训练图像并将目标数字与这些图像进行匹配来处理这个问题，一对一。我尝试获取训练集的平均图像，但这并不能解决问题（其他数字上的误报）。

我有点不愿意使用移动模板执行匹配（它基本上与我现在所做的相同）。有没有比简单绝对差更好的方法来比较两个图像？我在想也许像 EMD（推土机距离，http://en.wikipedia.org/wiki/Earth_mover http://en.wikipedia.org/wiki/Earth_mover's_distance）在 2D 中：基本上，我需要一种对全局移位和局部小变化（白色像素旁边的像素变成白色，或者黑色像素旁边的像素变成黑色）不太敏感的比较方法，但很敏感全局变化（远不及白色像素的黑色像素变成黑色，反之亦然）。

有人能建议一种比绝对差异更有效的匹配方法吗？

我在 OpenCV 中使用 C 风格的 Python 包装器（import cv).

我会考虑使用 Haar 级联。我已经将它们用于面部检测/头部跟踪，似乎您可以使用足够的“2”、“3”、“4”等构建一组相当好的级联。

http://alereimondo.no-ip.org/OpenCV/34 http://alereimondo.no-ip.org/OpenCV/34

http://en.wikipedia.org/wiki/Haar-like_features http://en.wikipedia.org/wiki/Haar-like_features

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

屏幕截图中低分辨率文本的 OCR 的相关文章

如何在python 3.7中生成条形码

我正在使用 python 3 7 为了生成条形码我尝试使用安装 pyBarcode 库pip install pyBarcode 但它显示以下错误找不到满足 pyBarcode 要求的版本来自版本找不到 pyBarcode 的匹配分
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
如何检查python xlrd库中的excel文件是否有效

有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件我知道还有其他库可以检查文件头我可以使用文件扩展名检查但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
检查 Python 中的可迭代对象中的所有元素的谓词是否计算为 true

我很确定有一个常见的习语但我无法通过谷歌搜索找到它这是我想做的用Java Applies the predicate to all elements of the iterable and returns true if all ev
Python 2.7 中的断言对我来说不起作用示例assertIn

我的 Mac 上安装了 python 2 7 通过在终端中运行 python v 进行验证当我尝试使用任何新的 2 7 断言方法时我收到 AtributeError 我看过http docs python org 2 library u
如果未引发异常，则通过 Python 单元测试

在Python中unittest框架是否有一种方法可以在未引发异常的情况下通过单元测试否则会因 AssertRaise 而失败如果我正确理解你的问题你could做这样的事情 def test does not raise on va
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
如何在 pandas 中使用 read_fwf 跳过空行？

I use pandas read fwf http pandas pydata org pandas docs stable generated pandas read fwf htmlPython pandas 0 19 2 中的函数读
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
Mac OSX 10.6 上的 Python mysqldb 不工作

我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
在系统托盘中隐藏 tkinter 窗口 [重复]

这个问题在这里已经有答案了我正在制作一个程序来提醒我朋友的生日这样我就不会忘记祝福他们为此我制作了两个 tkinter 窗口 1 First one is for entering name and birth date 2 Sec
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS

随机推荐

无法使用Linux服务启动Archiva 2.1.0

我正在尝试在 Linux 上启动最近发布的 Apache Archiva v2 1 0 独立版出于测试目的该 zip 已解压缩在 opt archiva 2 0 文档说 http archiva apache org docs 2 1
欢迎消息在网络聊天中不可见，但可以在模拟器中使用

IConversationUpdateActivity update message using var scope Microsoft Bot Builder Dialogs Internals DialogModule BeginLif
使用phonegap检查互联网连接

我看到了一些不同的选项来检查电话间隙的互联网连接有document addEventListener online onOnline false 还有navigator network connection type 但我不确定哪一种是最
如何访问打字稿中的组件

我有一个基本的 Angular 应用程序如下所示 app component html h1 Test Umgebung h1 div div
ValueError: n_splits=10 不能大于每个类中的成员数

我正在尝试运行以下代码 from sklearn model selection import StratifiedKFold X hey join now hello join today join us now not today jo
如何使用CSS使整个div在悬停时改变颜色？

我有以下内容 div class sidebar nav span2 div class sidebar link span Link 1 span div div class sidebar link span Link 2 span d
device_admin_sample.xml 放在哪里？

在哪里放置 device admin sample xml 无论我把它放在哪里它都会给出错误 device admin sample xml
Postgres 到 Ubuntu Docker 容器的链接不起作用

编辑我可以在没有任何我自己的自定义代码的情况下重现此内容我刚刚创建了一个运行 Ubuntu 14 04 的新 Linode 映像并按照以下步骤安装了 DockerDocker 的网站 https docs docker com ins
iPhone 中的视频过滤速度很慢

我正在尝试在 iPhone 中过滤视频这是我的程序结构和源代码 AppDelegate h AppDelegate m ViewController h ViewController m AppDelegate 文件与默认文件相同这是我
Git Bash Shell 可以使用默认的 Windows 快捷方式进行复制和粘贴吗？

我希望能够使用 Ctrl C 和 Ctrl V 复制并粘贴到 Git Bash Shell 中但是 shell 具有 Ctrl Insert 和 Shift Insert 作为这些操作我没有看到更改这些快捷键的明显方法我错过了一些明显
android中找不到资源异常

我正在尝试在我的 Android 应用程序中创建一个列表视图但我在运行项目时遇到资源未找到异常 Activity main xml
如何查看某个函数以 3 秒的间隔被调用了多少次？

我想检查我的函数在 3 秒内可以运行多少次我写了这段代码 include
web.config 位置元素中无法识别 InheritInChildApplications 属性

我尝试过包裹我的
如何在 SwiftUI 中导航到另一个视图时消除动画故障

当导航到 SwiftUI 中包含列表的视图时模拟器和真实设备上都会出现动画故障就在导航动画结束时列表项似乎跳了几个像素到其指定位置请参阅以下简单示例内容视图 struct ContentView View var body s
如何使用python将dataframe的行数据转换为json中的列名作为键，行数据作为值

我在转换数据帧的按行数据时遇到问题其中列名作为键行数据作为值我想将此按行 json 传递给另一个 API 作为输入我无法获取此 json 数据 for row in df iterrows out row to json orien
itext更改所有超链接的缩放级别以继承现有pdf中的缩放

我正在使用以下代码将所有超链接的缩放级别更改为继承缩放但无法改变可能我在 PdfName DEST 和条件中犯了一些错误因为第一页的 pdf 中没有 DEST 数组查看屏幕截图 for int count 0 count lt re
如何选中/取消选中 ExpandableListView 内的 CheckedTextView（子项）项？

我的设计我创建了一个自定义适配器 SignalsExpandableListAdapter 与我的 ExpandableListView 的 CheckedTextView public class SignalsExpandableLi
尽管 CRC 错误，仍强制 gzip 解压缩

我认为有办法做到这一点但我不确定如何做基本上我正在编写一个压缩程序当我尝试解压缩压缩数据时该程序导致了 crc 错误通常这意味着解压缩器实际上将我的数据识别为正确的格式并将其解压缩但是当它将结果与 CRC 指示的预期长度进行
Android：如何按下软键盘上方的按钮

我有一个保存按钮我想将其与软键盘一起按下因此当用户单击布局中的 EditText 时按钮必须保持在键盘上方现在该按钮隐藏在键盘下方你怎么做到这一点提前致谢您需要将键盘的输入模式设置为adjustResize 您可以通过将
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles

屏幕截图中低分辨率文本的 OCR

屏幕截图中低分辨率文本的 OCR 的相关文章

随机推荐

热门标签