如何OCR刻文字？

2023-12-22

我有这张图片

如何进行 OCR 识别？我知道这非常具有挑战性，但我非常感谢任何帮助。

如果您有时间自己开发检测，我会大致这样做：

获取 1000 张左右的图像，然后自己进行 OCR 识别，或者让 Amazon Mechanical Turk 上的人员为您完成，这几乎不需要任何成本。现在您可以调整算法并衡量您的表现。
就像 Ryan 写的那样，手动或使用标准图像滤镜、对比度、颜色、高斯等http://www.roborealm.com/ http://www.roborealm.com/。看看您是否无法找到使文本真正脱颖而出的组合。
再次尝试库
如果这些库仍然不起作用，请尝试利用您对图片的了解将其拆分为单独的数字。您知道应该有多少位数字以及每个数字大约需要多少像素。使用边缘检测或其他方法（也许标准 OCR 特征提取与聚类一起会将每个数字作为一个簇？）来查找数字并将它们分开。
对每个数字进行标准 OCR 特征提取（不要太有创意 - 使用现有库或至少阅读最常见和最简单的内容），并将这些特征与 1）下得到的答案一起输入神经网络网络或 SVM。
改进您的功能集，直到机器学习发挥作用。

由于您只有十位数字，而且图像之间相当一致，因此这应该可行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

imageprocessing

artificialintelligence

OCR

patternrecognition

如何OCR刻文字？的相关文章

不同提供商的相同 EDMX 文件

我正在开发一个项目其中有一个本地数据库 SQL CE 在不存在与服务器的连接的情况下用作缓冲区在服务器上我想使用相同的数据库布局当然我想使用服务器和客户端上可用的 Common dll 中的相同 EDMX 文件在客户端中我有一个
显示 div 内的用户名列表

我是 jQuery 新手在我的项目中我创建了一个类User其中代码如下所示 static ConcurrentDictionary
读取大文件并制作字典

我有一个大文件我需要读取它并从中制作字典我希望这一切能够尽可能快然而我的Python代码太慢了这是一个显示问题的最小示例首先制作一些假数据 paste lt seq 20000000 lt seq 2 20000001 gt la
C++0x 初始值设定项列表示例

我想看看这个现有代码示例如何利用 C 0x 初始化列表功能示例0 include
何时使用 C++ 私有继承而不是组合？

你能给我一个具体的例子吗什么时候使用私有继承优于组合就我个人而言我将使用组合而不是私有继承但在某些情况下使用私有继承可能是特定问题的最佳解决方案正在阅读C faq http www parashift com c faq lit
如何部署包含第三方 DLL 文件的 C# 应用程序？

首先我对部署了解不多我希望我的问题有意义我需要将 C 应用程序安装部署到多个桌面它需要一个第三方 DLL 文件一个 C 库 lpsolve55 dll 对于那些感兴趣的人它是一个免费的 MIP LP 求解器请参阅 lpsol
如何将 Visual-Studio 2010 切换到 c++11

我是 c 编程新手我想尝试 c 11 新功能那么我要问的是如何切换 Visual studio 2010 才能编译 c 11 源代码你可以参考这个表 VC10 中的 C 0x 核心语言功能表格 http blogs msdn com
C语言中没有循环可以打印数组吗？

例如在Python中如果我们将一个列表作为数组它会直接用一行代码打印整个数组有什么办法可以用C语言实现同样的事情吗简短回答 No 对表格上几乎所有问题的简短回答用 C 语言做 X 工作能像用 Python 一样简单吗 No 长答
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
多线程 - 比单线程慢

当我使用多个线程而不是单线程运行程序时它会变慢不是应该更快吗该程序应该遍历从起始目录开始的所有目录并查找并打印所有名为 X 的文件代码如下 while done pthread mutex lock lock if list is
多个线程访问一个变量

我在正在读的一本教科书中发现了这个问题下面也给出了解决方案我无法理解最小值怎么可能是 2 为什么一个线程不能读取 0 而所有其他线程都执行并写入 1 而无论是1还是2 最后写入的线程仍然必须完成自己的循环 int n 0 int mai
根据 Active Directory 策略检查密码[重复]

这个问题在这里已经有答案了我有一个允许用户更改其 AD 密码的前端有没有办法获取特定用户及其属性长度复杂性的密码策略例如细粒度有没有办法根据此特定策略检查字符串 xyz121 编辑我不想检查活动目录中存储的当前密码我想检查
使用 catch all 字典属性将 json 序列化为对象

我想使用 JSON net 反序列化为对象但将未映射的属性放入字典属性中是否可以例如给定 json one 1 two 2 three 3 和 C 类 public class Mapped public int One get se
从二进制文件读取字节到 long int

我有两个问题我有二进制文件的数据我想使用 read 函数读取前 8 个字节以签署 long int 但我不能你知道我该怎么做吗如何直接读取一块数据到字符串中我可以像所示那样阅读吗前任 ifstream is is open te
文件加密与解密问题

我一直在尝试在 VC Express 2010 中加密和解密文件我见过的所有教程和文档都需要两个FileStreams 来加密文件一个用于读取未加密的版本另一个用于加密当我实际编写代码时它不断抛出错误告诉我它无法打开该文件因为
在 Windows 上使用 C/C++ 开发时省略 msvcr100.dll？

是否可以在 Windows 上使用 C C 进行开发而不链接到 msvcr100 dll 我知道这是 Windows 的标准 c 库但我想知道如果我没有安装 Visual Studio 或 Redistributable 软件包我的计算
如何使用 C# 将表格粘贴到 Ms-Word 文档的末尾

我有一个预制的 Word 模板其中有一个表格我想打开它然后在文档末尾添加粘贴另一个表格问题是它不会转到文档的末尾而是将新表格粘贴到原始表格的第一个单元格中任何帮助将不胜感激 previous code copied a ta
在 C# 窗口应用程序中运行 C/C++ 控制台应用程序？

现在我想开发一个简单的应用程序因此我决定最快的编码方式是 C NET 但现在我很难实现我需要的功能之一我想做的是在 C 应用程序的窗口内运行 C C 控制台应用程序就像在虚幻前端中一样添加一点通信方式以便我可以为控制台应用程序
boost::spirit::qi::语法和可变参数模板

我在使用可变参数模板定义语法时面临一个问题我首先定义一些包含在某些结构中的简单语法例如纬度经度如下所示 include
查找和替换正则表达式问题

感谢这里对我其他问题的所有大力帮助我开始掌握正则表达式但我仍然对这个一无所知我的代码是 StreamReader reader new StreamReader fDialog FileName ToString string con

随机推荐

chrome 扩展删除脚本标签

我到处寻找这个问题的答案我希望我的扩展能够禁用页面上的所有 javascript 但允许插入有效的 cotent 脚本因此 chrome contentSettings javascript 目前不是有效选项或者我想要一种在任何脚本
Google Drive导出非Google doc文件

我正在尝试使用以下代码从 Google 云端硬盘导出多个文件 String str application rft OutputStream outputStream new ByteArrayOutputStream driveServi
当 NODE_ENV=生产时，Typescript 编译失败（在 Docker 中）

所以我有一个create react app ts我想将其 Docker 化并托管在 Zeit Now 上的应用程序本地一切正常正在运行yarn tsc and react scripts ts build效果很好通过以下 Docke
如何子类化模板化基类？

我有以下数据结构 struct fastEngine struct slowEngine template
响应式网页设计中布局更改时切换 HTML 元素的顺序

我正在构建一个响应式网站为了获得良好的用户体验我需要从移动设备到桌面设备进行一些布局更改具体来说我需要切换一些 HTML 元素的顺序我需要 HTML 元素在桌面和移动设备上采用不同的顺序 Mobile div class one
Oracle：在函数中返回多个值

我试图从使用两个表员工和部门的函数返回 rowtype 中的多个值但它对我不起作用 create or replace function get employee loc in number return mv emp rowtype
未来取消方法文档

根据http docs oracle com javase 8 docs api java util concurrent Future html http docs oracle com javase 8 docs api java ut
Ruby - 如何在字符串的开头和结尾添加字符

如何在字符串的开头和结尾添加撇号 string 1 2 3 4 我希望该字符串是 1 2 3 4 不确定这是否是您想要的 gt gt s 1 2 3 4 gt gt s split map x x join gt 1 2 3 4
为什么我无法从某些设备获取 HPROF 转储？

正如许多有用网站所详细介绍的分析 Android 应用程序内存使用情况的一种方法是执行 kill 10 PID 来触发 HPROF 转储这似乎适用于某些设备并且 logcat 通常包含如下内容 I dalvikvm 32170 thr
java中VOSK语音识别的模型文件应该放在哪里？错误（VoskAPI：模型（）：model.cc：122）

我尝试使用 VOSK 但出现此错误 ERROR VoskAPI Model model cc 122 Folder fa does not contain model files Make sure you specified the mo
如何同时使用 php 和 volt 参数？

我正在使用 Volt 和 PHP菲尔康伏特 partial 我想迭代一个loop在循环中我有接受参数的 php 代码这是我的代码 for header in headers th th endfor here header is a 范围
MySQL 存储过程中操作“=”的排序规则 (utf8_general_ci,IMPLICIT) 和 (utf8_unicode_ci,IMPLICIT) 的非法混合

我检查了数据库表发现它在latin1 swedish ci所以我把它改成了utf8 general ci然后我改变了排序规则latin1 swedish ci to utf8 general ci对于所有领域但它仍然给我同样的错误操作
是否可以通过 Javascript 访问 %-width 元素的当前缩放系数而不引起回流？

我正在尝试修复一些在缓慢的 UI 中执行缓慢的 javascript 并且我已将主要原因缩小到 jQuery width 用于查看实际像素大小的调用width 100 响应式布局中的元素在一个需要经常发生以响应用户操作的过程中我添加了基
Windows SDK 是否限制符合条件的 Windows 版本？

我们正在迁移到 Visual Studio 2017 VS2017 提示我们针对两件事重新定位项目 Windows SDK 版本和平台工具集目前我们的应用程序可以在较旧的 Windows 版本上运行至少到 Server 2003 可能更
是否可以使用 Bootstrap 的模态对话框、jQuery、AJAX 和 PHP 将图像上传到服务器？如果是的话怎么办？如果不是的话，原因是什么？

我在用着PHP jQuery jquery 1 9 1 min js 和 jquery ui 1 10 0 custom min js AJAX Bootstrap 设计框架 Bootstrap v3 0 0 等我在网络编程领域是一个相对
错误：在 TCPConnectWrap.afterConnect 处连接 ETIMEDOUT [as oncomplete]

我正在尝试使用 XMLHttpRequest 模块在 for 循环中异步调用 REST API 我在 1 个循环中发出 400 个请求每 100 个请求后等待时间为 1 秒这在客户端 JavaScript 上运行良好但是当我使用相同
如何对 Spring-Boot 应用程序 main() 方法进行单元测试以获得 Jacoco 测试覆盖率

如何使用 SpringApplication run 对 Spring Boot 应用程序 main 方法进行单元测试我想知道是否有可能获得此类的 Jacoco 测试覆盖率否则我会排除它这个问题与这个问题类似但不一样 Spring
Nvarchar 性能比 varchar 更好？

我真的很惊讶地发现在我的 MS SQL 表中我定义了一个字段varchar并与另一个表的字段进行分组当我对列做同样的事情时nvarchar比快 3 秒varchar从理论上讲由于 1 字节字符 varchar 应该更快谁能解释一下
Django 文件上传输入验证和安全

我正在创建一个very简单的 django 上传应用程序但我想让它尽可能安全这个应用程序将完全是一种方式 IE 任何上传文件的人都无需检索它到目前为止我已完成以下操作禁止某些文件扩展名 php html py rb pl cgi
如何OCR刻文字？

我有这张图片如何进行 OCR 识别我知道这非常具有挑战性但我非常感谢任何帮助如果您有时间自己开发检测我会大致这样做获取 1000 张左右的图像然后自己进行 OCR 识别或者让 Amazon Mechanical Turk 上

如何OCR刻文字？

如何OCR刻文字？ 的相关文章

随机推荐

热门标签

如何OCR刻文字？的相关文章