Tesseract OCR 培训的替代方案？

2024-06-18

在过去的三个月里我一直在尝试训练 Tesseract
通过识别我拥有的图像集合，由于真正的缺乏
适当的文档，以及非常高的复杂性，我开始
放弃 Tesseract 作为解决方案。

我正在寻找一种相对无痛的替代方案
对于训练，我不想在这里重新发现轮子。

如果没有免费的东西，我想付费解决方案会
必须做的事（不超过 200 美元）

根据您的评论，您所需要的只是扫描相对少量的文档，几乎 100% 准确，您的预算约为 200 美元

那么答案很简单。您不需要任何编程解决方案。只需购买优质的商业 OCR 产品，例如ABBYY FineReader（免责声明：我为 ABBYY 工作）。不同的地区有不同的价格，但我想它在你的预算范围内。

商业桌面 OCR 产品将为您提供开箱即用的典型语言几乎 100% 的准确性。他们还拥有方便的手动验证工具来修复所有剩余的错误。通常，它们支持各种现代字体，但如果您的字体不简单，它们确实有字体训练实用程序。

我确实认为这对您来说是最佳解决方案。

更新：Linux 平台。遗憾的是，Linux 上几乎没有高质量的 OCR 产品可供选择，抱歉。我唯一知道的是 ABBYY 的：http://ocr4linux.com/en:start http://ocr4linux.com/en:start但它没有UI、验证和字体训练。但至少你可以尝试一下，看看它是否能给你足够好的准确度，情况可能正是如此。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OCR

Tesseract

Tesseract OCR 培训的替代方案？的相关文章

在Python中从pdf中提取印地语编写的文本[重复]

这个问题在这里已经有答案了我想从 pdf 文档中提取印地文输入的文本我已附上示例页面的图像 https i stack imgur com UkT86 jpg我正在处理我尝试使用 pdfminer 从中获取文本但文本是乱码可能是由
tess4j 与 Spring mvc

我已经尝试将 tess4j 作为独立的 java 程序并且它可以正常工作并给出文本输出现在我正在尝试创建一个 spring mvc web 项目在 pom 中添加 tess4j 的依赖项并且我已在我的项目中添加了 tess4j 源
pytesseract 错误 Windows 错误 [错误 2]

您好我正在尝试使用 python 库 pytesseract 从图像中提取文本请查找代码 from PIL import Image from pytesseract import image to string print image
Google Vision API 文本识别器无法正常工作

我使用 Google Vision API 来读取报纸等任何物体上的文本或墙上的文本我已经尝试过来自 Google 开发者网站的相同示例但我的文本识别器总是返回 falseIsOperational功能我在 Blackberry ke
有没有办法在 venv/web 服务器中安装 Tesseract OCR？

我制作了一个执行 OCR 功能的 Python 脚本然后回收了该脚本并使用 Flask 制作了一个 Web 应用程序 Web 应用程序及其库位于 virtualenv 中但该应用程序使用操作系统 Windows 中安装的 Tessera
用于屏幕文本的 OCR（光学字符识别）

我正在尝试创建一个软件通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别来查找要单击的特定按钮例如我已经有了鼠标和键盘控制部分但现在我需要 OCR 来处理屏幕截图我发现 Tesseract OCR 似乎不能很好地处
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles
如何在Eclipse中配置Tesseract进行Android开发？

我已经从事 Android 工作 6 个月了至此我对Android开发有了基本的了解现在我想使用 Tesseract 开发一个 OCR Android 应用程序为此我从 Tesseract 下载了 android ndk r6b t
提高 pytesseract 从图像中正确识别文本的能力

我正在尝试使用读取验证码pytesseract模块大多数时候它都能提供准确的文本但并非总是如此这是读取图像操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
训练 tesseract 与 iPhone 一起使用

我正在尝试在我的 iPhone 应用程序中使用 tesseract 2 04 只想检测数字我在这里所做的首先是使用这篇文章交叉编译 tesseract 以生成 lib 文件http robertcarlsen net 2009 07 15
如何从图像生成 tiff/box 文件以在 Windows 中训练 Tesseract

我正在尝试在 Windows 中训练 Tesseract 为此我需要一对 tiff box 文件并且我正在尝试使用 jTessBoxEditor 创建它但它不接受图像作为输入我也尝试过 boxFactory 但它无法正常运行有谁知道
无法将 Tesseract OCR 模块添加到 Android Studio

我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
未应用 Tesseract 用户模式

I want to do OCR on this image This is pre define format ie first five will characters then next four will be digits and
超立方体错误。非法的最小或最大规格

尝试从这里运行示例代码http tess4j sourceforge net codesample html http tess4j sourceforge net codesample html我收到一条错误消息 Error Illega
使用 Tesseract 进行手写识别

我只是想知道如果将大写字母全部放在表格中自己的小框中那么超正方体的手写识别准确度有多高我知道你可以训练它来识别你自己的笔迹但我的问题是我需要在多个笔迹中使用它有人能指出我正确的方向吗多谢简而言之您必须训练 Tesseract
tesseract 处理后无法获取原始彩色位图 - android

我使用 android 的 tesseract 库从图像中捕获某些文本我知道捕获的图像不会保存在任何地方它会被回收我需要找到原始的彩色位图我一直在尝试找到原始的彩色位图但我所能找到的只是灰度位图 Bitmap bitmap act
Tesseract 似乎不适用于数字

我按照常见问题解答让 Tesseract 识别数字但我得到的只是输出文件中的一堆文本尽管我的图像中只有数字我的命令行如下所示 tesseract tessdata dir input jpg output output digits
从超立方体图像中获取文本的确切位置

使用 tesseract 中的 GetHOCRText 0 方法我能够检索 html 中的文本并在 webview 中呈现 html 时我能够获取文本但图像中文本的位置与输出不同任何想法都非常有帮助 tesseract gt Se
Tesseract OCR 培训的替代方案？

在过去的三个月里我一直在尝试训练 Tesseract通过识别我拥有的图像集合由于真正的缺乏适当的文档以及非常高的复杂性我开始放弃 Tesseract 作为解决方案我正在寻找一种相对无痛的替代方案对于训练我不想在这里重新发现轮子如

随机推荐

将 boost::iostreams::mapped_file_source 与 std::multimap 一起使用

我有相当大量的数据需要分析每个文件大约有 5gig 每个文件的格式如下 xxxxx yyyyy 键和值都可以重复但键是按升序排列的我正在尝试使用内存映射文件来实现此目的然后找到所需的键并使用它们这是我写的 if data file
在.NET MVC中，有没有一种简单的方法来检查我是否在主页上？

如果用户从主页登录我需要采取特定的操作在我的 LogOnModel 中我有一个隐藏字段 Html Hidden returnUrl Request Url AbsoluteUri 在我的控制器中我需要检查该值是否是主页在下面的示例
Android Wear Preview 未连接到 Wear Emulator

我正在尝试为 Google Wear 设置开发环境并遵循 Google 的指示 http developer android com training wearables apps creating html但一旦我设置了端口转发 adb
useState 以 `new` 关键字作为参数

我正在构建一个单独的服务来处理复杂的事情该服务是一个类只是为了测试建议我在一个内部模拟useState 重点是我忘记了一个console log在构造函数内部并意识到类构造函数在组件重新渲染时被调用多次这种行为不会导致意外的行为或
基本 NASM 引导程序

我最近一直在研究操作系统启动过程和 NASM 在我的旅程中我遇到了一段有用的引导代码我部分理解并通过虚拟软盘对其进行了测试我的基本问题是我不明白其中一些行的作用我已经评论了我认为这些线条的作用任何更正或确认将不胜感激 This
如何使用 HTML5 在画布上绘制心电图监视器？

我尝试使用canvas html5绘制心电图系统几乎我即将完成我的波浪正在移动但不是连续地重复但我想绘制波浪是从左到右连续移动的下面的链接是示例 Ex https www youtube com watch v wuwBfSpVEg
确定所选电子邮件是来自收件箱还是已发送邮件

我正在编程Outlook 插件并需要确定所选电子邮件是否来自Inbox or Sent Items这样当我将电子邮件保存到数据库中时我可以使用文件夹收件箱或已发送来标记电子邮件我知道我可以将文件夹名称与收件箱或已发送邮件
vim中的折叠功能

有没有什么方法或工具可以在 vim 中折叠功能例如 Visual Studio 或 Eclipse Vim folding commands zf j creates a fold from the cursor down lines z
更改 macOS 应用程序中打开窗口中的文档

我正在为 macOS 编写一个基于文档的应用程序我正在尝试编写一项功能来更改当前窗口中的活动文档以便能够循环浏览文件夹中的下一个上一个文档就像使用图像浏览器应用程序一样我应该调用什么命令来在当前窗口中打开不同的文档文档表明 op
尝试了解 ARM 二进制映像中的加载内存地址 (LMA) 和二进制文件偏移量

我在一家ARM 皮质 M4 STM32F4xxxx 我试图了解二进制文件 elf and bin 在内存中构建并闪存特别是关于内存位置具体来说我不明白的是LMA从实际的二进制文件偏移量进行翻译让我用一个例子来解释一下我有一个 e
当输入是 DataFrame 时，在seaborn中对箱线图进行分组

我打算在一个图中绘制多个列pandas dataframe 全部按另一列分组使用groupby inside seaborn boxplot 对于类似的问题这里有一个很好的答案matplotlib matplotlib 分组箱线图 ht
有人对 Apple iOS Remote 应用程序用于通过 IP 控制 Apple TV 的协议进行逆向工程吗？

我很好奇我是否可以编写可以控制 Apple TV 的程序特别是运行 tvOS 9 1 1 的 Apple TV 第四代就像 Apple 的 iOS 远程应用程序一样我想向它发送用于在四个基本方向上导航选择屏幕上的项目向上导航堆栈的
是否可以通过 WebRTC 进行屏幕共享来广播音频

是否可以通过 WebRTC 进行屏幕共享来广播音频简单的调用getUserMedia with audio true由于权限被拒绝错误而失败是否有任何可以用来广播音频的工作环境除了屏幕共享之外还会实现音频吗 Thanks 参考这个演示
PHP 根据需要添加额外的空格

考虑以下代码 div div search php and category php本质上是相同的结构具有一些特定内容的 div 容器这里没什么特别的纯 HTML div class component div 但是当插入时requ
返回不在函数中

Firebug 报告返回不在函数中错误没有位置好吧第 1 行什么都没有我怎样才能找到这个错误的根源 return not in function Break on this error return 0 javascript r
Java 有现成的时钟同步解决方案吗？

我们有一个大型的高性能软件系统它由多个交互的 Java 进程不是 EJB 组成每个进程可以在同一台机器上也可以在不同的机器上某些事件在一个进程中生成然后以不同的方式传播到其他进程以进行进一步处理等出于基准测试的目的我们需要创
地理编码服务与 gMap 搜索之间的差异结果

我想获取此地址的纬度和经度 Boulevard de la Marne Zone industrielle COULOMMIERS 77120 France 我将 api 添加到我的页面当我使用 gmaps 时结果很好但是当我想通过
通过套接字的身份验证方法

我正在尝试通过套接字进行身份验证sailsjs and passport 挑战似乎在于套接字连接没有会话并且 sailsjs 模拟请求对象导致它没有 Passport 中间件设置这导致nodejs抛出一个错误说req对象没有调用的方
将图像添加到 ASP.Net 中的单选按钮列表

我正在尝试将图像添加到单选按钮列表控件但它不起作用我试过这个 RadioButtonList2 Items Add new ListItem String Format src Colors Dallas 625527 1 1 png
Tesseract OCR 培训的替代方案？

在过去的三个月里我一直在尝试训练 Tesseract通过识别我拥有的图像集合由于真正的缺乏适当的文档以及非常高的复杂性我开始放弃 Tesseract 作为解决方案我正在寻找一种相对无痛的替代方案对于训练我不想在这里重新发现轮子如

Tesseract OCR 培训的替代方案？

Tesseract OCR 培训的替代方案？ 的相关文章

随机推荐

热门标签

Tesseract OCR 培训的替代方案？的相关文章