是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？

2023-12-20

我正在开发一个项目，该项目需要拍摄文本（来自任何文本的硬拷贝）并将该文本转换为文本文件。然后我想使用该文本文件来做一些不同的事情，例如提供新闻文章的超链接或允许用户编辑文档。

到目前为止我尝试过的工具是来自sourceforge.net的Java OCR，它对包中提供的图像运行良好。但当我拍摄自己的文字时，它根本不起作用。我应该实施一些培训流程吗？如果是这样，有人知道如何实施吗？任何帮助都会有很大帮助。谢谢你！

我有一个 java 应用程序，我最终决定使用超立方 OCR http://code.google.com/p/tesseract-ocr/，然后使用调用它Runtime.exec()。也许不完全是您需要的答案，但以防万一您没有考虑过。

编辑+添加代码以响应评论回复

在 Windows 安装中，我认为我能够使用安装程序，或解压缩现成的二进制文件。

在Linux服务器上，我需要自己编译Tesseract，但如果你习惯了这种事情（gcc）的话，这并不太难；唯一的问题是依赖于莱普托尼卡 http://www.leptonica.com/这也需要编译。

// Tesseract can only handle .tif format, so we have to convert it
ImageIO.write( ImageIO.read( new java.io.File(file.getPath())), "tif", tmpFile[0]);

String[] tesseractCmd = new String[]{"tesseract", tmpFile[0].getAbsolutePath(), StringUtils.removeEnd(tmpFile[1].getAbsolutePath(), ".txt")};
final Process process = Runtime.getRuntime().exec(tesseractCmd);
try {
    int exitValue = process.waitFor();
    if(exitValue == 0) {
        final String extractedText = SearchableTextExtractionUtils.extractPlainText(new FileReader(tmpFile[1]));
        return extractedText;
    }
    throw new SearchableTextExtractionException(exitValue, Arrays.toString(tesseractCmd));
} catch (InterruptedException e) {
    throw new SearchableTextExtractionException(e);
} finally {
    process.destroy();
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？的相关文章

使用转义序列渲染文本（如终端）

你好我正在寻找一些库或工具来在文本文件中呈现带有转义序列字符的文本我不知道如何称呼它但这是一个例子 echo e abc vdef abc def echo e abc vdef gt tmp xxxxx vi tmp xxxxx 我
Java 创建浮雕（红/蓝图像）

我正在编写一个 Java 游戏引擎 http victoryengine org http victoryengine org 并且我一直在尝试生成具有深度的 3D 图像您可以使用那些红色蓝色眼镜看到我正在使用 Java2D 进行图形
如何从另一个xml文件动态更新xml文件？

我想从另一个 xml 文件更新 xml 文件我使用了一个 xml 文件如下所示 one xml
如何对 IntStream 进行逆序排序

我正在使用 txt 文件读取数字BufferedReader 我想颠倒该流中元素的顺序以便在收集它们时它们将从最高到最低排列我不想在构建数组后进行排序因为我不知道其中可能有多少元素我只需要最高的 N 个元素 in new Buff
Java：从元素创建 DOM 元素，而不是文档

如您所知在 Java 中创建 Dom 元素的正确方法是执行以下操作 import org w3c dom Document import org w3c dom Element Document d Element e e d creat
无法将 Tesseract OCR 模块添加到 Android Studio

我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
场景生成器删除 fxml 文件中的导入

我使用场景构建器 Gluon Scene Builder JavaFX Scene Builder 8 1 1 来创建应用程序的 UI 并使用 Eclipse 开发 JavaFX 现在每次我在场景生成器中保存某些内容时它都会从 fxml
@EnableTransactionManagement 的范围是什么？

我试图了解正确的放置位置 EnableTransactionManagement多个 JavaConfig 上下文的情况下的注释考虑以下场景我在 JPAConfig java 和 AppConfig java 中有 JPA 配置以及一组
Java：VM 如何在 32 位处理器上处理 64 位“long”

JVM 如何在 32 位处理器上处理 64 位的原始 long 在多核 32 位机器上可以并行利用多个核心吗 64 位操作在 32 位机器上慢了多少它可能使用多个核心来运行不同的线程但不会并行使用它们进行 64 位计算 64 位长基本上
尝试在没有 GatewayIntent 的情况下访问消息内容

我希望每当我写一条打招呼的消息时机器人都会在控制台中响应一条消息但它只是给我一个错误 JDA MainWS ReadThread WARN JDA Attempting to access message content without
覆盖 MATLAB 默认静态 javaclasspath 的最佳方法

MATLAB 配置为在搜索用户可修改的动态路径之前搜索其静态 java 类路径不幸的是静态路径包含相当多非常旧的公共库因此如果您尝试使用新版本您可能最终会加载错误的实现并出现错误例如静态路径包含 google collectio
如何使用 Mockito 和 Junit 模拟 ZonedDateTime

我需要模拟一个ZonedDateTime ofInstant 方法我知道SO中有很多建议但对于我的具体问题到目前为止我还没有找到任何简单的解决办法这是我的代码 public ZonedDateTime myMethodToTest
在 AKKA 中，对主管调用 shutdown 是否会停止其监督的所有参与者？

假设我有一位主管连接了 2 位演员当我的应用程序关闭时我想优雅地关闭这些参与者调用supervisor shutdown 是否会停止所有参与者还是我仍然需要手动停止我的参与者 gracias 阻止主管 https github co
将 RSA 密钥从 BigIntegers 转换为SubjectPublicKeyInfo 形式

WARNING 最初的问题是关于 PKCS 1 编码密钥而问题中的实际示例需要SubjectPublicKeyInfo X 509 编码密钥我目前正致力于在 java 中从头开始实现 RSA 算法特别是密钥生成方面现在我的代码可以给
ExceptionHandler 不适用于 Throwable

我们的应用程序是基于 Spring MVC 的 REST 应用程序我正在尝试使用 ExceptionHandler 注释来处理所有错误和异常 I have ExceptionHandler Throwable class public R
使用 Java 从 S3 上的文件在 S3 上创建 zip 文件

我在 S3 上有很多文件需要对其进行压缩然后通过 S3 提供压缩文件目前我将它们从流压缩到本地文件然后再次上传该文件这会占用大量磁盘空间因为每个文件大约有 3 10MB 而且我必须压缩多达 100 000 个文件所以一个 z
来自客户端的超时 Web 服务调用

我正在使用 RestEasy 客户端调用网络服务一项要求是如果调用运行时间超过 5 秒则中止超时调用我如何使用 RestEasy 客户端实现这一目标我只看到服务器端超时即如果在一定时间内未完成请求 Rest Easy 网络服务
Java中获取集合的幂集

的幂集为 1 2 3 is 2 3 2 3 1 2 1 3 1 2 3 1 假设我有一个Set在爪哇中 Set
Java中有类似分支/跳转表的东西吗？

Java有类似分支表或跳转表的东西吗分支表或跳转表是根据维基百科 http en wikipedia org wiki Branch table 用于描述使用分支指令表将程序控制分支转移到程序的另一部分或可能已动态加载的不同程序
尝试使用带有有效购买令牌的 Java Google Play Developer API v3 检索应用内购买信息时出现错误请求（无效值）

当使用 Java Google Play Developer API 版本 3 并请求有效购买令牌的购买信息时我收到以下异常 API 调用返回 400 Bad Request 响应以及以下消息 code 400 errors domain

随机推荐

List 是指针吗？

我注意到的行为List
始终位于顶部窗口

我正在寻找一种解决方案以便使 JFrame 始终处于顶部并且始终我真正的意思是始终 setAlwaysOnTop true 当我以全屏模式启动游戏时这将不起作用我知道您通常不希望窗口保持在顶部但在这种情况下这是必需的这是不
cdk虚拟滚动问题

有没有人遇到过 Angular 7 cdk 虚拟滚动在 mat tab 组中工作异常的问题 https github com angular material2 issues 13981 https github com angular m
jQuery 分页插件

希望这是很容易解决的问题我在理解上遇到了一些问题jQuery 分页 http plugins jquery com project pagination plugin 本质上我想做的就是加载 PHP 文件然后对结果进行分页我试图摆脱
基本类型的 C++ 类包装器

我见过使用的许多库都有 typedef 来提供可移植的固定大小的变量例如 int8 uint8 int16 uint16 等无论平台如何它们都是正确的大小并且 c 11 本身使用头文件 stdint txt 来实现 H 最近在我
如何在 C++ 中使用小数（浮点）？

根据IEEE 754 2008 http en wikipedia org wiki IEEE 754 2008有存在三种二进制浮点基本格式可以使用 32 64 或 128 位进行编码和两种十进制浮点基本格式可以使用 64 或 12
如何通过货币名称获取货币符号？

我想要获得货币符号例如 or 按货币名称例如USD or EUR 对于英语美国我可以获得符号如果英语美国设置为设备上的语言 Currency currency Currency getInstance Locale getDe
Firebase 在 iOS 上使用 Swift 多次调用“Observe”

当我开始observer在 Firebase 数据库节点上我注意到 Firebase 继续调用该方法observer即使没有数据变化这是我的设置 FIRDatabase database reference withPath test
如何正确配置嵌入式 OpenEJB 容器进行测试？

这是我的 SLSB Stateless public class MyService PersistenceContext unitName abc EntityManager em public boolean exists int id
Intellij IDEA 未从 Groovy 项目中的 @Grab 导入依赖项

我正在处理一个 groovy 脚本它使用 Grab 注释导入依赖项该脚本将在 IDEA 中从命令行运行但是在 IDE 中导入显示为红色不可解析并且不会对导入的类提供自动完成功能我正在通过代理访问企业存储库该代理已在 IDE
为 C++ 应用程序提供 HTTP Web 服务器功能

我有一个 C 应用程序正在寻找一个库使其成为能够提供静态文件以及执行非常简单的任务的 HTTP 服务器唯一的限制是它必须是跨平台的我有什么选择澄清我的应用程序需要一个 Web 界面该应用程序是执行其他任务的后台程序我想提供一
使用 HTML5 验证多个电子邮件地址

我正在尝试构建一个电子邮件表单该表单将多个逗号分隔的电子邮件作为输入并使用 HTML5 验证它们我想使用以下正则表达式来检查输入的完整性 b A Za z0 9 A Za z0 9 A Za z 2 4 b 这是我尝试过的这似乎不适用
如何在 CakePHP 中定义模型的“全局”查找条件？

是否可以定义在使用特定模型的所有控制器和功能中始终有效的查找条件例如如果我只想退回有库存的产品无论如何也许在模型中的某个地方 conditions gt array inStock gt gt 0 我认为您可以尝试在模型上执行一个函
如何使用puppet为不同用户设置自定义bash环境？

我刚刚开始使用 puppet 和 vagrant 为我们的团队设置开发环境该团队由 8 名以上的开发人员组成每个人都有其特定的 bash 配置等我已经将所有软件安装在系统来快速部署新的开发虚拟机但我不确定以自动化的方式为每个特定用户
Gradle 错误：字符串索引超出范围：0

尝试使用 Gradle 编译 Android 项目并收到奇怪的错误当我跑步时 gradlew tasks stacktrace 尝试过干净的重建新的仓库克隆不同的分支同事能够构建 aok 寻找要检查尝试解决此问题的想法更新恢复
Selenium 和 Geckodriver 在 Python 中创建 Webdriver 时出现问题

我在 python 爬虫中有一段代码曾经可以工作我将其安装在新系统上现在正在尝试获取正确的依赖项使用geckodriver 0 13 0并执行以下代码时 def login self print self colors OKBLUE
“你好世界”从何而来？

hello world 通常是任何编程语言的第一个示例我一直想知道这句话是从哪里来的又是在哪里第一次使用的我曾经被告知这是有史以来在计算机屏幕上显示的第一句话但我找不到任何对此的参考所以我的问题是练习在哪里使用 hello wo
有没有办法为 Kotlin 顶级函数引用 Java 类？

我想使用以下方式在顶级函数中加载资源Class getResourceAsStream 有什么方法可以获取顶级函数将被编译到的类的引用以便我可以编写例如 val myThing readFromStream MYCLASS getRes
如何在 IntelliJ 插件中“注册”新的模块类型？

我是 IntelliJ 插件开发的初学者但我希望我的插件在新项目新模块窗口中注册新的模块类型我已经搜索了插件开发人员的文档但找不到任何有用的东西我还查看了 Kotlin 和 Scala 等现有插件它们也添加了新的模块类型但
是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？

我正在开发一个项目该项目需要拍摄文本来自任何文本的硬拷贝并将该文本转换为文本文件然后我想使用该文本文件来做一些不同的事情例如提供新闻文章的超链接或允许用户编辑文档到目前为止我尝试过的工具是来自sourceforge net的Ja

是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？

编辑+添加代码以响应评论回复

是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？ 的相关文章

随机推荐

热门标签

是否有 Java OCR 工具将文本图像转换为可编辑的文本文件？的相关文章