如何在java中将文本区域与图像分开

2024-02-16

我正在使用 OCR 来识别护照详细信息，因为我使用的是 Tesseract Java API。为了获得更好的准确性，我需要将整个图像（可以是 .png、.jpeg、.tiff）仅划分为文本区域。有没有开源的java库可以将文本区域与图像分开。请给我任何建议。

Marvin http://marvinproject.sourceforge.net/en/index.html正好为此目的提供了一种方法。

public static java.util.List<MarvinSegment> findTextRegions(MarvinImage imageIn,
                                        int maxWhiteSpace,
                                        int maxFontLineWidth,
                                        int minTextWidth,
                                        int grayScaleThreshold)

输入图像：

输出图像：

源代码：

import static marvin.MarvinPluginCollection.*;

public class TextRegions{

        public static void main(String[] args) {

        MarvinImage image = MarvinImageIO.loadImage("./res/passport.png");
        MarvinImage originalImage = image.clone();
        List<MarvinSegment> segments = findTextRegions(image, 15, 8, 30, 150);

        for(MarvinSegment s:segments){
            if(s.height >= 5){
                originalImage.drawRect(s.x1, s.y1, s.x2-s.x1, s.y2-s.y1, Color.red);
            }
        }

        MarvinImageIO.saveImage(originalImage, "./res/passport_2.png");
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

imageprocessing

如何在java中将文本区域与图像分开的相关文章

HashMap不写入数据库

我尝试在我的数据库中写入但只写入发件人和消息我不明白为什么会发生这种情况我认为问题出在我使用 sendMessage 的地方我认为问题是我没有什么可以做的读写其他用户的主键我在数据库中写入消息的活动 public class M
Java Try Catch Final 没有 Catch 的情况下会阻塞

我正在审查一些新代码该程序只有一个 try 和一个 finally 块既然排除了 catch 块那么如果 try 块遇到异常或任何可抛出的内容它如何工作它直接进入finally块吗如果 try 块中的任何代码可以引发已检查异常
将 jar 作为 Linux 服务运行 - init.d 脚本在启动应用程序时卡住

我目前正在致力于在 Linux VM 上实现一个可运行的 jar 作为后台服务我已经使用了找到的例子here https gist github com shirish4you 5089019作为工作的基础并将 start 方法修改为
无法解析类型为 xxx 的任何 bean；限定符：[@javax.enterprise.inject.Any()]

我有一个 LoginProvider 接口 public interface LoginProvider boolean login String username String password 以及两种不同的实现 public clas
禁用 Eclipse Java 调试器的热代码替换 [重复]

这个问题在这里已经有答案了可能的重复如何在 Eclipse 中禁用热代码替换 https stackoverflow com questions 2594408 how do i disable hot code replace in
对话框上的 EditText 不返回任何文本

我太累了找不到错误我没有发现任何错误但我没有从 editText 收到任何文本请看下面的代码活动密码 xml
为什么 java 编译器不报告 Intellij 中多播表达式的未经检查的强制转换警告？

为什么下面的代码没有报告 Intellij IDEA 的未经检查的警告jdk 1 8 0 121自从Supplier
如何在 JSP 中导入类？

我是一个完全的JSP初学者我正在尝试使用java util List在 JSP 页面中我需要做什么才能使用除以下类之外的类java lang 使用以下导入语句进行导入java util List 顺便说一句要导入多个类请使用以下格式
如果使用的 JVM 是 x86 或 x64，则以不同的方式解决 Maven 依赖关系？

我设置了一个 Maven 存储库来托管一些 dll 但我需要我的 Maven 项目根据使用的 JVM 是 x86 还是 x64 下载不同的 dll 例如在运行 x86 版本 JVM 的计算机上我需要从存储库下载 ABC dll 作为依赖
如何在android中设置多个闹钟，在这种情况下最后一个闹钟会覆盖以前的闹钟

我正在开发一个Android应用程序用户可以在其中设置提醒时间但我在以下代码中遇到一个问题即最后一个警报会覆盖之前的所有警报 MainActivity java public void setreminders DatabaseHan
具有共享依赖项的多模块项目的 Gradle 配置

使用 gradle 制作第一个项目所以我研究了 spring gradle hibernate 项目如何组织 gradle 文件并开始制作自己的项目但是找不到错误为什么我的配置不起作用子项目无法解决依赖关系所以项目树 Root
Git 无法识别重命名和修改的包文件

我有一个名为的java文件package old myfile java 我已经通过 git 提交了这个文件然后我将我的包重命名为new所以我的文件在package new myfile java 我现在想将此文件重命名和内容更改提交
如何记录来自 Akka (Java) 的所有传入消息

在 Scala 中您可以使用 LoggingReceive 包装接收函数如何通过 Java API 实现相同的目标 def receive LoggingReceive case x do something Scala API 有Lo
解析输入，除了 System.in.read() 之外不使用任何东西

我很难找到具体的细节System in read 有效也许有人可以帮助我似乎扫描仪会更好但我不允许使用它我被分配了一个任务我应该以 Boolean Operator Boolean 的形式读取控制台用户输入例如T F 或 T T
对象锁定私有类成员 - 最佳实践？（爪哇）

I asked 类似的问题 https stackoverflow com questions 10548066 multiple object locks in java前几天但对回复不满意主要是因为我提供的代码存在一些人们关注的问题
将图像添加到自定义 AlertDialog

我制作了一个 AlertDialog 让用户可以从我显示的 4 个选项中选择一个前 3 个让他们在单击号码时直接拨打号码第 4 个显示不同的视图现在看起来是这样的由于第四个选项的目的是不同的任务我想让它看起来不同因为用户可能会感
Java：多线程内的 XA 事务传播

我如何使用事务管理器例如Bitronix http docs codehaus org display BTM Home JBoss TS http www jboss org jbosstm or Atomikos http www a
Hibernate 和可序列化实体

有谁知道是否有一个框架能够从实体类中剥离 Hibernate 集合以使它们可序列化我查看了 BeanLib 但它似乎只进行实体的深层复制而不允许我为实体类中的集合类型指定实现映射 BeanLib 目前不适用于 Hibernate 3 5
Java &= 运算符应用 & 或 && 吗？

Assuming boolean a false 我想知道是否这样做 a b 相当于 a a b logical AND a is false hence b is not evaluated 或者另一方面这意味着 a a b Bitwi
JAXB - 列表<可序列化>？

我使用 xjc 制作了一些课程 public class MyType XmlElementRefs XmlElementRef name MyInnerType type JAXBElement class required false

随机推荐

如何在 moment.js 中仅比较日期

我是 moment js 的新手我有一个日期对象它有一些与之关联的时间我只是想检查该日期是否大于或等于今天的日期比较时不包括时间 var dateToCompare 2015 04 06T18 30 00 000Z 我只想检查 da
HashMap 上的 NegativeArraySizeException

由于某种原因我的程序突然抛出一个NegativeArraySizeException跑了一段时间后引发它的代码位于命令后面该命令是我在引发异常之前输入的我使用的代码主要用于调试目的如下所示 final HashMap
如何添加 NSDecimalNumbers？

好吧这可能是今天最愚蠢的问题但假设我有一堂课 NSDecimalNumber numOne NSDecimalNumber numberWithFloat 1 0 NSDecimalNumber numTwo NSDecimalNumb
Google 地图 API - 地图未加载

我一直在尝试在我的网站中嵌入谷歌地图但没有取得太大成功我使用了下一个代码部分我在我自己的计算机上使用实际的 api 密钥
android.view.InflateException：二进制 XML 文件行 #0：膨胀类 Button 时出错

我正在学习 Audacity 的课程并决定输入所有代码但当我尝试运行该应用程序时遇到错误我收到以下错误 10 27 19 17 41 871 26679 26679 com example vhuhwavho friendlychat
PFImageView url 显示解析

已经 1 周了我仍然停留在 PFImageView 上我重做了一切从 UITableView 更改为 PFQueryTableView 然后尝试使用 UITableViewCell 显示图像然后使用 PFTableViewCell
DropDownList SelectList SelectedValue问题[重复]

这个问题在这里已经有答案了可能的重复我怎样才能让这个 ASP NET MVC SelectList 工作 https stackoverflow com questions 781987 how can i get this asp n
谷歌代码上有我所有代码项目的概述吗？

谷歌代码上有我所有代码项目的概述吗我可以访问的网址是什么我的项目未包含在仪表板中https www google com dashboard https www google com dashboard 它们应该列在 http code
通过超链接传递到其他页面的数据被切断

我有一个包含 2 的表格
从 PHP 的 mysql 扩展切换到 PDO。扩展类以减少代码行

所以这是我多年来一直想解决的问题将一些小型单文件应用程序转换为 PDO 我可以使用 PDO 连接到数据库并运行查询一切正常但每次我初始化一个新的 PDO 时我还必须运行 setAttribute PDO ATTR ERRMODE
非标量导航属性未填充“nodb”概念

我正在使用 Breeze 1 4 8 并尝试将键值对列表作为具有 nodb 概念的导航属性我有两个简单的模型 function configureKeyValuePairDtoType metadataStore var prop va
有没有办法在 Visual Studio 中查看已安装的 NuGet 包来自哪个包源？

在 Visual Studio 的 NuGet 包管理器中您可以通过单击包管理器中的已安装选项卡来查看解决方案中已安装哪些 NuGet 包但是在同一包位于多个 NuGet 包源中的情况下查看特定 NuGet 包来自哪个包源会很有
多行返回语句

已经在互联网上搜索试图弄清楚这一点但没有运气据我所知您通常只有一个 return 语句但我的问题是我需要在 return 语句中添加换行符以便测试返回 true 我尝试过的是抛出错误可能只是一个菜鸟错误我当前的函数没有尝试换行
将Python序列转换为NumPy数组，填充缺失值

Python 序列的隐式转换可变长度列表到 NumPy 数组中导致数组的类型object v 1 1 2 np array v gt gt gt array 1 1 2 dtype object 尝试强制另一种类型将导致异常 np arra
阿拉伯语的 DatePickerDialog

我有一个阿拉伯语应用程序我想查看阿拉伯语的 DatePickerDialog 我尝试过设置区域设置但没有成功 Thanks 我发现答案是将整个应用程序的 Locale 更改为 ar 在开始活动时通过以下代码将应用程序区域设置设置为
如何为 Spring Boot 应用程序设置自定义 Http 标头“服务器”

默认情况下带有嵌入式 Tomcat 的 Spring Boot 应用程序的 HTTP 服务器标头是 Server Apache Coyote 1 1 怎么可以在春季启动可以实现使用另一个自定义服务器标头吗对于Tomcat本身可
SQL主键异常

我有一个 Microsoft Sql Server 数据库由大约 8 个表组成我正在尝试更新这些表为此我创建了许多临时表 CREATE TABLE vehicle data dbo temp MAINTENANCE EVENT ma
在 ruby .gemspec 文件中，如何指定依赖项的多个版本？

我正在尝试修改当前依赖于 activeresource 的 gem 定义为 s add dependency activeresource gt 3 0 为了让 gem 与 Rails 4 一起使用我需要扩展依赖关系以与 activere
ng2 - ng-container 和 ng-template 标签之间的区别

有人可以说明一下使用之间的区别吗
如何在java中将文本区域与图像分开

我正在使用 OCR 来识别护照详细信息因为我使用的是 Tesseract Java API 为了获得更好的准确性我需要将整个图像可以是 png jpeg tiff 仅划分为文本区域有没有开源的java库可以将文本区域与图像分开请给

如何在java中将文本区域与图像分开

如何在java中将文本区域与图像分开 的相关文章

随机推荐

热门标签

如何在java中将文本区域与图像分开的相关文章