Tess-2 OCR 不工作

2024-03-13

我试图在 Android 上使用 tess-two 从图像中获取文本。

但这给了我一个非常糟糕的结果

01-16 12:00:25.339: I/Tesseract(native)(29038): Initialized Tesseract API with language=spa

大约 30 秒后,它显示结果字符串:

{ga
 .,
r¿
 y“: A
  r M í
:3 
'  ‘Ev’.-:.. -: A 7
 » w- ?" _
 Á.» ¿"A ¿rw-V r
 mjÏfn 'n’n . Y
' "\'ZA".‘.¡ A‘ :‘ïvAv- « ‘
:"Éf‘Ï'" -Ï«l :‘,.v:...»- .
 ' RFI' .. ’ g)" 3;:- 1-;4',
= * ¿,arifgggk mw; .1.  ,
'  "53» "J
't‘ ‘ ¿Las ;.‘».L',-‘»
 ' '  'N‘“ "“=: - '. V  .  ‘9!
5.? ' “F a .“ 
Y , <_  7- . 7.-, .
;«  z "1:;2wr . A - . ' -»‘ 5“:
“4-”, ¿rn 73:33: w v'.‘ ¿a ‘ A ,z, v VA
...,,« ' 'Q ' ‘ 4 214€. 5 . AV ¿JL y .13:
1  » . 21mm; » ¿ati-“fl ¿ab-1377*“ w”
. x ‘ ‘ ú  F v'v: 
1 . ' . ; (“ya  í .

of course thats not correct, im using this photo: enter image description here

我已经尝试了很多次,总是相似的结果。

可能出了什么问题,这是我使用 tess-two 的代码

    TessBaseAPI baseApi = new TessBaseAPI();
    baseApi.init("/mnt/sdcard/external_sd/tess/", "spa",TessBaseAPI.OEM_TESSERACT_ONLY);
    baseApi.setImage(bitmap);
    String recognizedText = baseApi.getUTF8Text();
    Log.d("Texto leido", "texto: "+recognizedText);
    baseApi.end();

这就是我从文件中获取位图的方法

    BitmapFactory.Options options = new BitmapFactory.Options();
    options.inPreferredConfig = Bitmap.Config.ARGB_8888;
    Bitmap bitmap = BitmapFactory.decodeFile(photopath.getAbsolutePath(), options);

我在图像视图上使用该位图,它似乎是正确的,所以我无法找到为什么它工作得那么糟糕。

任何想法?


这里更改图像文本语言的语言代码。

例如:如果您想要英语文本识别,请使用“eng”,或使用西班牙语“spa”

1)

   TessBaseAPI baseApi = new TessBaseAPI();
        baseApi.init("/mnt/sdcard/external_sd/tess/", "eng");
        baseApi.setImage(bitmap);
        String recognizedText = baseApi.getUTF8Text();
        Log.d("Texto leido", "texto: "+recognizedText);
        baseApi.end();

2)从以下地址下载语言包文件在这里下载 http://code.google.com/p/tesseract-ocr/downloads/list您必须下载 osd.traineddata.zip 文件并将 tesseract-ocr-3.01.eng.tar.zip(此处 eng 表示英语,spa 表示西班牙语等)文件粘贴到 asset 文件夹中。

3)将设置前的位图转换为灰度图像位图

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Tess-2 OCR 不工作 的相关文章

随机推荐

  • 如何使用 Grails 4 JSON 视图呈现域对象的映射

    这是以下问题 如何将映射呈现为 Grails 4 JSON 视图中的属性 https stackoverflow com q 69322504 715608 我有以下 JSON 视图 我想渲染以下值mealsByPerson地图使用 bre
  • 是否可以创建圆形(或任何其他非矩形)图像?

    我看到的所有圆盘形图像实际上都在一个矩形框内 并且侧面 下图中的黑色部分 是透明的 是否有可能拥有圆形画布本身 或者图像总是被设计成矩形 If yes how 你是对的 任何非矩形图形确实都存在于与轴对齐的边界矩形内 这样做是因为矩形处理起
  • Codemirror 显示 HTMLLint 内联错误 (.addLineWidget)

    我一直在尝试让 HTMLHint 显示内联而不是 JSHint 使用 addLineWidget http codemirror net doc manual html addLineWidget Codemirror 提供了我尝试使用 J
  • 将 JSON 发布到控制器返回 400 Bad Request

    我正在开发 RESTful 服务 我无法将 JSON 数据发布到控制器 我正在使用以下依赖项 春季 3 2 3 发布 杰克逊 1 9 6 我也尝试过 Spring 3 2 3 RELEASE 与 Jackson 1 9 9 Spring 3
  • wp print_thumbnail 功能不起作用

    wordpress 打印缩略图功能在测试服务器上正常工作 但在在线服务器上无法工作并给出错误的图像路径 例如 var www vhosts vinehospitality co za httpdocs wp content uploads
  • 一个意料之外的问题发生了。 WordPress.org 可能有问题

    我无法在我的 WordPress 网站中安装插件 当我尝试安装新插件时 出现以下错误 但它允许我上传插件然后安装它 发生意外错误 WordPress org 或此服务器的配置可能有问题 如果问题仍然存在 请尝试支持论坛 花了更多时间后 我通
  • 用于键盘输入的简单 UIToolarAccessoryView 的布局约束错误

    我遇到了很多布局约束错误 因此我创建了一个新项目 并仅使用 UIToolbar 和 UITextField 来尝试解决问题 即使有一个干净的项目 即使我没有覆盖任何限制 我仍然会遇到奇怪的错误 inputAccessoryView 代码如下
  • Yocto 添加自定义 UBoot 环境变量

    我正在尝试通过 Yocto 构建过程添加两个新的 u boot 环境变量 My file u boot imx 2021 04 bbappend包含 FILESEXTRAPATHS prepend THISDIR PN SRC URI fi
  • 如何制作Java插件?

    如果我想让我的Java程序能够接受插件 我怎样才能让Java插件使用核心程序的类而不将所有代码包含到插件代码中 插件如何访问程序界面而不将其包含到自己的 jar 文件中 看看Java插件框架 http jpf sourceforge net
  • 有没有办法暂停核心动画并在稍后恢复它?

    我有几个核心动画同时进行 它们都有一个上下文和一个动画 ID 其中上下文是正在动画的对象 UIImageView 对象 我想暂停它们 以便动画暂时停止 然后当某些事情完成时 恢复它以完成它 这些事情仅发生在 UIScrollView 中非常
  • 在 javascript 中启用/禁用 asp 验证控制

    我希望使用 JavaScript 启用 禁用我的验证控件 当我单击单选按钮列表 是 否 时 2 3 行变得可见 单击 是 后 用户必须在该行中提供的文本框中输入内容 为此 我保留了需要字段验证器 我在页面加载时禁用所有这些 然后使用 Val
  • Powershell:捕获无法启动服务时引发的异常

    我似乎无法捕获抛出的异常Start Service 这是我的代码 try start service SomeUnStartableService catch Microsoft PowerShell Commands ServiceCom
  • ASP.net 不使用其他区域设置资源文件

    我有一个Default aspx我获取本地化值的文件 默认 aspx
  • IgnoreMissingMember 设置似乎不适用于 FSharpLu.Json 反序列化器

    这是以下内容 F 中 json net 的反序列化问题 https stackoverflow com questions 62360805 deserialization issue with json net in f 我正在反序列化一
  • 在java中向下舍入0.5

    如何实现一个舍入函数 将除 0 5 或其任何奇数倍之外的所有数字照常舍入到最接近的整数 例如 2 899是要四舍五入到3 0 2 332是要向下舍入到2 0 2 5也将向下舍入为2 0 并不是3 0 您可以使用BigDecimal如下 pu
  • 如何检查数组列表中的数字是否连续

    我想检查数组列表中的数字是否是连续的 数组中的数字从 1 开始 下一个元素应该是 2 3 和 4 这意味着下一个元素比前一个元素大 1 public static void main String args ArrayList
  • react-hook-form 只以多级形式注册最后一步的表单数据

    我使用这个 css tricks 构建了一个多级表单article https css tricks com the magic of react based multi step forms 我正在尝试使用验证表单react hook f
  • 将图像从列表视图加载到下一个活动

    我在用Listview使用 json 解析器显示图像和数据 但是 当我单击其中一个列表项时 图像不会显示在下一个活动中 即详细活动中 我正在使用以下代码来显示图像 任何人都可以引导我走上正确的道路吗 任何帮助将不胜感激 Launching
  • 是否有与 Python pass 语句等效的 JavaScript 语句但不执行任何操作?

    我正在寻找与 Python 等效的 JavaScript pass不运行函数的语句 符号 JavaScript中有这样的东西吗 蟒蛇的pass主要存在是因为在 Python 中 块内的空格很重要 在 Javascript 中 相当于在块中不
  • Tess-2 OCR 不工作

    我试图在 Android 上使用 tess two 从图像中获取文本 但这给了我一个非常糟糕的结果 01 16 12 00 25 339 I Tesseract native 29038 Initialized Tesseract API