Tesseract OCR训练时碰到的问题和解决方案

2023-05-16

关于如何用Tesseract-OCR训练我就不重复了，大家可以直接参考下面的案例，

使用tesseract训练自己的字库提高识别率_SeventhBlue的博客-CSDN博客_tesseract训练自己的字库

OCR 文字识别 - boyang987 - 博客园

随着tesseract版本的不断更新，发现2021年3月18日和以后编译的版本在训练时都存在问题，源码里有不少BUG[https://github.com/tesseract-ocr/tesseract/issues/3925]；于是，我只好在github上拉下了以前的版本进行验证，

git clone --recursive -b 5.0.0-alpha-20201224 https://github.com/tesseract-ocr/tesseract tesseract500A2012

接下来，用cmake-gui进行配置后编译即得到最终的代码，这些基础的过程就不详述了，毕竟没时间写成系列的教学篇章。

使用的过程的指令大致如下，

(1) 加路径到环境变量
E:\pkg_ocr\tesseract\tesseract520

(2) 编辑图片
cd  E:\pkg_ocr\tesstrain\jTessBoxEditor231
train.bat ----> jTessBoxEditor  ---> merge TIFF ---> save it as myfontlab.normal.exp0.tif

(3) 在命令窗口进行操作，
tesseract  myfontlab.normal.exp0.tif   myfontlab.normal.exp0   batch.nochop   makebox
tesseract   myfontlab.normal.exp0.tif    myfontlab.normal.exp0   nobatch   box.train
注意：如果发现empty这样的报错，不能通过box检查，就需要调整对比度或亮度，然后再合成tif

(4)
unicharset_extractor myfontlab.normal.exp0.box

(5)
echo normal 0 0 0 0 0 > font_properties
注意，文件的名字就是font_properties它没有.txt后缀（我用的font_properties.txt发现也没有问题）。里面内容写入 normal 0 0 0 0 0 表示默认普通字体。
注意这里的normal要和myfontlab.normal.exp0.tif中的normal一样。

(6)
shapeclustering -F font_properties -U unicharset myfontlab.normal.exp0.tr
或者
shapeclustering -F font_properties.txt -U unicharset myfontlab.normal.exp0.tr

(7)
mftraining  -F font_properties -U unicharset -O train.unicharset myfontlab.normal.exp0.tr
生成inttemp、pffmtable文件的时候，如果上面命令不行的话，或者报错，就使用下面的命令，
mftraining -F font_properties.txt -U unicharset -O train.unicharset myfontlab.normal.exp0.tr

(8)
cntraining myfontlab.normal.exp0.tr

(9)
combine_tessdata normal

(10)测试成功会生成一个t_7B-normal.txt的文件，如下
tesseract E:\test_images\ocr\t_7B.png  E:\test_images\ocr\t_7B-normal -l normal

问题1：

mftraining.exe Warning no protos configs for -something- in CreateIntTemplates() when use command mftraining

这个主要是样本量不够引起的，例如你要训练的某个字符只有小于5个的样本，最好你需要准备10个样本。

问题2：

combine_tessdata.exe: Error: traineddata file must contain at least (a unicharset fileand inttemp) OR an lstm file.

这个问题我在github上有回复，

https://github.com/tesseract-ocr/tesstrain/issues/156

就是在生成各种文件后，

cntraining mytest.normal.exp0.tr

inttemp
normproto
pffmtable
shapetable
unicharset

需要把这些文件重命名为

normal.inttemp
normal.normproto
normal.pffmtable
normal.shapetable
normal.unicharset

然后再执行combine_tessdata normal，就可以得到最终训练的结果，我得到的输出如下，

Combining tessdata files
Output normal.traineddata created successfully.
Version string:5.0.0-alpha-20201224
1:unicharset:size=662, offset=192
3:inttemp:size=132152, offset=854
4:pffmtable:size=103, offset=133006
5:normproto:size=1262, offset=133109
13:shapetable:size=166, offset=134371
23:version:size=20, offset=134537

---------------------------

本文结束，有其他问题再来补充。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tesseract OCR训练时碰到的问题和解决方案的相关文章

使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本

在示例图像中仅作为参考我的图像将具有相同的图案一个页面具有完整的水平文本其他页面具有两个水平文本列如何在python中自动检测文档的模式并逐一读取另一列数据我将 Tesseract OCR 与 Psm 6 一起使用它是水平读取
OCR：图像转文本？

在标记为复制或重复问题之前请先阅读整个问题我目前能做的如下获取图像并裁剪 OCR 所需的部分使用处理图像tesseract and leptonica 当应用的文档被裁剪成块即每个图像 1 个字符时它提供 96 的准确度如果
使用 python 和 opencv 检测图像中的文本区域

我想使用 python 2 7 和 opencv 2 4 9 检测图像的文本区域并在其周围画一个矩形区域就像下面的示例图片所示我对图像处理很陌生所以任何想法如何做到这一点将不胜感激有多种方法可以检测图像中的文本我建议看看这个问题
android ndk-构建错误

我正在尝试为 Android 构建 tesseract 我已将 tesseract 放入示例文件夹中 C Android NDK android ndk r8 samples tesseract之内tesseract我有的文件夹tesser
使用贝叶斯类进行数字识别

我需要编写一个仅用于数字的 OCR 程序我将使用 MNIST 数据集问题是我不知道从哪里开始有很多论文并没有真正解释算法我对模式识别真的了解不多所以我有几个问题 Q1 在哪里可以找到算法或教程 Q2 如何对数字进行分类我不需要
在Python中从pdf中提取印地语编写的文本[重复]

这个问题在这里已经有答案了我想从 pdf 文档中提取印地文输入的文本我已附上示例页面的图像 https i stack imgur com UkT86 jpg我正在处理我尝试使用 pdfminer 从中获取文本但文本是乱码可能是由
为什么 pytesseract 导致 AttributeError: 'NoneType' 对象没有属性 'bands'？

我正在尝试开始使用 pytesseract 但正如你在下面看到的我遇到了问题我发现人们遇到了似乎相同的错误他们说这是 PIL 1 1 7 中的错误其他人说这个问题是由于 PIL 懒惰造成的需要强制 PIL 加载图像im load
Python Tesseract 无法识别这种字体

我有这个图像我想使用 python 将其读取为字符串我认为这并不难我发现了 tesseract 然后是使用 tesseract 的 python 脚本的包装器所以我开始阅读图像效果很好直到我尝试阅读这张图像我是否需要训练它来读
让 tesseract 只识别数字

我正在尝试改进我制作的 OCR 程序来读取我正在使用的某个图像的布局现在我希望我的 OCR 程序只能识别数字 0 9 我尝试遵循问题的解决方案限制 tesseract 正在寻找的字符 https stackoverflow com q
断言失败 - 训练 Tesseract

我正在尝试使用 Serak Tesseract Trainer 训练 tesseract https code google com p serak tesseract trainer https code google com p ser
pytesseract 错误 Windows 错误 [错误 2]

您好我正在尝试使用 python 库 pytesseract 从图像中提取文本请查找代码 from PIL import Image from pytesseract import image to string print image
使用背景校正图像 (Python)

我正在开发一个项目对标签上的文本进行 OCR 操作我的工作是对图像进行倾斜校正使其可以用超正方体读取 I have been using this approach https www pyimagesearch com 2017 0
OCR 扑克牌 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我决定做一个有趣的项目我想将扑克牌的图像作为输入并返回其等级和花色我认为我只需要查看左上角因为那里包含了所有信息它应该是稳健的
用于屏幕文本的 OCR（光学字符识别）

我正在尝试创建一个软件通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别来查找要单击的特定按钮例如我已经有了鼠标和键盘控制部分但现在我需要 OCR 来处理屏幕截图我发现 Tesseract OCR 似乎不能很好地处
从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
如何将 Tesseract 导入 Angular2 (TypeScript)

我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中但是在使用时 import Tesseract from types tesseract js it s
Tess4j - Pdf 到 Tiff 到 tesseract - “警告：分辨率 0 dpi 无效。使用 70 代替。”

我正在使用 tess4j net sourceforge tess4j tess4j 4 4 0 并尝试对 pdf 文件进行 OCR 因此据我了解我必须首先将 pdf 转换为 tiff 或 png 其中有任何建议吗我这样做是这样的 t

随机推荐

注册表

1 概述是微软的一个数据库 xff0c 用于存储系统和应用程序的设置信息参数包括控制windows的启动 xff0c 硬件驱动及windows应用程序的运行非常重要 xff0c 谨慎操作数据结构注册表由键 xff0c 子键 xff
VS以管理员权限打开

描述在VS进行debug的时候 xff0c 会提示使用管理员的权限进行调试经常出现重新打开程序的问题 xff0c 所以干脆将VS直接设置为默认管理员的角色运行 1 找到程序目录 C Program Files x86 Microsoft
ABAQUS仿真结果云图不对称问题

问题描述 xff1a 在某次使用ABAQUS进行冲压仿真的过程中 xff0c 本应产生基本对称的应力应变云图 xff0c 但是结果显示并不对称解决方法 xff1a 设置幅值曲线 ABAQUS幅值曲线介绍在ABAQUS中 xff0c 通过
GreenHills基本操作：调试

1 编译 1 1 整体编译 1 2 编译是否优化选项或 2 调试 2 1 进入调式 2 2 调试下载 2 3 跳转至具体行 2 4 函数调用过程查看 2 5 通过文件树查找指定文件 2 6 快速查看所需函数 xff0c 设置断点
ROS2 humble + windows10，如何安装调试rplidar a1激光扫描传感器

玩ROS一直是在ubuntu xff0c 最近因为各种原因 xff0c 在windows10上调试ROS2 这一典型的问题是 xff0c 很多硬件都是没有库文件的支持 xff0c 国内的很多硬件也大多只支持ROS1 完全不调试源码直接使用各
CloudCompare源码分析_显示渲染的程序架构

这一讲介绍一下CloudCompare的大致绘制流程或者说绘图框架的结构根据前面一篇对CloudCompare读取PLY文件的介绍 xff0c 很容易找出当cloudcompare读取到mesh文件 xff08 newGroup xff0
CloudCompare源码分析_八叉树（Octree）算法基础CC中的八叉树结构

官方参考地址 xff1a CloudCompare octree CloudCompareWiki CC的octree算法主要体现在DgmOctree h和DgmOctree cpp中 xff0c 他采用了一种分级的结构 xff0c 最大支
VisualStudio2019无法正常使用printf或std::cout（卡死）的解决办法

相信很多人碰到过这个问题 xff0c 就是在使用vs2019时 xff0c 即使是一个非常简单的程序 xff0c 如 xff0c include lt stdio h gt int main int argc char args print
cv2.imshow error: The function is not implemented. Rebuild the library with Windows...

在python中调用cv2 imshow xff0c 出现这个一个报错 xff1a cv2 error OpenCV 4 5 5 D a opencv python opencv python opencv modules highgui
PySpark ERROR: Python in worker has different version 3.9 than that in driver 3.8

在wiindows环境下 xff0c 使用PySpark的时候报错 xff1a Python in worker has different version 3 9 than that in driver 3 8 PySpark canno
table()函数--R语言

函数功能 xff1a table uses the cross classifying factors to build a contingency table of the counts at each combination of fa
Qt开发高级进阶：如何在显示时适合视窗宽度和高度(fitWidth+fitHeight)

Qt调整图片的显示高宽做得十分人性化 xff0c 只需要在scene和view中支持鼠标滚动轮即可不过有时候有一些特殊的要求 xff0c 比如 xff0c 如何在视窗内实现适合视察的宽度和高度注意 xff1a 这里是指调整图片的显示大小
在windows上安装 chocolatey.1.1.0.nupkg

这几天外网特别不稳定 xff0c 感觉都快没法编程了正好昨天又新装了一个操作系统 xff0c 一大堆软件等着要装所以本来是个挺顺利的事 xff0c 非得折腾一圈才能成功首先是 xff0c 官方已经说明了如何安装choco xff0c
ROS2 error: can‘t find examples_rclcpp_minimal_subscriber/Release/wait_set_subscriber_library.lib

Windows10 43 ROS2 humble刚配置好 xff0c 老规矩 xff0c 跑一下ros2 examples xff0c 完整的教程在这里 xff0c Using colcon to build packages ROS 2
ROS2 ERROR: OpenGL 1.5 is not supported in GLRenderSystem::initialiseContext at C:\ci\ws\build...

首先说明一下 xff0c 这是一个意料之外的错误 xff0c 因为是新安装的系统 xff0c 由于驱动程序没安装好 xff0c 引起的一系列问题运行rviz2 xff0c 然后报出一大堆错误 xff0c 为了不影响正文 xff0c 我列
ROS2进阶：在windows10上用vs2019编译rviz2

首先给出重点 xff0c 打开vs2019的命令窗口 xff0c gt call C dev ros2 humble local setup bat gt mkdir p d vROS2 rviz2 ws src gt cd d vROS2
VSCODE在Jetson Nano上打不上断点，无法调试python源码

在Jetson Nano上玩Python开发 xff0c 我习惯使用vscode作为开发环境 xff0c 然后发现无法使用vscode进行调试首先是调整launch json里面的内容 xff0c 34 justMyCode 34 fal
Jetson Nano上jtop（jetson_stats.service）不能运行

刚拿到的Jetson Nano开发板上 xff0c jtop指令无法运行 xff0c jtop I can 39 t access jetson stats service Please logout or reboot this boar
ROS2报错：SetuptoolsDeprecationWarning: setup.py install is deprecated. Use build and pip and other...

因为一直用c 43 43 xff0c 所以对ROS 43 python的调试相对较少 xff0c 今天碰到一个用python玩的项目 xff0c 发现报错 xff0c SetuptoolsDeprecationWarning setup p
Tesseract OCR训练时碰到的问题和解决方案

关于如何用Tesseract OCR训练我就不重复了 xff0c 大家可以直接参考下面的案例 xff0c 使用tesseract训练自己的字库提高识别率 SeventhBlue的博客 CSDN博客 tesseract训练自己的字库 OCR

Tesseract OCR训练时碰到的问题和解决方案

Tesseract OCR训练时碰到的问题和解决方案 的相关文章

随机推荐

热门标签

Tesseract OCR训练时碰到的问题和解决方案的相关文章