烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata

2024-03-15

我遇到了这个错误，这让我对 tesseract 的 python 包装器有点疯狂，这是一个名为 tesseract 的 python 模块。

这是我尝试运行的 python 代码：

img = cv2.imread(image, 0)
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)
tesseract.SetCvImage(img,api)
url = api.GetUTF8Text()
conf=api.MeanTextConf()
print('Extracted URL : ' + url)
api.End()

这就是我得到的：

Error opening data file ./tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!

我不明白为什么要这样做，因为我已将 TESSDATA_PREFIX 环境变量正确设置为我的超立方体安装的正确路径（带有尾部斜杠）。

当我尝试直接从 powershell 运行 Tesseract 时（顺便说一句，我在 Windows 7 上），通过执行以下操作：

 tesseract.exe .\data\test.tif -psm 7 out

它就像一个魅力！另外，当我在 python 脚本中使用 Popen 调用 Tesseract 时，它工作正常，但我不喜欢我无法直接从标准输出获取 OCR 文本的想法。事实上，除了向 Tesseract 提供输出文件名，然后 fopen 并从该文件中读取之外，似乎没有其他选择。我觉得仅仅为了获得 OCR 的输出而处理临时文本文件会非常糟糕......

Help?

第一个参数为api.Init应该是 TESSDATA_PREFIX。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Tesseract

烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata 的相关文章

在 Python 中处理单值元组的最佳实践是什么？

我正在使用第三方库函数它从文件中读取一组关键字并且应该返回一个值的元组只要有至少两个关键字它就能正确执行此操作但是在只有一个关键字的情况下它返回一个原始字符串而不是大小为 1 的元组这是特别有害的因为当我尝试做类似的事情
在 Python 3.6 中，为什么负数的分数次方在 numpy 数组中返回 nan？

我最近开始学习Python 并且经历了NumPy 官方快速入门指南 https docs scipy org doc numpy dev user quickstart html indexing slicing and iterating
Python动态导入脚本，需要有其__name__ == "__main__"代码才能被调用

当从另一个脚本导入 python 脚本时我想要受经典保护的脚本代码 if name main 要运行我怎样才能运行该代码我想做的是从 python 脚本动态更改模块然后导入现有脚本该脚本应该看到所做的更改并运行其 main 像Py
Python 将列表中的字符串转换为数字

我遇到了以下错误消息以 10 为基数的 int 的文字无效 2 2 外部用单引号括起来内部用双引号括起来该数据位于primes列出使用print primes 0 样本数据在primes list 2 3 5 7 The primes
计算温度的偏导数（温度的水平平流）

我想知道哪种方法计算x和y方向温度的偏导数温度的水平平流最正确第二个代码使用温度纬向风和经向风的数据矩阵提取温度 T 纬向风分量 u 和经向风分量 v 的数据 import matplotlib pyplot as plt imp
Python中使用cv2获取当前视频播放位置

我正在尝试使用 CV2 和 Python 从播放视频中获取当前播放时间位置如果可能以毫秒为单位目前我正在使用此示例代码来播放视频文件 import cv2 import numpy as np file name 2 mp4 wind
如何在 pygame 中聚焦光线或如何仅绘制窗口的某些圆形部分？

对于这一点如果您熟悉它请想想超级马里奥制造2 中嘘关卡中的黑暗模式我试图在角色周围创建一个圆形聚光灯这也将使圆圈范围内的任何内容都可见例如部分站在地板上敌人或场景中的任何其他物体我的计划是首先绘制圆圈聚光灯然后绘制场景
如何最好地将包含列表或元组的 Pandas 列提取到多个列中[重复]

这个问题在这里已经有答案了我不小心用错误重复的链接关闭了这个问题这是正确的 Pandas 将列表的列拆分为多列 https stackoverflow com questions 35491274 pandas split column
在 (i)python 脚本中从 jupyter 内核获取输出

我想从单个 ipython 会话中打开多个内核在这些内核上运行代码然后收集结果但我不知道如何收集结果甚至不知道如何查看 stdout stderr 我怎样才能做这些事情呢到目前为止我所得到的我已经使用如下代码管理了前两个步骤打
Python3.1中的视图？

Python3 1中的视图到底是什么它们的行为方式似乎与迭代器类似并且它们也可以具体化为列表迭代器和视图有何不同据我所知视图仍然附加到创建它的对象上对原始对象的修改会影响视图来自docs http docs python or
如何在树莓派上更新到最新的 python 3.5.1 版本？

我昨天拿到了 Raspberry Pi 我已经在尝试用它来编写代码了我有一个计划在其上运行的程序但它仅与 Python 版本 3 5 0 或 3 5 1 兼容并且我在互联网上找到的所有内容似乎都已经过时与 Python 2 有关或
多线程写入文件

前几天刚开始使用 python 对多线程的整个概念还很陌生我在多线程时写入文件时遇到问题如果我按照常规方式执行此操作它会不断覆盖正在写入的内容使用 5 个线程写入文件的正确方法是什么不降低性能的最佳方法是在所有线程之间使用队列每
import numpy 和 import numpy as np 之间的区别

我明白如果可能的话应该使用 import numpy as np 这有助于避免由于命名空间引起的任何冲突但我注意到虽然下面的命令有效 import numpy f2py as myf2py 以下不 import numpy as np
Python 类方法的示例用例是什么？

我读了Python 中的类方法有什么用 https stackoverflow com questions 38238 what are class methods in python for但那篇文章中的例子很复杂我正在寻找 Pytho
如何从python导入路径中删除当前目录

我想使用 Mercurial 存储库hg本身也就是说我克隆了 Mercurialhttps www mercurial scm org repo hg https www mercurial scm org repo hg并想运行一些h
Python列表问题

我在使用 python 列表时遇到问题简化版本是 mylist1 some items in a list mylist2 mylist1 mylist1 pop i mylist insert i item print mylist1
Python pip 安装错误 [SSL: CERTIFICATE_VERIFY_FAILED]

我已经尝试解决这个问题有一段时间了由于某种原因我陷入了 ssl 问题并且不知道发生了什么问题我已经安装了 python2 7 和 easy install2 7 但是当尝试使用 easy install2 7 安装 pip 时出
将 pandas 数据框中的多列更改为日期时间

我有一个 13 列和 55 000 行的数据框我正在尝试将其中 5 行转换为日期时间现在它们返回类型对象我需要转换这些数据以进行机器学习我知道如果我这样做 data birth date pd to datetime data b
Tensorflow ctc_loss_calculator：找不到有效路径

当运行我的神经网络双向 LSTM 进行音频识别时我使用连接主义时间分类 CTC 但在某些时候训练网络时我几乎每批都会收到来自 Tensorflow 的警告 W tensorflow core util ctc ctc loss cal
PyQt QFileDialog exec_ 很慢

我正在使用自定义QFileDialog因为我想选择多个目录但是exec 功能非常慢我不明白为什么我正在使用最新版本的 PyQt 代码片段 from PyQt4 import QtGui QtCore QtNetwork uic cla

随机推荐

如何在android中获取两个位置之间的直线距离？

首先仔细阅读问题 I need 直线距离不步行开车 or etc 看看下面给出的这张图片谷歌为我们提供了驾车和驾车的距离但我不想要它我想要直线距离两个位置之间纬度经度显示为红线 NOTE 我不想在谷歌地图上画红线只是想要距
在 iOS SDK 中手动选择视频质量的 HLS 流媒体 - AVPlayer？

我们已经使用 AVPlayer 实现了 HLS 流媒体 fileURL NSURL URLWithString https devstreaming cdn apple com videos streaming examples img b
目标环境不支持动态 import() 语法，因此无法在脚本中使用外部类型“模块”

我刚刚创建了一个反应应用程序这npm start似乎工作正常但是npm run build不断失败我需要跑npm run build将其部署到某个网站上已经浏览了与此相关的所有帖子stackoverflow com 但没有找到任何可行
语句之间如何使用逗号运算符？

逗号运算符的描述说当您想要在需要单个表达式的位置包含多个表达式时可以使用逗号运算符并且语法和参数也表明它的操作数应该是表达式 Syntax 表达式1 表达式2 表达式3 参数 expr1 expr2 expr3 任何表情我想知道为什
在控制器中使用什么来代替 getRequest()->get(...)

最近我浏览了 symfony2 api 文档这是我在 Request 的文档中找到的内容get http api symfony com 2 0 Symfony Component HttpFoundation Request html
当不跟随特定字符 (?) 时，如何使用正则表达式来匹配字符 (')？

如何编写正则表达式模式来按特定分隔符分割字符串只要字符串前面没有问号我编写了一个解析器它将 EDIFACT 消息拆分为段复合体和元素但在 EDI 标准中问号是转义字符所以要分割这个字符串 PRI 2 005 1 9022 5
防止浏览器缓存 JavaScript 文件的更好方法

这就是我们防止浏览器缓存 JS 和 CSS 文件的方法这看起来有点hacky 有更好的方法吗
Reactjs和mongoose无限滚动实现问题

最终结果需要排序并在结果顶部显示到达广告并且在滚动窗口而不单击按钮时获取更多结果我刚刚添加了加载更多按钮进行测试现有的实现不会在结果顶部显示 reach up ads 并且在单击加载更多按钮时两次加载相同的数据前端 use
如果系统命令/反引号中的脚本失败，则主脚本需要退出状态！=0

Code of inter pl is use strict use warnings my var1 cat gra def ment ckfile txt ckfile txt doesn t exist print Hello Wor
如何克隆 TypeScript 对象数组？

我尝试了这种方法 this plans this plansCopy this plans 似乎它不起作用导致返回重复展开运算符返回数组的各个项目如果这些已经是对象那么它返回参考到那些物体这是创建新数组的部分因此你有一个新的数
如果可以使用 JZMQ，为什么还需要 JeroMQ？

简单的问题为什么在 Java 上移植 zmq 并将其称为 JeroMQ 是个好主意 JeroMQ是ZeroMQ社区的官方项目它是 C libzmq 库的完整移植支持 3 2 版本优点纯Java 因此无需通过JNI链接C C 这对
使用 Bitbucket 团队存储库配置 Android Studio

我正在尝试配置 Android Studio 以与 Bitbucket 上的团队存储库配合使用我首先想做的是将我的本地项目推送到我团队的存储库中我已经安装了 Bitbucket 插件但不知道从哪里开始当我尝试提交更改时我得到的只是
cytoscape：改变第二轴出租车分支的长度

I want to create a tree with different branch lengths looking like this Is there a possibility of assigning a length to
省略 yui 数据表中的文本

嘿我正在寻找一种在 yui 数据表中省略文本的好方法我的意思是格式化文本使其能够很好地适合其单元格并且如果文本必须被截断则在其后面有一个椭圆我想在不使用 CSS 选择器的情况下执行此操作因为我有一个很大的数据集并且按类名选
Worker 启动失败 CSINodeIfo：更新 CSINode 注释时出错

2个月前我创建了一个kubernetes集群1个master和2个worker节点今天一个工作节点开始出现故障我不知道为什么我认为我的工人没有发生任何异常情况我使用 flannel 和 kubeadm 创建集群并且运行良好如果我
关于 Integer.parseInt() 和强制转换的 Java 初学者问题

所以当像下面的声明一样进行铸造时 int randomNumber int Math random 5 它会导致随机数生成以转换为 int 还有一个我刚刚遇到的 Integer parseInt 方法它的作用相同即返回一个整数为什么
数据中的是什么？

我使用OCaml版本4 02 3 我定义了一个类型self type self Self of self type self Self of self 及其实例s let rec s Self s val s self Self
如何在 github actions 工作流程 ci 中通过 npm 安装私有 github 存储库

我正在尝试通过运行在 github 工作流程 ci 中安装 npm 依赖项npm install 但是我收到以下错误 npm ERR Error while executing npm ERR usr bin git ls remote h
计算列中的位数

这是我的代码 select len cast code as float code from tbl1 where code is not null 这是输出我想要代码栏中的位数我不明白为什么最后一个算12而不是8 将其投射为int反而
烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata

我遇到了这个错误这让我对 tesseract 的 python 包装器有点疯狂这是一个名为 tesseract 的 python 模块这是我尝试运行的 python 代码 img cv2 imread image 0 api tess

烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata

烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata 的相关文章

随机推荐

热门标签