带有 Tesseract 的空字符串

2023-11-24

我正在尝试从一个大文件中读取不同的裁剪图像，并且我设法读取了其中的大部分图像，但是当我尝试使用超正方体读取它们时，其中一些图像会返回空字符串。

代码就是这一行：

pytesseract.image_to_string(cv2.imread("img.png"), lang="eng")

我可以尝试什么来阅读这些图像吗？

提前致谢

Edit:

在将图像传递给之前对其进行阈值处理pytesseract提高准确性。

import cv2
import numpy as np

# Grayscale image
img = Image.open('num.png').convert('L')
ret,img = cv2.threshold(np.array(img), 125, 255, cv2.THRESH_BINARY)

# Older versions of pytesseract need a pillow image
# Convert back if needed
img = Image.fromarray(img.astype(np.uint8))

print(pytesseract.image_to_string(img))

这个打印出来的

5.78 / C02

Edit:仅对第二张图像进行阈值返回11.1。另一个有帮助的步骤是设置页面分割模式到“将图像视为单个文本行”。与配置--psm 7。在第二张图像上执行此操作会返回11.1 "202 '，引号来自顶部的部分文本。要忽略这些，您还可以通过配置设置要使用白名单搜索哪些字符-c tessedit_char_whitelist=0123456789.%。一切都在一起：

pytesseract.image_to_string(img, config='--psm 7 -c tessedit_char_whitelist=0123456789.%')

这返回11.1 202。显然 pytesseract 在使用百分比符号时遇到了困难，我不确定如何通过图像处理或配置更改来改进它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

OCR

Tesseract

pythontesseract

带有 Tesseract 的空字符串的相关文章

是否有与 Java 的 IdentityHashMap 等效的 Python 版本？

我正在遍历一个数据结构想要构建一个映射 X gt Y 的字典其中 X 是我正在遍历的数据结构中的一个字段 Y 是我正在动态构建的数据结构中的一个字段 X 是不可散列的类型 Java的IdentityHashMap的目的是模拟动态字段由
Pandas 中的索引如何工作？

我是Python新手这似乎是一个需要问的基本问题但我真的很想了解这里发生了什么 import numpy as np import pandas as pd tempdata np random random 5 myseries on
Python：如何使用 f 字符串进行数学运算

我正在尝试使用 python 3 6 的新 f 字符串功能编写自己的 99 瓶啤酒实现但我被困住了 def ninety nine bottles for i in range 10 0 1 return f i bottles of b
Python Pandas：返回连续缺失的工作日日期并为数据框中缺失的日期分配比率

Dates rates 7 26 2019 1 04 7 30 2019 1 0116 7 31 2019 1 005 8 1 2019 1 035 8 2 2019 1 01 8 6 2019 0 9886 8 12 2019 0 965
IP保持不变

我正在尝试通过代码连接到 Tor 并更改我的身份到目前为止我得到的结果是我连接成功但无法更改我的身份这是我的代码 import socket import socks import httplib def connectTor sock
pythonic方式来反转一个字典，其中值是列表？

我有一本看起来像这样的字典 letters by number 1 a b c d 2 b d 3 a c 4 a d 5 b c 我想将其反转为如下所示 numbers by letter a 1 3 4 b 1 2 5 c 1 3 5
为什么del是Python中的指令而不是方法？ [复制]

这个问题在这里已经有答案了为什么Python的创建者更喜欢这种语法指令 del list index 超过这个方法 list del index 在我看来这del属于同一类别 append remove find ETC 因此应该
Plotly：如何制作具有多条线和标准差阴影区域的图形？

How can I use Plotly to produce a line plot with a shaded standard deviation I am trying to achieve something similar to
到底什么是序列？

蟒蛇docs https docs python org 3 glossary html term sequence有点模棱两可 sequence 一个可迭代对象支持通过以下方式使用整数索引进行有效的元素访问 getitem 特殊方法并定
Panda如何将行分组到不同的时间桶中？

我有一个带有名为时间戳的日期时间类型列的数据帧我想根据时间部分的时间戳将数据帧拆分为多个数据帧每个数据帧包含按其值模 x 分钟进行值的行其中 x 是变量请注意e and f不按原来的顺序以 10 分钟为模我希望所有时间都以3在一
查找提供的 Sum 值的组合

我有一系列这样的数字 myvar 57 71 87 97 99 101 103 113 114 115 128 129 131 137 147 156 163 186 现在我想计算所有这些可能的组合长度为1到20 其总和等于给定的数字m
Scrapy规则如何与爬行蜘蛛一起工作

我很难理解 scrapy 爬行蜘蛛规则我有一个例子它并不像我希望的那样工作所以它可能是两件事我不明白规则是如何运作的我形成了不正确的正则表达式导致我无法获得所需的结果好吧这就是我想做的我想编写爬行蜘蛛它将获取所有可用的统
rpy2 传递 python 保留关键字参数

我试图通过 python 使用 r 的密度函数并且必须将 from to 参数传递给密度函数然而由于 from 这个词是Python中的保留关键字我该如何实现这一点呢谢谢这是到目前为止的代码 r density robjects
HTML 和 BeautifulSoup：当结构事先不知道时如何迭代解析？

我从一个简单的 HTML 结构开始如下所示感谢 alecxe 的帮助我能够创建这个 JSON 字典 u Outer List u Inner List u info 1 u info 2 u info 3 使用他的代码 from bs
如何将字符串转换为二进制？

我需要一种方法来获取 python 中字符串的二进制表示形式例如 st hello world toBinary st 是否有一个模块可以以某种巧妙的方式执行此操作像这样的东西吗 gt gt gt st hello world gt g
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
打开 PDF 到书签/指定目标？

我正在尝试使用 python 打开特定书签的 PDF 到目前为止我可以在命令提示符中运行以下命令并得到我想要的 last是 PDF test pdf 中指定目的地的名称 C Program Files x86 Adobe Reader 1
为文件中的每个单词创建字典并计算其后面的单词的频率

我正在尝试解决一个难题却迷失了方向这就是我应该做的 INPUT file OUTPUT dictionary Return a dictionary whose keys are all the words in the file br
Pytorch RuntimeError：张量 a (4) 的大小必须与非单维 0 处张量 b (3) 的大小匹配

我使用的代码来自here https www learnopencv com image classification using transfer learning in pytorch 训练模型来预测印刷样式编号0 to 9 idx t
Django ALLOWED_HOSTS 与 CORS(django-cors-headers)

ALLOWED HOSTS 和 CORS 之间有什么区别如果我定义了 ALLOWED HOSTS 我还需要定义 CORS 吗我没有使用 django 模板我也有可能动态定义这两个吗我认为没有我使用 django 作为后端并在不同

随机推荐

gpus_ReturnGuiltyForHardwareRestart 崩溃

应用程序在presentFrameBuffer中崩溃在前台运行时没有发生中断它没有在第一帧中崩溃它绘制了一段时间然后突然崩溃我没有具体的重现步骤但似乎与绘制特定的内容有关但我仍然没有通过应用程序报告 openGL 错误包括在
x86 BSWAP 指令 REX 不遵循 Intel 规范？

我一直在使用 NASM 和 GAS 汇编和反汇编 BSWAP x64 指令并且都汇编指令BSWAP r15 as 490FCF以十六进制表示反汇编器也将其反汇编为相同的指令指令的 REX 前缀 49 因此设置了 REX W 位位
导出到 Excel 时，SSRS 不支持 CanGrow 属性

我在 SSRS 报告中有一个表表格单元之一包含订单中零件的描述这些描述的长度可能会有所不同因此我将 CanGrow 属性设置为 True 当我尝试将报告导出到 Excel 时我希望如果文本长度超过单元格的宽度那么单元格的高度将会增
$(window) 绑定 hashchange 如何检查部分哈希更改？

我在学习Google Ajax Crawlable I use window bind hashchange控制ajax页面加载我的网址如下 domain com keywords num 1 有两种改变 domain com apple
在 OpenGLES 中让精灵正确面对相机

我有一款或多或少是 2D 的游戏但以 3D 渲染摄像机悬停在 2D 游戏场上方与完全垂直的角度倾斜约 20 度从而为其提供一点 3D 视角我有一些精灵需要渲染为完美的正方形因为它们代表球形物体我的第一种方法将四边形渲染在 2D
STL - 以下代码有什么问题？

include stdafx h include
PDF 到 Github 风格的 Markdown

我有一个 PDF 格式的项目描述如果我能以某种方式设法在 github 网站上预览它而不是单击查看原始数据并下载它我会非常高兴我以为可能有一个从 pdf 到 github 风格的 markdown 的转换器但没有找到再次声明
字典应用程序的数据库设计

目前我想开发移动设备的词典应用程序词典本身使用离线文件数据库来翻译单词它只翻译两种语言例如英语西班牙语词典我脑子里有一个简单的设计这将是两个表英语表和西班牙语表每个表包含 word id id 它将作为其他表的外键词词
重命名 cassandra 集群名称 1.2.6 时出错

我在具有单个节点的集群中使用 cassandra 1 2 6 我正在尝试使用以下说明重命名集群 Cassandra 集群名称不匹配完成所有步骤后当我更改 cassandra yaml 文件后启动 cassandra 时我继续出现相同的
matplotlib 再次显示图形

使用 matplotlib 时 from matplotlib import pyplot as plt figure plt figure ax figure add subplot 111 ax plot x y figure show
废弃的命名信号量未释放

当 C 程序持有命名信号量时当应用程序提前终止例如按 Ctrl C 或关闭控制台窗口时它似乎不会被释放至少在该进程的所有实例都终止之前不会对于命名互斥体在这种情况下会引发 AbandonedMutexException 但对于
如何让 Subversion（或任何程序）执行定期提交？

我想配置我的计算机以便每半小时自动提交我正在处理的程序我正在使用 svn 存储库因此即使它只是一个每 30 分钟运行一次 svn ci 的脚本也没关系问题是我不知道该怎么做有人可以告诉我或者指导我去做一些事情让我让这个定期提交
在新选项卡中打开链接[重复]

这个问题在这里已经有答案了我为我正在做的一个项目创建了一个网站网站内容中有一些可以访问的外部网页的链接同时当用户单击其中一个链接时他将被带到指定的链接并且他将不再位于当前页面上我想要做的是当用户单击链接时单击的链接中的指定
如何确保 Rails API 免受 CSRF 的保护？

我一直在使用 REST API 开发 Rails 应用程序以便从移动应用程序进行访问它运作得很好当用户从移动应用程序登录时他会得到auth token他在将来的 API 请求中使用它问题是 API 也可以通过路径 api v1 从
python - 创建数据透视表

我正在尝试从 python 中的 Numpy 数组创建数据透视表我做了很多研究但找不到直接的解决方案我知道你可以用 Pandas 来做到这一点但我在安装它时遇到了麻烦但一定有一种方法可以在没有 Pandas 的情况下做到这一点我
cakephp 在数据源默认值中找不到模型表

我的数据库中只有一个名为 ficha seg 的表我的模型文件的名称是 Ficha php 控制器的名称是 FichasController php 那么为什么我收到错误 Error Table fichas for model Fic
使用指针迭代 argv[]

我想使用以下代码但不使用索引数组并用指针替换它 for int i 0 i lt argc i for int j 0 argv i j 0 j code 我知道您可以使用指针来遍历数组但我不确定如何使用第二个数组中未定义的长度在本
Spark MLLib Kmeans 来自数据帧，然后再次返回

我的目标是使用 Spark 1 3 1 MLLib 将 kmeans 聚类算法应用于非常大的数据集我已经使用 Spark 中的 hiveContext 调用了 HDFS 中的数据并且最终希望以这种方式将其放回原处以这种格式 I D c
获取 Qt Widget 的变量名称（用于样式表）？

在我的应用程序中用户单击程序的任何小部件当时处于休眠状态并为其选择颜色然后该颜色将被添加到该特定小部件的样式表中但是当程序结束并再次启动时我希望该特定小部件保留其样式表我不想在每个小部件的样式表中进行硬编码事实上我什至
带有 Tesseract 的空字符串

我正在尝试从一个大文件中读取不同的裁剪图像并且我设法读取了其中的大部分图像但是当我尝试使用超正方体读取它们时其中一些图像会返回空字符串代码就是这一行 pytesseract image to string cv2 imread im

带有 Tesseract 的空字符串

带有 Tesseract 的空字符串 的相关文章

随机推荐

热门标签

带有 Tesseract 的空字符串的相关文章