利用OCR识别图像中的英文和文字

2023-05-16

一、Tesseract—OCR简介

将图片翻译成文字一般称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR的底层并不多,目前很多库都是实用共同的几个底层OCR库,或者是在上面进行定制。
Tesseract是一个OCR库,目前由Google赞助。Tesseract是目前公认最优秀、最精确的开源OCR系统

二、下载

https://digi.bib.uni-mannheim.de/tesseract/

1.尽量不要下载dev(开发中的版本),alpha(内部测试版,一般不向外部发布,会有很多Bug),beta(公测版本,即针对所有用户公开的测试版本)等版本。

2.建议下载最新稳定版本:
tesseract-ocr-w64-setup-v5.0.1.20220118.exe
下面进行傻瓜式安装
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、下载pytesseract库

在anaconda里面进行安装,然后直接使用anaconda环境就可以。在这里插入图片描述

四、识别英文

#导入PIL,pytesseract库
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'D:\Python\tesseract.exe'

#读取待识别的图片
image = Image.open("7.jpg");
#将图片识别为英文文字
text = pytesseract.image_to_string(image)
#输出识别的文字
print(text)

下面是“7.jpg”文件
请添加图片描述
下面是运行结果
在这里插入图片描述

五、识别中文

tesseract默认安装可能不带中文简体识别包,需要额外下载。
在github中直接搜索tesseract,下载tessdata文件到Tesseract安装文件中,
,下载

#导入PIL,pytesseract库
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'D:\Python\tesseract.exe'

#读取待识别的图片
image = Image.open("8.jpg");
#将图片识别为英文文字
text = pytesseract.image_to_string(image, lang='chi_sim')
#输出识别的文字
print(text)

下面是“8.jpg”文件
请添加图片描述
下面是识别结果
在这里插入图片描述

六、如何识别单个字符

运行过上面代码的同学,如果把输入图像换为单个字母或者文字的图像就会输出失败,例如下面的图片,这里是因为OCR是用作识别多文字的情景,使用单个文字会被认为是图片,就会自动跳过。
请添加图片描述
在这里插入图片描述
这里怎么解决呢
改为如下代码

#导入PIL,pytesseract库
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'D:\Python\tesseract.exe'

#读取待识别的图片
image = Image.open("9.jpg");
#将图片识别为英文文字
cong = r'--psm 10'
text = pytesseract.image_to_string(image, config=cong)
#输出识别的文字
print(text)

添加

cong = r’–psm 10’

text = pytesseract.image_to_string(image, config=cong)

就可以输出了
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

利用OCR识别图像中的英文和文字 的相关文章

  • 从 pdf 中提取表格

    我正在尝试从这个表中获取数据PDF https www dropbox com s y3nivxhjvvzva7d test1 pdf dl 0 我尝试过 pdfminer 和 pypdf 运气不错 但我无法真正从表中获取数据 This i
  • Python、pyPdf、Adobe PDF OCR 错误:不支持的过滤器 /lzwdecode

    我的东西 python 2 6 64 位 安装了 pyPdf 1 13 win32 exe 翼IDE Windows 7 64 位 我收到以下错误 NotImplementedError 不支持的过滤器 LZWDecode 当我运行以下代码
  • 在 tesseract C++ API 中禁用字典辅助 OCR

    我有一个应用程序 其中使用 tesseract API 对技术数据表进行 OCR 处理 我这样初始化它 tesseract TessBaseAPI tess tess Init NULL eng tesseract OEM TESSERAC
  • 对抗锯齿文本进行 OCR

    我必须从 PDF 文档中 OCR 表格 我编写了简单的 Python opencv 脚本来获取单个单元格 之后新的问题又出现了 文本已抗锯齿且质量不佳 tesseract 的识别率很低 我尝试过使用自适应阈值来预处理图像 但结果并没有好多少
  • PHP/jQuery/JavaScript 中的免费 OCR 处理 API [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 是否有任何免费的 PHP OCR API 在 PHP jQuery 或 JavaScript 中有详细
  • 描边宽度变换 (SWT) 实现(Java、C#...)[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我最近发现了笔划宽度变换 如以下研究论文中所述 使用笔划宽度变换检测自然场景中的文本 https ie
  • java中pdf解析为文本

    我有一个阿拉伯语 PDF 我想使用 Java 将其解析为文本文档 我已经尝试了很多次 英语单词解析成功 但阿拉伯语单词解析失败 谁能推荐一个可以正确转换阿拉伯语单词的解决方案 我想到了几个图书馆 阿帕奇蒂卡 http tika apache
  • 如何在 OCR 中区分斜线零和八 (0->8)

    我正在为我的 Android 应用程序使用 ML Kit for Firebase ReCalc 收据计算器 https play google com store apps details id info trekto receipts
  • 超正方体的替代方案

    Python 或 OpenCV 中是否有替代软件或任何库可以替代 Tesseract 进行字符识别 有什么建议的可以用Python实现的字符识别方法吗 Thanks This site https github com kba awesom
  • 使用 Google App Script 从 google 驱动器中进行 OCR 图像

    我已经实现了以下脚本 使用图像 URL 对单个和多个图像进行 OCR function doOCRALL var selected SpreadsheetApp getActiveSheet getActiveRange getValues
  • Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

    我正在尝试使用 python 创建实时 OCRmss and pytesseract 到目前为止 我已经能够捕获整个屏幕 其 FPS 稳定为 30 如果我想捕获大约 500x500 的较小区域 我已经能够获得 100 FPS 然而 一旦我包
  • 使用 OCR 识别上标字符

    我已经开始了一个简单的项目 其中它必须获取包含带有上标的文本的图像 然后通过使用 OCR 目前我使用的是 tesseract 它必须识别上标字符 普通字符 例如 我们有一个化学方程式 例如 Cl 但是当我使用超立方体识别它时 它给出了 Cl
  • 在Python中从pdf中提取印地语编写的文本[重复]

    这个问题在这里已经有答案了 我想从 pdf 文档中提取印地文输入的文本 我已附上示例页面的图像 https i stack imgur com UkT86 jpg我正在处理 我尝试使用 pdfminer 从中获取文本 但文本是乱码 可能是由
  • 使用 OpenCV 对 Tesseract OCR 进行图像预处理

    我正在尝试开发一个应用程序 它使用 Tesseract 来识别手机摄像头拍摄的文档中的文本 我使用 OpenCV 来预处理图像以实现更好的识别 应用高斯模糊和阈值方法进行二值化 但结果非常糟糕 Here https s6 postimg c
  • 图像中的文本检测

    I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
  • Python Tesseract 无法识别这种字体

    我有这个图像 我想使用 python 将其读取为字符串 我认为这并不难 我发现了 tesseract 然后是使用 tesseract 的 python 脚本的包装器 所以我开始阅读图像 效果很好 直到我尝试阅读这张图像 我是否需要训练它来读
  • OCR 解析获取复选框或单选按钮值

    I need to parse OCR image file and get all texts and checkbox values How to get Checkbox or Radio Button value from OCR
  • 用于屏幕文本的 OCR(光学字符识别)

    我正在尝试创建一个软件 通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别 来查找要单击的特定按钮 例如 我已经有了鼠标和键盘控制部分 但现在 我需要 OCR 来处理屏幕截图 我发现 Tesseract OCR 似乎不能很好地处
  • TensorFlow:训练时参数不更新

    我正在使用 TensorFlow 实现分类模型 我面临的问题是 当我运行训练步骤时 我的权重和误差没有更新 结果 我的网络不断返回相同的结果 我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
  • 如何将 Tesseract 导入 Angular2 (TypeScript)

    我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中 但是在使用时 import Tesseract from types tesseract js it s

随机推荐