OCR

从 pdf 中提取表格

我正在尝试从这个表中获取数据PDF https www dropbox com s y3nivxhjvvzva7d test1 pdf dl 0 我尝试过 pdfminer 和 pypdf 运气不错但我无法真正从表中获取数据 This i

python python27 OCR pdfminer pdfparsing

从图像中提取数字

I have an image for mobile phone credit recharge card and I want to extract the recharge number only the gray area as a

imageprocessing OCR imagesegmentation

使用 OCR python 读取图像上的数字

我正在尝试使用 Python 和 tesseract 中的 OpenCV 提取图像上的数字这是我的尝试但我什么也没得到该代码没有返回预期的数字 import fitz pytesseract os re import cv2 sTem

python opencv ImageMagick OCR Tesseract

对齐 OCR 文本

我正在根据历史记录创建一个数据库这些历史记录是我从书籍中拍摄的页面 100K 页在对每个页面进行 OCR 之前我编写了一些 python 代码来进行一些图像处理由于这些书中的数据没有采用格式良好的表格因此我需要将每个页面分为行和列

python imageprocessing OCR

Tesseract 混淆两个数字

我正在编写一个应用程序来扫描图像中的数字这些数字使用 OCR B 字体并且还可能包含 and gt 人物这是我的源图像即使将字符集限制为上述字符使用 Tesseract 的扫描效果也不是很好由于我没有找到 Tesseract 的

OCR Tesseract

OCR应用前的图像清理

过去几个小时我一直在尝试 PyTesser 它是一个非常好的工具关于 PyTesser 的准确性我注意到以下几点包含图标图像和文本的文件准确度 5 10 仅包含文本的文件已删除图像和图标准确率 50 60 拉伸文件这是最好的

python imageprocessing OCR

向 Tesseract eng.traineddata“添加”新字体

据我所知 Tesseract 3 x 附带了 6 种英文字体如果我错了请纠正我我需要训练 Tesseract 来支持 5 种以上的字体我只需要大写字母和数字没有特殊字符或符号我遵循了各种流程例如向 Tesseract 3 O

python OCR Tesseract

使用 OpenCV 和 Tesseract 的摩洛哥车牌识别 (LPR)

我正在开展一个关于识别摩洛哥车牌的项目如下图所示摩洛哥车牌请问我如何使用 OpenCV 切出车牌并使用 Tesseract 读取中间的数字和阿拉伯字母我研究过这篇研究论文 https www researchgate net pub

opencv OCR Tesseract imagerecognition

通过图像中的边界框提取选定的文本

我正在尝试通过图像上的边界框获取选定的文本就像如果仅通过边界框选择单词一样我想获取该文本并将其转换为文本文件请查看我的代码并进行一些审查以便我可以实现该功能到目前为止我已经将 PDF 文件转换为在文本上带有边框的图像 impor

python OCR opencv pythontesseract

在 R Shiny 中使用并行 foreach 制作进度条

我正在尝试添加一个进度条ocr data 在 for 循环中但是当串联使用时该过程非常慢我正在尝试利用并行来加快生成表的过程ocr data x 代码粘贴在这里 ui lt fluidPage Application title ti

r foreach parallelprocessing shiny OCR

“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果

我正在设置language model penalty non dict word通过 Tesseract 3 01 的配置文件但其值没有任何效果我尝试过使用多个图像及其多个值但每个图像的输出始终相同另一位用户也注意到了同样的情况在

commandline OCR Tesseract

Open-CV - 未正确加载

我正在使用 Ubuntu 14 04 我正在尝试编译此代码但无论如何我都会收到这些错误我相信这与包含 OpenCV 库有关但我不确定有人可以帮我吗错误 main cc 66 37 错误 CV RETR EXTERNAL 未在此范围

c opencv imageprocessing OCR Tesseract

车辆牌照检测有哪些好的算法？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案背景对于我在大学的期末项目我正在开发一个车辆牌照检测应用程序我认为自己是一名中级程序员但是我的数学知识缺乏中学以上的知识这使

c image ComputerVision OCR objectdetection

使用 OCR 识别的文本去模糊图像

I have an image that is blurred This is a part of the business card and it is one of the frames taken by the camera and

python c opencv imageprocessing OCR

Pytesseract - 使用用户模式

我正在尝试将 tesseract 的用户模式与 pytesseract 一起使用但似乎无法使该命令正常工作这看起来应该相当简单但文档很少我使用的是 tesseract 3 05 01 这样做是行不通的 pytesseract ima

python OCR Tesseract pythontesseract

Google Vision ocr：垂直和水平线文本识别

我们正在使用 google Vision ocr 来收集收据中的文本在某些情况下收据上有一些垂直书写的文本例如增值税信息等问题是谷歌视觉仅有效地读取主方向例如水平方向的文本并丢弃在同一收据中以垂直方向而不是水平方向写入的所有

OCR googlevision textrecognition

用Java从图像文件中读取文本[重复]

这个问题在这里已经有答案了可用于从图像 JPEG PNG 文件中提取文本的最佳开源 Java 库是什么 There s GOCR http jocr sourceforge net and 超正方体 http code google co

Java OCR

删除验证码文本中不需要的行 - opencv - python

我尝试使用 opencv 从验证码图像中获取文本问题是文本被噪声掩盖并且处理这些水平线噪声很复杂原图我处理过的图像不知道如何删除那些水平线并获取文本 Code import numpy as np import cv2 Load

python opencv imageprocessing OCR captcha

如何识别扫描的PDF文件中的图像？

我正在尝试识别扫描的 PDF 文件中的图像而不是文本最好使用 python 有什么办法可以做到这一点吗举一个简单的例子假设您扫描了一本书的一章页面有三种可能的选项仅包含文字仅包含一张或多张图像包含文本和图像我想输出属于

python imageprocessing machinelearning ComputerVision OCR