Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
从 pdf 中提取表格
我正在尝试从这个表中获取数据PDF https www dropbox com s y3nivxhjvvzva7d test1 pdf dl 0 我尝试过 pdfminer 和 pypdf 运气不错 但我无法真正从表中获取数据 This i
python
python27
OCR
pdfminer
pdfparsing
从图像中提取数字
I have an image for mobile phone credit recharge card and I want to extract the recharge number only the gray area as a
imageprocessing
OCR
imagesegmentation
使用 OCR python 读取图像上的数字
我正在尝试使用 Python 和 tesseract 中的 OpenCV 提取图像上的数字 这是我的尝试 但我什么也没得到 该代码没有返回预期的数字 import fitz pytesseract os re import cv2 sTem
python
opencv
ImageMagick
OCR
Tesseract
对齐 OCR 文本
我正在根据历史记录创建一个数据库 这些历史记录是我从书籍中拍摄的页面 100K 页 在对每个页面进行 OCR 之前 我编写了一些 python 代码来进行一些图像处理 由于这些书中的数据没有采用格式良好的表格 因此我需要将每个页面分为行和列
python
imageprocessing
OCR
Tesseract 混淆两个数字
我正在编写一个应用程序来扫描图像中的数字 这些数字使用 OCR B 字体 并且还可能包含 and gt 人物 这是我的源图像 即使将字符集限制为上述字符 使用 Tesseract 的扫描效果也不是很好 由于我没有找到 Tesseract 的
OCR
Tesseract
OCR应用前的图像清理
过去几个小时我一直在尝试 PyTesser 它是一个非常好的工具 关于 PyTesser 的准确性 我注意到以下几点 包含图标 图像和文本的文件 准确度 5 10 仅包含文本的文件 已删除图像和图标 准确率 50 60 拉伸文件 这是最好的
python
imageprocessing
OCR
向 Tesseract eng.traineddata“添加”新字体
据我所知 Tesseract 3 x 附带了 6 种英文字体 如果我错了 请纠正我 我需要训练 Tesseract 来支持 5 种以上的字体 我只需要大写字母和数字 没有特殊字符或符号 我遵循了各种流程 例如 向 Tesseract 3 O
python
OCR
Tesseract
使用 OpenCV 和 Tesseract 的摩洛哥车牌识别 (LPR)
我正在开展一个关于识别摩洛哥车牌的项目 如下图所示 摩洛哥车牌 请问我如何使用 OpenCV 切出车牌并使用 Tesseract 读取中间的数字和阿拉伯字母 我研究过这篇研究论文 https www researchgate net pub
opencv
OCR
Tesseract
imagerecognition
通过图像中的边界框提取选定的文本
我正在尝试通过图像上的边界框获取选定的文本 就像如果仅通过边界框选择单词一样 我想获取该文本并将其转换为文本文件 请查看我的代码并进行一些审查 以便我可以实现该功能 到目前为止 我已经将 PDF 文件转换为在文本上带有边框的图像 impor
python
OCR
opencv
pythontesseract
在 R Shiny 中使用并行 foreach 制作进度条
我正在尝试添加一个进度条ocr data 在 for 循环中 但是当串联使用时 该过程非常慢 我正在尝试利用并行来加快生成表的过程ocr data x 代码粘贴在这里 ui lt fluidPage Application title ti
r
foreach
parallelprocessing
shiny
OCR
“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果
我正在设置language model penalty non dict word通过 Tesseract 3 01 的配置文件 但其值没有任何效果 我尝试过使用多个图像及其多个值 但每个图像的输出始终相同 另一位用户也注意到了同样的情况在
commandline
OCR
Tesseract
Open-CV - 未正确加载
我正在使用 Ubuntu 14 04 我正在尝试编译此代码 但无论如何我都会收到这些错误 我相信这与包含 OpenCV 库有关 但我不确定 有人可以帮我吗 错误 main cc 66 37 错误 CV RETR EXTERNAL 未在此范围
c
opencv
imageprocessing
OCR
Tesseract
车辆牌照检测有哪些好的算法? [关闭]
Closed 这个问题需要多问focused help closed questions 目前不接受答案 背景 对于我在大学的期末项目 我正在开发一个车辆牌照检测应用程序 我认为自己是一名中级程序员 但是我的数学知识缺乏中学以上的知识 这使
c
image
ComputerVision
OCR
objectdetection
使用 OCR 识别的文本去模糊图像
I have an image that is blurred This is a part of the business card and it is one of the frames taken by the camera and
python
c
opencv
imageprocessing
OCR
Pytesseract - 使用用户模式
我正在尝试将 tesseract 的用户模式与 pytesseract 一起使用 但似乎无法使该命令正常工作 这看起来应该相当简单 但文档很少 我使用的是 tesseract 3 05 01 这样做是行不通的 pytesseract ima
python
OCR
Tesseract
pythontesseract
Google Vision ocr:垂直和水平线文本识别
我们正在使用 google Vision ocr 来收集收据中的文本 在某些情况下 收据上有一些垂直书写的文本 例如增值税信息等 问题是 谷歌视觉仅有效地读取主方向 例如水平方向 的文本 并丢弃在同一收据中以垂直方向而不是水平方向写入的所有
OCR
googlevision
textrecognition
用Java从图像文件中读取文本[重复]
这个问题在这里已经有答案了 可用于从图像 JPEG PNG 文件中提取文本的最佳开源 Java 库是什么 There s GOCR http jocr sourceforge net and 超正方体 http code google co
Java
OCR
删除验证码文本中不需要的行 - opencv - python
我尝试使用 opencv 从验证码图像中获取文本 问题是文本被噪声掩盖 并且处理这些水平线 噪声很复杂 原图 我处理过的图像 不知道如何删除那些水平线并获取文本 Code import numpy as np import cv2 Load
python
opencv
imageprocessing
OCR
captcha
如何识别扫描的PDF文件中的图像?
我正在尝试识别扫描的 PDF 文件中的图像 而不是文本 最好使用 python 有什么办法可以做到这一点吗 举一个简单的例子 假设您扫描了一本书的一章 页面有三种可能的选项 仅包含文字 仅包含一张 或多张 图像 包含文本和图像 我想输出属于
python
imageprocessing
machinelearning
ComputerVision
OCR
«
1 ...
3
4
5
6
7
8
9
...18
»