通过图像中的边界框提取选定的文本

2024-01-02

我正在尝试通过图像上的边界框获取选定的文本。就像如果仅通过边界框选择单词一样，我想获取该文本并将其转换为文本文件。请查看我的代码并进行一些审查，以便我可以实现该功能。

到目前为止，我已经将 PDF 文件转换为在文本上带有边框的图像。

import numpy as np
import csv
import io
from PIL import Image
import pytesseract
from wand.image import Image as wi
from pytesseract import Output
import cv2

pdf = wi(filename="samplecompany.pdf", resolution=100)
pdfImg = pdf.convert('jpg')
j = 1
for img in pdfImg.sequence:
    page = wi(image=img)
    page.save(filename=str(j)+".jpg")
    img1 = cv2.imread(str(j)+".jpg")

    d = pytesseract.image_to_data(img1, output_type=Output.DICT)
    n_boxes = len(d['level'])
    print(n_boxes)
    for i in range(n_boxes):
        (x, y, w, h) = (d['left'][i], d['top']
                        [i], d['width'][i], d['height'][i])
        print((x, y, w, h))
        cv2.rectangle(img1, (x, y), (x + w, y + h), (0, 255, 0), 2)

    cv2.imwrite(str(j)+".jpg", img1)

    cv2.waitKey(0)
    j += 1

这段代码工作正常我需要从我创建的图像中获取所需的文本。使用边界框位置

You can use this code to get custom text from a an image and change and modify accordingly and this is also save your text to an text file

import io
import cv2
import numpy as np
import pytesseract
from PIL import Image
from pytesseract import Output
from wand.image import Image as wi
import sys


pdf = wi(filename="Resume.pdf", resolution=100)
pdfImg = pdf.convert('jpg')
j = 1
imgBlobs = []
img1= []
for img in pdfImg.sequence:
    page = wi(image=img)
    page.save(filename=str(j)+".jpg")
    img1.append(cv2.imread(str(j)+".jpg"))
    j += 1

extracted_text = []

for img2 in img1:
    d = pytesseract.image_to_data(img2, output_type=Output.DICT)
    n_boxes = len(d['level'])
    print(n_boxes)
    extracted_text.append(d['text'][9])
    (x, y, w, h) = (d['left'][9], d['top'][9], d['width'][9], d['height'][9])
    cv2.rectangle(img2, (x, y), (x + w, y + h), (0, 255, 0), 2)


    cv2.imshow('img', img2)

    print(d)


with open('Prototype.txt', 'w') as filehandle:
        for listitem in extracted_text:
            filehandle.write('%s\n' % listitem)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

OCR

opencv

pythontesseract

通过图像中的边界框提取选定的文本的相关文章

我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
OpenCv读/写视频色差

我试图简单地使用 openCV 打开视频处理帧并将处理后的帧写入新的视频文件我的问题是即使我根本不处理帧只是打开视频使用 VideoCapture 读取帧并使用 VideoWriter 将它们写入新文件输出文件看起来比输入更绿
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

如何为所有幻灯片指定相同的过渡速度，无论其宽度如何？

如何为所有幻灯片指定相同的过渡速度无论其宽度如何现在过渡速度取决于幻灯片的宽度幻灯片越宽过渡速度越快 https codepen io anon pen XoyZNr https codepen io anon pen XoyZN
如何将对象过滤器与 Softlayer Rest API 一起使用？

I read 本文 https sldn softlayer com article object filters并在尝试遵循示例时遇到一些问题以下是该文章中给出的示例之一对象过滤器中的第一个参数是虚拟客人这个对象过滤器可以在api中
如何对数组进行排序？

为什么我不能按预期对数组进行排序 fn main let mut a 1 3 2 let s a sort println s a is已排序但该方法就地对数组进行排序阅读的签名sort https doc rust lang org
没有参数值的路由； Angular 路由重定向 - 我可以使用 redirectTo 来参数路径吗？

我在想是否可以将路径重定向到路径 id 有什么方法可以实现这个目标吗谢谢 path folder children path redirectTo id pathMatch full path id canActivate AuthGu
在数据表对象中使用 ColumnHidden 属性

我有一个微软访问形式与数据表子表单使用代码我改变了列隐藏其各个列的属性但是当我关闭表单时系统会询问我是否保存数据表表格的表格布局如何阻止表单不断要求用户相同的表格布局我是否别无选择只能将数据表更改为常规子表单如果您始终隐藏
将地图的所有元素复制到另一个地图中

Given var dst src map K V 我可以复制所有条目src into dst通过做 for k v range src dst k v 有没有更惯用的方法来做到这一点 copy仅适用于切片并且string作为来源对我来
R 向量大小限制：“.C 中不支持长向量（参数 5）”

我有一个非常大的矩阵我试图在有足够内存的服务器上通过 glmnet 运行即使在达到某一点的非常大的数据集上它也能正常工作之后我收到以下错误 Error in elnet x long vectors argument 5 are no
BOOL 设置不正确，调试输出混乱

我试图在 Xcode 中设置一个 BOOL 但由于某种原因它明显拒绝工作没有其他东西在设置这个布尔值只有这一个实例我的代码如下 h interface SuspectsViewController UIViewController
使用 ngModels 从组件到视图的带有数组的角度绑定对象

我尝试将我的模型绑定到我的视图上但是当我提交表单时遇到问题我没有数组但有很多属性成分 export class QuizFormAddQuestionComponent implements OnInit public questi
Angular 2 - 如何传递 URL 参数？

我在 Angular 2 中创建了一个单页抵押计算器应用程序它对我来说就像一个学习游乐场试图更习惯当前工作中使用的技术堆栈 http www mortgagecalculator123 com http www mortgagecalc
在 php:7.4-fpm 映像上安装 PHP-zip

我想在我的 docker 映像上安装 php zip 最终目标是使用 PhpWord 库我使用 php 7 4 fpm 它在 Debian 上运行在我的 dockerfile 中我使用以下命令 RUN apt get update d
WebDriver Java：将现有的 WebDriver 浏览器会话重新附加到驱动程序实例

我正在寻找一种方法将现有的 webdriver 浏览器会话重新附加到驱动程序实例以便我可以再次控制浏览器到目前为止我已经尝试过以下操作 I 参考 https stackoverflow com a 38827934 2285470 h
浮动div在固定高度容器中从上到下然后从左到右

我试图在固定高度的容器中从上到下从左到右垂直浮动 DIV 垂直浮动DIV从上到下按行排列 https stackoverflow com questions 16316329 div vetically floating div arra
如何使用 Json 对象的动态属性名称

我们如何使 JSON 属性名称动态化例如 public class Value JsonProperty value value private String val public void setVal String val this
R通过lapply命令从乘法回归中提取回归系数

我有一个包含多个变量的大型数据集其中一个是状态变量每个状态编码为 1 50 我想对数据集的其余 27 个变量总共 55 个变量运行 28 个变量的回归并且针对每个州换句话说对 covariate1 covariate2 cov
MySQL 外键约束 - 整数列

我有一个整数列我想向其中添加外键约束唯一的问题是如果该列没有不需要值默认情况下 MySQL 会输入 0 值这显然破坏了外键约束因为主表中没有 PK 为 0 的记录我怎样才能克服这个问题您可能需要设置外键以接受NULL值并
创建 debian 包

我已经在 debian 网站上检查了创建包的情况但是它并不容易理解因为它没有给出逐步的过程请帮助我如何创建 Debian 软件包如果可以的话有详细的步骤就更好了目标是创建一个包将 shell 脚本简单地放置在我想要的位置 1
如何从 Scrapy 中的请求中获取响应？

有什么办法可以让我得到response body来自scrapy中的Request函数我有这个 request Request http www example com callback self mytest def mytest se
NA 替换为空格

我使用了相同的方法将 NA 替换为空格或其他字符但由于某种原因这个方法不起作用我想将数据框中的 NA 替换为空白年份和年度列我究竟做错了什么 shad 92 lt structure list year c 1992 NA NA
通过图像中的边界框提取选定的文本

我正在尝试通过图像上的边界框获取选定的文本就像如果仅通过边界框选择单词一样我想获取该文本并将其转换为文本文件请查看我的代码并进行一些审查以便我可以实现该功能到目前为止我已经将 PDF 文件转换为在文本上带有边框的图像 impor

通过图像中的边界框提取选定的文本

通过图像中的边界框提取选定的文本 的相关文章

随机推荐

热门标签

通过图像中的边界框提取选定的文本的相关文章