使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本

2024-02-27

在示例图像中（仅作为参考，我的图像将具有相同的图案），一个页面具有完整的水平文本，其他页面具有两个水平文本列。

如何在python中自动检测文档的模式并逐一读取另一列数据？

我将 Tesseract OCR 与 Psm 6 一起使用，它是水平读取的，这是错误的。

实现此目的的一种方法是使用形态学运算和轮廓检测。

With the former you essentially "bleed" all characters into a big chunky blob. With the latter, you locate these blobs in your image and extract the ones that seem interesting (meaning: big enough).

使用的脚本：

import cv2
import sys

SCALE = 4
AREA_THRESHOLD = 427505.0 / 2

def show_scaled(name, img):
    try:
        h, w  = img.shape
    except ValueError:
        h, w, _  = img.shape
    cv2.imshow(name, cv2.resize(img, (w // SCALE, h // SCALE)))

def main():
    img = cv2.imread(sys.argv[1])
    img = img[10:-10, 10:-10] # remove the border, it confuses contour detection
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    show_scaled("original", gray)

    # black and white, and inverted, because
    # white pixels are treated as objects in
    # contour detection
    thresholded = cv2.adaptiveThreshold(
                gray, 255,
                cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV,
                25,
                15
            )
    show_scaled('thresholded', thresholded)
    # I use a kernel that is wide enough to connect characters
    # but not text blocks, and tall enough to connect lines.
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (13, 33))
    closing = cv2.morphologyEx(thresholded, cv2.MORPH_CLOSE, kernel)

    im2, contours, hierarchy = cv2.findContours(closing, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    show_scaled("closing", closing)

    for contour in contours:
        convex_contour = cv2.convexHull(contour)
        area = cv2.contourArea(convex_contour)
        if area > AREA_THRESHOLD:
            cv2.drawContours(img, [convex_contour], -1, (255,0,0), 3)

    show_scaled("contours", img)
    cv2.imwrite("/tmp/contours.png", img)
    cv2.waitKey()

if __name__ == '__main__':
    main()

然后你所需要的就是计算轮廓的边界框，并将其从原始图像中剪切出来。添加一点边距并将整个内容提供给超正方体。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

OCR

Tesseract

pythontesseract

使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本的相关文章

安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
分配列表的多个值

我很想知道是否有一种 Pythonic 方式将列表中的值分配给元素为了更清楚我要求这样的事情 myList 3 5 7 2 a b c d something myList So that a 3 b 5 c 7 d 2 我正在寻找比手
为什么 pandas 在简单的数学运算上比 numpy 更快？

最近我观察到 pandas 的乘法速度更快我在下面的例子中向您展示了这一点如此简单的操作怎么可能做到这一点这怎么可能呢 pandas 数据帧中的底层数据容器是 numpy 数组测量我使用形状为 10k 10k 的数组数据框 i
在 Jupyter Notebook 中设置环境变量的不同方法

在某些情况下我在 Windows 10 计算机上使用 Jupyter 笔记本我想通过设置环境变量 GOOGLE APPLICATION CREDENTIALS 来向 GCP 进行身份验证我想知道这两种设置环境变量的方式有什么区别当
Django 查询：“datetime + delta”作为表达式

好吧我的问题如下假设我有下一个模型这是一个简单的情况 class Period models Model name CharField field specs here start date DateTimeField field s
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
Pandas如何按时间段过滤DataFrame

我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
Django Web 应用程序中的 SMTP 问题

我被要求向使用 Django Python 框架实现的现有程序添加一个功能此功能将允许用户单击一个按钮该按钮将显示一个小对话框表单以输入值我确实编写了一些代码显示电子邮件已发送的消息但实际上它没有发送 My code from
如何仅注释堆积条形图的一个类别

我有一个数据框示例如下所示 data Date 2021 07 18 2021 07 19 2021 07 20 2021 07 21 2021 07 22 2021 07 23 Invalid NaN 1 1 NaN NaN NaN N
django 中的身份验证方法返回 None

你好我在 django 中做了一个简单的注册和登录页面当想要登录时登录视图中的身份验证方法不返回任何内容我的身份验证应用程序模型 py from django db import models from django contri
如何让 Streamlit 每 5 秒重新加载一次？

我必须每 5 秒重新加载 Streamlit 图表以便在 XLSX 报告中可视化新数据如何实现这一目标 import streamlit as st import pandas as pd import os mainDir os pa
更新 matplotlib 中颜色条的范围

我想更新一个contourf在函数内绘制效果很好然而数据的范围发生了变化因此我还必须更新颜色条这就是我未能做到的地方请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
Python 或 C 语言中的 Matlab / Octave bwdist()

有谁知道 Matlab Octave bwdist 函数的 Python 替代品此函数返回给定矩阵的每个单元格到最近的非零单元格的欧几里得距离我看到了一个 Octave C 实现一个纯 Matlab 实现我想知道是否有人必须用 AN
RuntimeError(f"目录 '{directory}' 不存在") RuntimeError: 目录 'app/static' 不存在

当我运行 server py 文件时出现错误 File C Users nawin AppData Local Programs Python Python38 lib site packages starlette staticfiles
通过新数据更新绘图，而不是在 Jupyter 笔记本中制作新绘图

我有一些问题希望你能帮我解决我需要使用下拉小部件创建交互式绘图我可以在其中选择并绘制感兴趣的数据我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

使用网络凭据通过 Process.Start(path) 访问网络共享

我在用this http www codeproject com KB cs zetaimpersonator aspxImpersonator 类模拟域帐户来访问网络共享如下所示 using new Impersonartor user
正则表达式从右向左读取

我一直在寻找一个可以在一组数字中添加逗号的短代码直到我发现这个网站 http www mredkj com javascript nfbasic html 代码 function addCommas nStr nStr x nStr sp
在 React 中使用多个状态更好还是使用一个状态对象更好？

如果我有一个需要使用和操作多个状态项的功能组件并且我有多个状态用于不直接相关的不同事物例如游戏统计数据和 UI 元素状态那么性能或实践是否会更好像这样做 const state setState React useState u
R：如何高效地判断data.frame A是否包含在data.frame B中？

为了查明数据框是否df a是数据框的子集df b我做了以下事情 df a lt data frame x 1 5 y 6 10 df b lt data frame x 1 7 y 6 12 inds x lt as integer lap
SQL Server 2008 上的唯一键与唯一索引

我有一张桌子叫countries我定义了country name通过在 SQL Server 2008 R2 上创建唯一键类型的索引键使列保持唯一但我有以下问题创建唯一键类型的索引键会自动在此列上创建非聚集索引吗如
为什么 C++ double 会将自己限制为小数点后 5 位？

我希望你能帮忙解决一些令人头疼的问题我写了一个模板类来计算标准差 template
在一定条件下将数字列表分配给N组的算法

假设我有一个数字列表 2 2 3 4 4 将数字分成N组这里以3组为例 A 2 3 sum 5 B 4 sum 4 C 2 4 sum 6 我想要的是最小化总和最高的组此处为 6 总和最小的组此处为 4 有没有人想到一种算法来实现这一
在 Swift 中的 UIPopoverController 上设置多个箭头方向

在 Swift 中为 UIPopoverController 设置多个箭头方向的语法是什么像这样的事情 popoverController permittedArrowDirections Up Down popoverControlle
C++ 委托创建

我想知道是否有办法在 C 中模仿这种委托行为来自 C new ModifyTargetingStatus Reversal Reverses physical attacks back at the user 1 new List
根据其他列表中的列名称匹配从列表中填充矩阵

我有一些数据 num list1 lt list 1 2 1 4 5 num list2 lt list 2 3 num list3 lt list 3 5 2 num data list lt list num list1 num lis
使用window.onbeforeunload事件中的window.event.keyCode在javascript中捕获f5按键事件始终为0而不是116

我正在创建一个 MVC 应用程序关闭应用程序即窗口选项卡时有必要将会话中的变量设置为 null 但刷新应用程序时则不需要我通过以下代码进行了尝试
完美模拟nullptr

我厌倦了等待编译器支持nullptr gcc 4 6 确实 http gcc gnu org gcc 4 6 changes html但它太新了很少有发行版支持它所以作为权宜之计直到nullptr完全支持我决定效仿它有两个仿真示例
是否可以检测所有异步任务何时暂停？

我正在尝试测试异步代码但由于某些任务之间的复杂连接而遇到了麻烦我需要的上下文是一些代码它与另一个进程写入文件的同时并行读取文件代码中有一些逻辑读取被截断的记录会使其后退并wait on an asyncio Condition稍后
完美转发到异步 lambda

我有一个函数模板我想在其中完美转发到在另一个线程上运行的 lambda 这是一个可以直接编译的最小测试用例 include
在 CloudBlobContainer 中找不到 Listblob()

在我的应用程序中我想要容器的所有 blob 但在我的代码中如下所示 CloudBlobContainer 变量容器中没有 Listblob 方法我错过了什么吗 var credentials new StorageCredential
天真的继承问题 - Java

大家好问出这样幼稚的问题我感到很尴尬但我无法理解一件事我有这样的继承结构 B扩展A 我写的代码如下 Class A public class A private int pos 0 public A this pos 12 publi
WPF DataGrid 和 ScrollViewer 性能缓慢

我有这样的数据网格样式
无法在 Windows 7 上安装支持 GPU 的 R XGBoost

我尝试在 Windows 7 上的 R 中安装具有 GPU 支持的 XGBoost 我按照此处的安装指南进行操作 http xgboost readthedocs io en latest build html installing r p
无需启动应用程序即可提供 OSX 服务？

我已经成功实现了无面服务带有 service 扩展名的仅后台应用程序并使其正常工作请参阅这个问题 https stackoverflow com q 27264360 433373 基于苹果的文档 https developer a
使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本

在示例图像中仅作为参考我的图像将具有相同的图案一个页面具有完整的水平文本其他页面具有两个水平文本列如何在python中自动检测文档的模式并逐一读取另一列数据我将 Tesseract OCR 与 Psm 6 一起使用它是水平读取

使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本

使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本 的相关文章

随机推荐

热门标签

使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本的相关文章