python提取图片中的表格内容

2023-05-16

只提供思路，具体场景核图像有关，需做前期调整

一、处理流程：

1、图像灰度化处理

2、图像二值化处理

3、图像腐蚀处理（若得到的横纵交线不清楚，添加膨胀处理）

4、获取表格交点坐标

5、根据交点集获取单元格轮廓并进行过滤

二、使用案例

在这里插入图片描述

三、代码示例及效果

1、灰度化处理

def gray_img(img:'numpy.ndarray'):
    """
    对读取的图像进行灰度化处理
    :param img: 通过cv2.imread(imgPath)读取的图像数组对象
    :return: 灰度化的图像
    """
    grayImage=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    return grayImage

2、二值化处理

def bin_img(img:'numpy.ndarray'):
    """
    对图像进行二值化处理
    :param img: 传入的图像对象（numpy.ndarray类型）
    :return: 二值化后的图像
    """
    ret,binImage=cv2.threshold(img,180,255,cv2.THRESH_BINARY_INV)
    return binImage

在这里插入图片描述

3、图像腐蚀

def erode_img(img,kernel_args=(2,2),iterations=1):
    """
    对图像进行腐蚀
    @param kernel_args 卷积核参数（2，2）
    @param interations erode的迭代次数
    """

    kernel = np.ones(kernel_args, np.uint8)
    return cv2.erode(img, kernel,iterations=iterations)

（1）纵向腐蚀获取横向线条

    img_transverse = erode_img(img,(1,2),40)

需要调节卷积核参数（kernel_args），迭代次数（iterations）
在这里插入图片描述

（2）横向腐蚀获取纵向线条

    img_vertical = erode_img(img, (2,1), 40)

在这里插入图片描述

4、图像膨胀处理

膨胀处理相当于对线条进行加粗

    img_transverse = dilate_img(img_transverse,(2,2),1)
    img_vertical = dilate_img(img_vertical,(2,2),1)

5、获取交点

def get_points(img_transverse, img_vertical):
    """
    获取横纵线的交点
    :param img_transverse:
    :param img_vertical:
    :return:
    """
    img = cv2.bitwise_and(img_transverse, img_vertical)
    return img

在这里插入图片描述

6、获取单元格

def split_rec(arr):
    """
    切分单元格
    :param arr:
    :return:
    """
    # 数组进行排序
    arr.sort(key=lambda x: x[0],reverse=True)
    # 数组反转
    arr.reverse()
    for i in range(len(arr) - 1):
        if arr[i+1][0] == arr[i][0]:
            arr[i+1][3] = arr[i][1]
            arr[i + 1][2] = arr[i][2]
        if arr[i+1][0] > arr[i][0]:
            arr[i + 1][2] = arr[i][0]
        print(arr[i])
    return arr

def get_rec(img):
    """
    获取单元格
    :param img: 
    :return: 
    """
    contours, hierarchy = cv2.findContours(img, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_SIMPLE)
    contours_poly = [0] * len(contours)
    boundRect = [0] * len(contours)
    rois = []
    for i in range(len(contours) - 1):
        cnt = contours[i]
        contours_poly[i] = cv2.approxPolyDP(cnt, 1, True)
        boundRect[i] = cv2.boundingRect(contours_poly[i])
        rois.append(np.array(boundRect[i]))
        # img = cv2.rectangle(img_bak, (boundRect[i][0], boundRect[i][1]), (boundRect[i][2], boundRect[i][3]),
        #                     (255, 255, 255), 1, 8, 0)
    rois = split_rec(rois)
    return rois

在这里插入图片描述

四、完整代码

from PIL import Image, ImageOps
import cv2
import numpy as np




def split_rec(arr):
    """
    切分单元格
    :param arr:
    :return:
    """
    # 数组进行排序
    arr.sort(key=lambda x: x[0],reverse=True)
    # 数组反转
    arr.reverse()
    for i in range(len(arr) - 1):
        if arr[i+1][0] == arr[i][0]:
            arr[i+1][3] = arr[i][1]
            arr[i + 1][2] = arr[i][2]
        if arr[i+1][0] > arr[i][0]:
            arr[i + 1][2] = arr[i][0]
        print(arr[i])

    return arr



def get_points(img_transverse, img_vertical):
    """
    获取横纵线的交点
    :param img_transverse:
    :param img_vertical:
    :return:
    """
    img = cv2.bitwise_and(img_transverse, img_vertical)
    return img




def dilate_img(img, kernal_args:tuple, iterations:int):
    """
    dilate image
    @param kernel_args 卷积核参数（2，2）
    @param interations dilate的迭代次数
    """

    kernel = np.ones(kernal_args, np.uint8)
    return cv2.dilate(img, kernel,iterations=iterations)

    pass


def erode_img(img,kernel_args=(2,2),iterations=1):
    """
    对图像进行腐蚀
    @param kernel_args 卷积核参数（2，2）
    @param interations erode的迭代次数
    """

    kernel = np.ones(kernel_args, np.uint8)
    return cv2.erode(img, kernel,iterations=iterations)




def bin_img(img:'numpy.ndarray'):
    """
    对图像进行二值化处理
    :param img: 传入的图像对象（numpy.ndarray类型）
    :return: 二值化后的图像
    """
    ret,binImage=cv2.threshold(img,180,255,cv2.THRESH_BINARY_INV)
    return binImage

def gray_img(img:'numpy.ndarray'):
    """
    对读取的图像进行灰度化处理
    :param img: 通过cv2.imread(imgPath)读取的图像数组对象
    :return: 灰度化的图像
    """
    grayImage=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    return grayImage
    pass

def get_rec(img):
    """
    获取单元格
    :param img:
    :return:
    """
    contours, hierarchy = cv2.findContours(img, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_SIMPLE)
    contours_poly = [0] * len(contours)
    boundRect = [0] * len(contours)
    rois = []
    for i in range(len(contours) - 1):
        cnt = contours[i]
        contours_poly[i] = cv2.approxPolyDP(cnt, 1, True)
        boundRect[i] = cv2.boundingRect(contours_poly[i])
        rois.append(np.array(boundRect[i]))
        # img = cv2.rectangle(img_bak, (boundRect[i][0], boundRect[i][1]), (boundRect[i][2], boundRect[i][3]),
        #                     (255, 255, 255), 1, 8, 0)
    rois = split_rec(rois)
    return rois

if __name__ == "__main__":
    image  = "D:/cs/ocr/c.png"
    img_bak = cv2.imread(image)
    img = gray_img(img_bak)
    img = bin_img(img)
    img_transverse = erode_img(img,(1,2),40)
    img_vertical = erode_img(img, (2,1), 40)
    # img = img_transverse + img_vertical
    img_transverse = dilate_img(img_transverse,(2,2),1)
    img_vertical = dilate_img(img_vertical,(2,2),1)
    img = get_points(img_transverse,img_vertical)

    rois = get_rec(img)
    for i, r in enumerate(rois):
        cv2.imshow("src" + str(i), img_bak[r[3]:r[1], r[2]:r[0]])
    cv2.waitKey(0)

    cv2.destroyAllWindows()
    pass

五、未解决

1、图像不清楚或倾斜，无法操作

2、若最右侧没有竖线会丢失最后一列

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

提取图片中的表格内容

python提取图片中的表格内容的相关文章

使用 urllib2 进行 Python 身份验证

所以我尝试使用 python 从名为 vsearch cisco com 的网站下载文件 python Connects to the Cisco Server and Downloads files at the URL specifie
如何读取通过追加行不断更新的文件？

在我的终端中我正在运行 curl user dhelm 12345 https stream twitter com 1 1 statuses sample json gt raw data txt curl 的输出是实时流式 Twitte
如何让Python的socket服务器永远运行

我有这段代码创建了一个简单的Python套接字服务器但是每次客户端断开连接时它都会关闭如何让它永远运行 import socket HOST PORT 8000 s socket socket socket AF INET socket
管理 Tweepy API 搜索

如果这是对之前在其他地方回答过的问题的粗略重复请原谅我但我不知道如何使用 tweepy API 搜索功能是否有任何有关如何使用搜索推文的文档api search 功能有什么方法可以控制返回的推文数量结果类型等功能由于某种原因结
使用 Pillow 和 Numpy 进行图像推导

I have two images and 我想导出一个只有红色 Hello 的图像例如所以我正在运行一个简单的推导python脚本 from PIL import Image import numpy as np root root
顶级棉花糖模式验证

From 棉花糖 validation http marshmallow readthedocs org en latest quickstart html validation 我知道我可以在架构中的特定字段上注册验证器如果验证器失败
sphinx 中的分组方法文档字符串

是否可以使用 sphinx 的 autodoc 功能将多个方法文档字符串分组以便将它们列在一起 class Test object def a self A method of group foo def b self A method
HoughLinesP后如何合并线？

My task is to find coordinates of lines startX startY endX endY and rectangles 4 lines Here is input file 我使用下一个代码 img c
Python Pandas 从宽到长的格式更改以及列标题拆分

我有一个包含以下列标题和行示例的表 Subject Test1 Result1 Test1 Result2 Test2 Result1 Test2 Result2 0 John 10 0 5 20 0 3 我想将其改造成 Subject l
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
如何充分释放函数中使用的GPU内存

我在用着cupy在接收一个函数numpy数组将其推到 GPU 上对其进行一些操作并返回cp asnumpy它的副本问题函数执行后内存没有被释放如ndidia smi 我知道内存的缓存和重用cupy 但是这似乎仅适用于每个用户当
Highcharts 奇怪的分组行为

我正在使用延迟加载 http www highcharts com stock demo lazy loading加载 OHLC 数据的方法在服务器端我使用 Python MySQL 并有 4 个包含 OHLC 数据的表时间间隔为 5
来自数据框 groupby 的条形图

import pandas as pd import numpy as np import matplotlib pyplot as plt df pd read csv arrests csv df df replace np nan 0
Microsoft Azure 数据仓库和 SqlAlchemy

我正在尝试使用 python 的 sqlalchemy 库连接到 microsoft azure 数据仓库并收到以下错误 pyodbc Error HY000 HY000 Microsoft ODBC SQL Server Driver
将查询参数添加到 URL

我正在尝试自动从网站下载数据我需要将动态参数传递到每天更改的站点 html 的结构是表格而不是表单如何传递参数并从 url 获取结果这是我尝试过的它需要在 python 2 7 中 import urllib url https d
Numpy 通过一个数组的值总结另一个数组

我正在尝试找到一种矢量化方法来完成以下任务假设我有一个 x 和 y 值的数组请注意 x 值并不总是整数并且可以为负数 import numpy as np x np array 1 1 1 3 2 2 2 5 4 4 dtype flo
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
如何使用 Selenium Webdriver (Python) 在上下文菜单中选择“将图像另存为...”来保存图像

我正在尝试使用 selenium webdriver 将特定图像保存到目录中我希望通过模拟右键单击 img 元素并选择将图像另存为来实现此目的使用以下代码我可以打开上下文菜单但无法选择正确的选项 browser WebDriver
使用 plone.api 创建文件的 Python 脚本在设置文件时出现错误 WrongType

Dears 我正在创建一个脚本python来在Plone站点中批量上传文件安装是UnifiedInstaller Plone 4 3 10 该脚本读取了一个txt 并且该txt以分号分隔在新创建的项目中设置文件时出现错误下面是脚本 f
Python中的MariaDB连接器无法连接到远程服务器

我使用与远程 Mariadb 服务器的连接已有几个月了今天无法再通过 macOS 上的 python mariadb 模块和 mariadb 连接器建立连接基本安装如下 brew install mariadb connector c

随机推荐

ftp服务器上传文件频率,ftp服务器上传文件速度多少

ftp服务器上传文件速度多少内容精选换一换华为云帮助中心 xff0c 为用户提供产品简介价格说明购买指南用户指南 API参考最佳实践常见问题视频帮助等技术文档 xff0c 帮助您快速上手使用华为云服务使用FTP上传文件时
Android9.0指纹识别BiometricPrompt的简单使用

谷歌在Android 9 0 API版本28 xff0c 发布了生物信息综合验证的基础 API android hardware biometrics BiometricPrompt BiometricPrompt 所以在android9
域名未授权 / 该网站未授权,禁止使用解决办法：

公司买了一个商城项目 xff0c 让我先搭个测试环境 xff0c 然后二开 xff0c 于是我经过披荆斩棘申请二级域名配置LNMP后 xff0c 遇见了诡异的事情 xff1a baidu和google纷纷表示他们也很为难没见过这种提示 x
android页面切换空白问题

问题 xff1a 当切换到第三个fragment时返回到第一个 xff0c 第一个fragment页面空白原因 xff1a viewpage默认会加载三个页面 xff0c 当切换到第三个时会把第一个销毁 xff0c 再返回时重新调用啦On
Adobe Media Encoder“编译影片时出错“ GPU渲染错误错误代码:-1609629695

Adobe Media Encoder 编译影片时出错 GPU渲染错误错误代码 1609629695 xff0c 通过下面方法处理
Manjaro虚拟机安装常用软件

还是安装常用软件系列 1 VMWare 安装Manjaro 默认都安装完了 xff0c 注意 xff0c 有时候Manjaro分辨率会变成800 600不可变 xff0c 我的方法比较懒 xff0c 就是每次开机都执行 sudo syste
kali无法进入gnome桌面环境

如果遇到无法进入桌面环境报错或者开机自动进入命令行模式 xff0c 且无法使用startx命令启动进入桌面环境时 xff0c 如果在本地查找不到startx命令时 xff0c 可以使用CTRL 43 ALT 43 F1进入命令行模式 xff
Collections.singleton()在进行remove操作时抛出UnsupportedOperationException异常原因

Collections singleton 在进行remove操作时抛出UnsupportedOperationException异常原因这个方法主要用于只有一个元素的优化 xff0c 减少内存分配 xff0c 无需分配额外的内存返回一
什么是强化学习，强化学习在控制系统中的应用以及matlab强化学习工具箱的介绍

一 Reinforcement Learning Toolbox介绍强化学习工具箱使用强化学习算法 xff08 包括DQN xff0c A2C和DDPG xff09 为训练策略 xff08 policy xff09 提供函数和模块您可以
输入框限制输入20个中文字（40个字符）。eslint 报错\x00 no-control-regex解决

需求是要限制用户输入的名称 xff0c 最多二十个中文字 xff0c 也就是40个字符但我们平时使用str length来限制都是获取到字符串的长度而已 xff0c 并不能获取到具体的字符这里使用正则来解决一个汉字 61 2字节 61
使用SecureCRT 抓log

使用SecureCRT 抓log 1 点击选项会话选项 xff1a 2 选择Log File xff0c 保存log文件名和位置 xff0c 并在每行前添加 xff1a 日期时间 span class token punctuation
OGG部署过程错误总结

安装过程可参考 xff1a https www cnblogs com houzhiqing p 5289383 html 错误1 xff1a 源端安装完ogg后 xff0c 执行 ggsci 进不去 xff0c 报错 xff1a 无法打开
sparkstreaming 读取本地文件获取不到内容

1 批次间隔大于3s 2 文件地址写成绝对路径且使用file 开头例 xff1a ssc textFileStream file D cs scalaPro SparkDemo data 3 读取目录中的文件以文件流形式写入该目录下
Unable to instantiate SparkSession with Hive support because Hive classes are

spark hive的版本不对应 lt span class token tag span https span class token punctuation span mvnrepository com artifact org apa
安装失败。无法安装 cloudera-manager-agent 包。

File exists var log 进入var 目录 xff0c 删除log文件
Xshell更改命令提示符以及背景配色

PS1是用来设置命令提示符的环境变量 xff0c 输入echo PS1来查看 echo span class hljs formula PS1 span class hljs command span span class hljs com
mysql 创建数据库,添加用户,用户授权

一创建mysql数据库创建数据库语法 CREATE DATABASE IF NOT EXISTS testdb DEFAULT CHARSET utf8 COLLATE utf8 general ci 二创建用户新建用户 creat
TypeError: Required argument 'flags' (pos 2) not found

from os import open 34 data 0 0 txt 34 原因 xff1a 因为导入了os模块后默认的open函数调用的是os下的解决 xff1a 显示的调用os模块下的函数避免函数冲突例 xff1a import
repositories.xml文件位置

1 默认位置默认会存储在C Users 你的用户名如EDZ mettle文件中 2 修改位置修改Spoon bat 文件查找Kettle home查看是否有set KETTLE HOME 61 xff0c 若没有自动添加 xff0c
python提取图片中的表格内容

只提供思路 xff0c 具体场景核图像有关 xff0c 需做前期调整一处理流程 xff1a 1 图像灰度化处理 2 图像二值化处理 3 图像腐蚀处理 xff08 若得到的横纵交线不清楚 xff0c 添加膨胀处理 xff09 4 获取表格

python提取图片中的表格内容

一、处理流程：

1、图像灰度化处理

2、图像二值化处理

3、图像腐蚀处理（若得到的横纵交线不清楚，添加膨胀处理）

4、获取表格交点坐标

5、根据交点集获取单元格轮廓并进行过滤

二、使用案例

三、代码示例及效果

1、灰度化处理

2、二值化处理

3、图像腐蚀

（1）纵向腐蚀获取横向线条

（2）横向腐蚀获取纵向线条

4、图像膨胀处理

5、获取交点

6、获取单元格

四、完整代码

五、未解决

1、图像不清楚或倾斜，无法操作

2、若最右侧没有竖线会丢失最后一列

python提取图片中的表格内容 的相关文章

随机推荐

热门标签

python提取图片中的表格内容的相关文章