在Python中的图像中的表格上创建边框

2023-12-22

我有一个图像，其中有一个表格和一些其他数据。我需要为表格绘制边框以分隔每个单元格。

My image looks like this

What i am trying: 1) dilating the image to create continuous spots, which looks like

2）寻找轮廓并绘图

问题：我无法正确绘制，因为我的表格单元格看起来太接近，并且在扩张时它们变成了一个连续的点 **我从互联网上获取了这段代码并尝试修改但对于这张图像来说效果不佳

code :

    import os
    import cv2
    import imutils

    # This only works if there's only one table on a page
    # Important parameters:
    #  - morph_size
    #  - min_text_height_limit
    #  - max_text_height_limit
    #  - cell_threshold
    #  - min_columns


    def pre_process_image(img, save_in_file, morph_size=(7, 7)):
        # get rid of the color
        pre = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        # Otsu threshold
        pre = cv2.threshold(pre,250, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
        # dilate the text to make it solid spot
        cpy = pre.copy()
        struct = cv2.getStructuringElement(cv2.MORPH_RECT, morph_size)
        cpy = cv2.dilate(~cpy, struct, anchor=(-1, -1), iterations=1)
        # cpy = cv2.dilate(img,kernel,iterations = 1)

        pre = ~cpy
        # pre=cpy
        if save_in_file is not None:
            cv2.imwrite(save_in_file, pre)
        return pre


    def find_text_boxes(pre, min_text_height_limit=3, max_text_height_limit=30):
        # Looking for the text spots contours
        contours = cv2.findContours(pre, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
        # contours = contours[0] if imutils.is_cv2() else contours[1]
        contours = contours[0]
        # Getting the texts bounding boxes based on the text size assumptions
        boxes = []
        for contour in contours:
            box = cv2.boundingRect(contour)
            h = box[3]

            if min_text_height_limit < h < max_text_height_limit:
                boxes.append(box)

        return boxes


    def find_table_in_boxes(boxes, cell_threshold=10, min_columns=2):
        rows = {}
        cols = {}

        # Clustering the bounding boxes by their positions
        for box in boxes:
            (x, y, w, h) = box
            col_key = x // cell_threshold
            row_key = y // cell_threshold
            cols[row_key] = [box] if col_key not in cols else cols[col_key] + [box]
            rows[row_key] = [box] if row_key not in rows else rows[row_key] + [box]

        # Filtering out the clusters having less than 2 cols
        table_cells = list(filter(lambda r: len(r) >= min_columns, rows.values()))
        # Sorting the row cells by x coord
        table_cells = [list(sorted(tb)) for tb in table_cells]
        # Sorting rows by the y coord
        table_cells = list(sorted(table_cells, key=lambda r: r[0][1]))

        return table_cells


    def build_lines(table_cells):
        if table_cells is None or len(table_cells) <= 0:
            return [], []

        max_last_col_width_row = max(table_cells, key=lambda b: b[-1][2])
        max_x = max_last_col_width_row[-1][0] + max_last_col_width_row[-1][2]

        max_last_row_height_box = max(table_cells[-1], key=lambda b: b[3])
        max_y = max_last_row_height_box[1] + max_last_row_height_box[3]

        hor_lines = []
        ver_lines = []

        for box in table_cells:
            x = box[0][0]
            y = box[0][1]
            hor_lines.append((x, y, max_x, y))

        for box in table_cells[0]:
            x = box[0]
            y = box[1]
            ver_lines.append((x, y, x, max_y))

        (x, y, w, h) = table_cells[0][-1]
        ver_lines.append((max_x, y, max_x, max_y))
        (x, y, w, h) = table_cells[0][0]
        hor_lines.append((x, max_y, max_x, max_y))

        return hor_lines, ver_lines

if __name__ == "__main__":
    in_file = os.path.join("data", "page1.jpg")
    pre_file = os.path.join("data", "pre.png")
    out_file = os.path.join("data", "out.png")

    img = cv2.imread(os.path.join(in_file))

    pre_processed = pre_process_image(img, pre_file)
    text_boxes = find_text_boxes(pre_processed)
    cells = find_table_in_boxes(text_boxes)
    hor_lines, ver_lines = build_lines(cells)

    # Visualize the result
    vis = img.copy()

    # for box in text_boxes:
    #     (x, y, w, h) = box
    #     cv2.rectangle(vis, (x, y), (x + w - 2, y + h - 2), (0, 255, 0), 1)

    for line in hor_lines:
        [x1, y1, x2, y2] = line
        cv2.line(vis, (x1, y1), (x2, y2), (0, 0, 255), 1)

    for line in ver_lines:
        [x1, y1, x2, y2] = line
        cv2.line(vis, (x1, y1), (x2, y2), (0, 0, 255), 1)

    cv2.imwrite(out_file, vis)

非常有趣的应用程序。

原始拨号可能不是最好的方法。

我建议使用 OCR 路由。像下面这样

输出是这样的

因此只要有两排彼此距离较近即可。例如，row1-row2

在我的示例中，如果 |292-335|

对于 OCR 包，如果您坚持使用 python，可以尝试使用 tesseract。

https://pypi.org/project/pytesseract/

请参阅此处了解 python 文本坐标Tesseract OCR 文本位置 https://stackoverflow.com/questions/51282214/tesseract-ocr-text-position

Tesseract.PageIteratorLevel myLevel = /*TODO*/;
using (var page = Engine.Process(img))
using (var iter = page.GetIterator())
{
    iter.Begin();
    do
    {
        if (iter.TryGetBoundingBox(myLevel, out var rect))
        {
            var curText = iter.GetText(myLevel);
            // Your code here, 'rect' should containt the location of the text, 'curText' contains the actual text itself
        }
    } while (iter.Next(myLevel));
}

rect包含您想要的部分 x y 高度宽度

我在这里展示的演示实际上使用类似于 Windows OCR 示例的东西

https://github.com/microsoft/Windows-universal-samples/tree/master/Samples/OCR

请随意尝试任何方法来获得您想要的表格线。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

image

opencv

在Python中的图像中的表格上创建边框的相关文章

如何使用 Java2D 创建硬件加速图像？

我正在尝试创建一个快速图像生成器它可以执行大量 2d 转换和形状渲染因此我尝试使用 BufferedImage 然后获取 Graphics2D 对象来执行所有绘图我现在主要关心的是 make 速度非常快所以我创建一个像这样的 Buf
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
将文件标记为从 Python 中删除？

在我的一个脚本中我需要删除当时可能正在使用的文件我知道我无法删除正在使用的文件直到它不再使用为止但我也知道我可以将该文件标记为由操作系统 Windows XP 删除我将如何在 Python 中做到这一点以及另一个不依赖于 pyw
如何将 UPX 与 pyinstaller 一起使用？

如何将 UPX 与 pyinstaller 一起使用我正在关注文档我已经下载了UPX 我的文件如下所示 import csv import selenium import pandas print Hello 然后我运行 pyinsta
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
OpenCV SVM 给出奇怪的预测结果

我对 OpenCV 和支持向量机都很陌生我想使用 SVM 训练具有两个标签的数据集然后预测给定集合的标签我当前的集合包含大约 600 行具有相等的类分布 1 为 300 行 1 为 300 行包含 34 列这是我当前用于设置 O
按字符串子字符串的列过滤 Pandas 数据框

我正在尝试使用列中的字符串值是数据框外部字符串的子字符串的条件来过滤数据框下面的例子 df a b c hello bye hello reference str hello there output a c 一种方法可能是使用正则表达式
为什么最简单的 requests_mock 示例在 pytest 中失败？

我有一个特殊的问题requests mock 我想用它pytest测试我的 API 包装器库我尝试过使用requests mock 文档中的第一个示例 http requests mock readthedocs io en latest
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
python：UnboundLocalError：赋值前引用的局部变量“open”[重复]

这个问题在这里已经有答案了 def read lines readFileName readfile txt f open readFileName r contents f read and so on read lines 当我运行这个
保存游戏最高分？

我使用 pygame 在 python 中制作了一个非常简单的游戏分数取决于玩家达到的级别我将级别作为变量称为score 我想在游戏开始或结束时显示顶级我会更乐意显示多个分数但我见过的所有其他线程都太复杂我无法理解所以请保持简单
收到“/：未找到事件。”使用 PyCharm 远程调试器时

当我使用 PyCharm 通过 ssh 进行远程调试时tcsh shell 服务器很多时候它停止工作并显示未找到事件更具体地说我在 pycharm 调试控制台中遇到以下内容 ssh username hostserver 22 p
如何连接多个字符串？ [复制]

这个问题在这里已经有答案了如何将 stringList 中的所有字符串合并为一个而不打印它例如 s joinStrings very hot day returns string print s Veryhotday 感觉有点倒退但是
如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴？

我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中用户通过将第二个轴添加到与标
执行许多插入重复键更新错误：未使用所有参数

所以我一直在尝试使用 python 2 7 15 使用 mysql connector 执行此查询但由于某种原因它似乎不起作用并且总是返回错误并非所有参数都被使用表更新有一个主键即 ID 这是我尝试运行此 SQL 的查询 sql
对 Python 列表元素进行分组

我有一个 python 列表如下所示 my list 25 1 0 65 25 3 0 63 25 2 0 62 50 3 0 65 50 2 0 63 50 1 0 62 我想根据以下规则对它们进行排序 1 gt 0 65 0 62 l
Pandas：按日历周分组，然后绘制真实日期时间的分组条形图

EDIT 我找到了一个非常好的解决方案并将其发布在下面作为答案结果将如下所示您可以为此问题生成一些示例数据 codes list ABCDEFGH dates pd Series pd date range 2013 11 01 201
python 相当于 sed

有没有一种方法无需双循环即可完成以下 sed 命令的操作 Input Time Banana spinach turkey sed i Banana s Toothpaste file Output Time BananaToothpas
Python Web 编程的不同方法的优缺点

我想使用 Python 编写一些服务器端脚本但我对这样做的方法有点迷失了它从 DIY CGI 方法开始似乎以一些相当强大的框架结束这些框架基本上可以自己完成所有工作中间有很多东西比如web py http webpy org P
如何继承并重写 django 模型类来创建 listOfStringsField？

我想为 django 模型创建一个新类型的字段它基本上是一个 ListOfStrings 因此在您的模型代码中您将具有以下内容模型 py from django db import models class ListOfString

随机推荐

部分类调试

我已经为我的 xsd 自动生成的类创建了一个部分类问题在于调试这个部分类无法识别断点或者编译器不会在分部类中设置的断点处中断 Autogenerated class by xsd exe public partial class Cla
如何使用 Rust 合并两个 JSON 对象？

我有两个 JSON 文件 JSON 1 title This is a title person firstName John lastName Doe cities london paris JSON 2 title This is an
如何获取 TFS WIQL 项目的所有用户以及团队迭代？

我想让所有用户在项目中进行迭代假设项目 Precient 有 9 个不同的用户进行了 20 次迭代所以我希望不同的用户具有项目中的所有迭代WIQL C 这与问题有关 WIQL 查询获取项目中的所有团队和用户 https stackov
IE9 忽略某些页面的 CSS？

我有不同的网站提供服务基本上运行相同的代码一个页面可以正确呈现而另一页面似乎没有可用的 CSS 当我打开损坏页面的 IE9 开发者控制台时我看到 SEC7113 CSS was ignored due to mime type mi
在在线正则表达式测试器中工作时，正则表达式无法在 Angular Validators.pattern() 中工作

我已经在 Regex101 com 上编写并严格测试了正则表达式但是当实现到我的 FormControl Validators pattern 方法中时它显示了意外的行为这是用于要邮寄的包裹的宽度输入仅限正值最多 2 位小数最小
从 npm 下载一个包作为 tar （不是将其安装到模块中）

是否有一些 URL 可以让我从 npm 下载给定的包作为 tarball 或其他东西我需要最初上传到 npm 的确切文件 Using npm install例如获取不同的生成的 package json 我想要已发布的确切原始文件集
将 Gradle 5.3.1 升级到 6.5。旧版本下载依赖项正常，但在 6.5 上失败

我已将问题简化为一个非常简单的项目该项目声明了对从客户的工件实例提供的模块工件的模块依赖关系这在 5 3 1 中运行良好从下面的日志中可以看出有一行表明 DefaultExternalResourceArtifactResolver
java 中的 Thread.sleep() 与同步

当 Thread sleep 10000 被调用时当前线程将进入睡眠状态如果在同步方法中调用Thread sleep 10000 那么在此期间其他线程是否可以执行如果你这样做Thread sleep 10000 在同步方法中或阻止您d
使用 CakePHP Auth 时出现未定义方法 stdClass::user() 错误

我对 CakePHP 相当陌生正在使用 Auth 组件构建一个网站有几次我尝试用这个组件做一些导致错误的事情 Fatal error Call to undefined method stdClass user in ftphome s
是否可以在 Android 上创建符号链接？

我想知道在 android 中是否可以从我的 android 应用程序创建符号链接因为我想使用 sdcard 创建我的应用程序的文件夹数据的符号链接我不是 android 方面的专家但我通常使用 Java nio File File
如何自定义QCalendarWidget？

我正在尝试将一些样式表应用到我的QCalendarWidget 我已经做了一些改变这是我现在的代码 QCalendarWidget QWidget background color magenta color green QCalenda
multinom() 默认情况下如何处理 NA 值？

当我跑步时multinom say Y X1 X2 X3 如果对于某一特定行X1 is NA 即缺失但是Y X2 and X3全部都有值是否会丢弃整行就像 SAS 中那样如何处理缺失值multinom 这是一个简单的例子来自 mu
如何将 Docker Hub 镜像拉取到 Google Cloud Run？

我正在尝试将 Docker 映像拉入 Google Cloud Run 我发现我可能需要先将其拉到 Google 容器注册表但我可以以某种方式避免它吗另外我宁愿直接从源头获取它以使其保持最新我查看了该项目最后在 Cloud Run
Java 对象、更改字段侦听器、设计模式

有一个类 public class MyClass private String field1 private String field2 private String field3 getters setters 然后我们更新一些字段 M
尽管 flex-basis: 0 [重复]，Flexbox 项目的宽度并不相等

这个问题在这里已经有答案了我在 Flexbox 中有 4 列我希望它们的宽度相等那个有overflow hidden比其他人占据更多的位置而我无法修复它在我看来我遇到了与这篇文章中所述相同的问题 Flexbox 和溢出隐藏无法正
使用“从浏览器中单击”按钮打开客户端的桌面应用程序 - Python/HTML [重复]

这个问题在这里已经有答案了我想打开桌面应用程序例如记事本 Powerpoint Putty 附上它在共享点上如何工作的图像随附的示例图像显示了如何通过单击按钮打开 Microsoft Teams 我需要这个精确的复制品单击打开
Visual Studio 2015 调试并继续

我们将环境从 Visual Studio 2008 更改为 2015 更新 1 现在我们遇到了一些奇怪的调试行为当我们遇到断点并更改一些代码并继续时我们无法再在快速监视或立即窗口中看到某些类型的变量内容例如数据表图像 A type
如何测试 PHP 程序？ [复制]

这个问题在这里已经有答案了有没有办法测试程序代码我一直在研究 PHPUnit 它似乎是创建自动化测试的好方法然而它似乎是面向面向对象的代码是否有过程代码的替代方案或者我应该在尝试测试网站之前将网站转换为面向对象这可能需要一段时
System.Text.Json 将字典序列化为数组

是否可以使用 System Text Json 将字典序列化和反序列化为数组代替 hello world 我需要将我的字典序列化为 key hello value world 最好不必在我的类的字典属性上设置属性使用 newtons
在Python中的图像中的表格上创建边框

我有一个图像其中有一个表格和一些其他数据我需要为表格绘制边框以分隔每个单元格 My image looks like this What i am trying 1 dilating the image to create contin

在Python中的图像中的表格上创建边框

在Python中的图像中的表格上创建边框 的相关文章

随机推荐

热门标签

在Python中的图像中的表格上创建边框的相关文章