如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格? [关闭]

2024-03-23

我想检测图像中的表格。识别表格块以及其中可能的文本。 在 tesseract 的早​​期版本中,可以使用参数 textord_dump_table_image。如何在tesseract 4.0中提取表格?


比较奇怪的是,目前没有可用的 API 可以直接获取 tesseract 中的表区域。不过,您可以使用一个小技巧“咳嗽”来获取表格坐标。

有一个配置选项文本显示表对于超立方体。将其设置为true使用配置文件或其他方式。 Tesseract 内置了显示其内部状态的功能,以便您可以查看其分割和识别情况。

为 Tesseract 构建并安装查看器调试器。参考查看器调试 https://github.com/tesseract-ocr/tesseract/wiki/ViewerDebugging

上面的链接中也描述了其使用说明。它是一个在端口 8461 上运行的简单 ServerSocket,当 tesseract 处理您的图像时,它将打开多个窗口。您可以在名为“检测到的表”的窗口中查看检测到的表。

然而,大多数人实际上对获取表格的坐标列表感兴趣。要实现此目的,您可以编写自己的服务器套接字,侦听端口 8461,并欺骗 tesseract 将消息发送到本地运行的服务器。 发送到服务器的消息是 lua 格式的。这些是设置和绘制 GUI 的说明。您可以编写一个简单的解析器来解释这些指令并提取坐标。 大多数指令没有任何用处。留意 tesseract 何时发送创建名为“检测到的表”或类似内容的窗口的指令。所有用黄色绘制的矩形(255,255,0)都是表格。所以这些是您真正关心的说明。 我建议将所有说明转储到文件/控制台中,并亲自查看。

PS:你可能想添加交互显示模式 1在您的配置设置中。它可以防止 tesseract 在发送所有指令之前关闭。

我承认这不是一个优雅的解决方案,但仍然有效。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格? [关闭] 的相关文章

随机推荐