删除边框线上方图像的顶部部分以检测文本文档

2023-12-02

Using OpenCV (python) I am trying to remove the section of image which is above the border line (white area in this sample image where ORIGINAL is writtn) in the image shown below

使用水平和垂直内核，我可以绘制线框，但是这不能多次工作，因为很多时候由于扫描质量，在线框之外很少出现水平或垂直线，这会导致错误的轮廓检测。在此图像中，您还可以看到右上角有噪声，我将其检测为最上面的水平线。

我想要的是，一旦我得到实际的盒子，我就可以简单地使用 x、y 坐标对所需字段（如参考编号、发布日期等）进行 OCR 扫描。

Following is what I have been able to extract using the code below. However not able to clip the outer extra section of image due to noisy horizontal or vertical lines outside this wireframe. Also tried filling outside section with black and then detecting the contours.
Suggestions please...

    kernel_length = np.array(image).shape[1]//40 
# A verticle kernel of (1 X kernel_length), which will detect all the verticle lines from the image.
verticle_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, kernel_length))
# A horizontal kernel of (kernel_length X 1), which will help to detect all the horizontal line from the image.
hori_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (kernel_length, 1))
# A kernel of (3 X 3) ones.
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
# Morphological operation to detect verticle lines from an image
img_temp1 = cv2.erode(gray, verticle_kernel, iterations=3)
verticle_lines_img = cv2.dilate(img_temp1, verticle_kernel, iterations=3)

在这里应该使用简单的轮廓过滤方法，而不是试图找到水平/垂直线来检测文本文档。这个想法是对图像进行阈值处理以获得二值图像，然后找到轮廓并使用轮廓区域进行排序。最大的轮廓应该是文本文档。然后我们可以应用一个四点透视变换获得图像的鸟瞰图。结果如下：

输入图像：

Output:

请注意输出图像如何仅包含所需的文本文档，并且对齐时没有倾斜角度。

Code

from imutils.perspective import four_point_transform
import cv2
import numpy

# Load image, grayscale, Gaussian blur, Otsu's threshold
image = cv2.imread("1.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (3,3), 0)
thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Find contours and sort for largest contour
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
displayCnt = None

for c in cnts:
    # Perform contour approximation
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.02 * peri, True)
    if len(approx) == 4:
        displayCnt = approx
        break

# Obtain birds' eye view of image
warped = four_point_transform(image, displayCnt.reshape(4, 2))

cv2.imshow("thresh", thresh)
cv2.imshow("warped", warped)
cv2.imshow("image", image)
cv2.waitKey()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

删除边框线上方图像的顶部部分以检测文本文档的相关文章

如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
如何用 JavaScript 修复图像透视变形和旋转？

我有一些用手机拍摄的图像有没有可以拉直纸张照片并将其压平的 JavaScript 库例如我想创建一个矩形图像该图像没有任何失真换句话说我想知道如何用 JavaScript 修复透视变形和旋转例如我发现下面的示例图像来自this
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
为什么这个 gif 的持续时间似乎是 0 毫秒？如何找到真实的持续时间？

我正在尝试从动画 gif 文件中获取持续时间和帧数以便计算 gif 的平均帧速率然后将其转换为视频我最近在测试过程中看到了这张图片它似乎让一切都相信它的持续时间为 0 毫秒为什么如何找到真实的持续时间到目前为止我已经尝试过 e
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型

随机推荐

远程 Webdriver Chrome 抛出“驱动程序可执行文件的路径”错误

你好当我使用以下代码时 IWebDriver webDriver new RemoteWebDriver new Uri http 127 0 0 1 4444 wd hub DesiredCapabilities Chrome 我收到以
当我在 onCreate() 中调用 findViewById() 时，它返回 null

我的第一个 Android 应用程序上的 findViewById 遇到问题我试图调用这个函数但总是返回 null 我的应用程序有 2 个活动在第二个活动 activity display message 中我有以下代码 Overri
ASP.NET Web 应用程序中的多个 Web.Config 文件

我有一个 ASP NET Web 应用程序其中根文件夹中有多个子目录在我的根 web config 中我将 sessionMode 设置为 StateServer 因此在我的子目录的一页中我无法进行序列化如果我将 Session
C++ 中的 PyQt 自定义小部件

我可以用纯 C 编写自定义 Qt 小部件编译它并在 PyQt 中使用吗我正在尝试将 ctypes opencv 与 qt 一起使用但我在使用 python 代码以 Qt 形式显示 opencv 图像时遇到性能问题您必须使用以下方法为
Map对象转换为列表后清空自身

我不明白为什么map对象刷新自身如果这就是它正在做的事情这是我尝试过的 gt gt gt squares map lambda x x 2 range 10 gt gt gt squares
使用 JAXB 对 XML 进行部分解组以跳过某些 xmlElement

我想使用 JAXB 将 XML 文件解组为 java 对象 XML 文件非常大包含一些节点在某些情况下我想跳过这些节点以提高性能因为这些元素不可由客户端 java 程序编辑 XML 示例如下
如何从 NSDate 对象检索午夜过后的小时数？

我需要从 iPhone 项目中的 UIDatePicker 控件检索午夜过后的小时数 datePickerMode被设定为UIDatePickerModeTime 所以用户只能设置时间不能设置日期当用户完成并关闭 UIDatePicke
f 升值的合并排序

这是我的代码当我输入一个非常大的数字时我收到堆栈溢出错误有人知道为什么吗当我输入一个非常大的数字时我收到该错误我不太确定是什么原因导致的只有大数字小数字才能正常工作 merge two sorted lists into one
Android Studio 1.2.2 ClassNotFoundException android.widget.viewstub

我刚刚安装了 Android Studio 每当我启动一个项目时甚至是 IDE 创建的默认 Hello world 活动我有一个例外 java lang ClassNotFoundException 未找到类路径上的 android
如何将我的 Zip 文件转换为 NSData 以将我的 Zip 文件作为附件通过电子邮件发送

我正在使用 Objective Zip 库来压缩我拍摄的几张图像我我猜已经到了压缩图像的地步了现在我想用邮件编辑器发送这个压缩文件但是我需要在我的邮件函数中声明一个 NSData 对象 picker addAttachmentDa
合并行，连接以逗号分隔的一列中的内容-R 编程

我需要帮助合并数据 mydf 中具有相同名称即起始列的行并连接 ALT 列中的内容从而根据起始列中的相似值删除所有重复的行我想合并行并连接 ALT 列中用逗号分隔的内容并得到如下所示的结果感谢您的帮助 gt mydf chr
在 ML 分类器中对文本进行编码

我正在尝试构建一个机器学习模型但是我很难理解在哪里应用编码请参阅下面的步骤和功能来复制我一直遵循的过程首先我将数据集分为训练和测试 Import the resampling package from sklearn naive b
如何仅用一个语句从列表中删除多个项目？

在 python 中我知道如何从列表中删除项目 item list item 5 foo 3 14 True item list remove item item list remove 5 上面的代码删除了值 5 和 item item
使用 OpenCV 计算两幅图像的相似度百分比

我可以使用下面显示的代码找到匹配的功能我想计算两个图像之间的相似度百分比我是 OpenCV 新手任何形式的帮助将不胜感激 FeatureDetector detector FeatureDetector create FeatureD
随机化两个列表（numpy in）并维持python中的顺序

我有两个 2d numpy 列表我想洗牌但只是外侧洗牌如果我随机排列列表 a 的顺序我希望列表 b 遵循列表 a 的顺序我见过在Python中随机化两个列表并保持顺序但这看起来对我不起作用下面的代码是我现在正在做的事情但对于大
%op% 运算符是什么意思？例如“%in%”？

我尝试进行这个简单的搜索但在百分比上找不到任何内容 R 中的符号什么是 in 下面代码中的意思是 time x in time y where x and y是矩阵我如何查找帮助 in 和类似的功能遵循 stuff 模式因为我找不
如何使用 Apache htaccess 重新排序 URL 参数/查询字符串？

我有带有多面导航过滤的电子商务类别过滤可以生成数千个有用的 URL 我想减少nr 通过始终在相同的 URL 上以相同的查询字符串参数顺序显示某些内容来显示可能的 URL 从 SEO 的角度来看我可以使用规范标签从逻辑上消除重复的
primefaces 数据导出器 XLS 仅导出标题而不导出行

我的问题是当我单击按钮导出数据表时它仅导出列标题我的 Excel 文件生成时没有任何行
获取 HPUX 上正在运行的进程的可执行文件的完整路径

我想使用 C 代码在没有 root 权限的情况下获取正在运行的进程可执行文件的完整路径有人可以建议一种方法来实现这一目标在 Linux 平台上我可以使用以下方式来做到这一点 char exepath 1024 0 char pro
删除边框线上方图像的顶部部分以检测文本文档

Using OpenCV python I am trying to remove the section of image which is above the border line white area in this sample

删除边框线上方图像的顶部部分以检测文本文档

删除边框线上方图像的顶部部分以检测文本文档 的相关文章

随机推荐

热门标签

删除边框线上方图像的顶部部分以检测文本文档的相关文章