从图像中提取矩形身份证区域

2023-12-07

I have a hundreds of ID card images which some of them provided below: (Disclaimer: I downloaded the images from the Web, all rights (if exist) belong to their respective authors)

可以看出，它们在亮度、视角和距离、卡片方向方面都有所不同。我试图仅提取矩形卡片区域并将其保存为新图像。为了实现这一目标，我开始知道我必须将图像转换为灰度图像并应用一些阈值方法。然后，将 cv2.findCountours() 应用于阈值图像以获得多个向量点。我尝试了很多方法并开始使用 cv2.adaptiveThreshold() ，因为据说它找到阈值（因为，我无法手动设置每个图像的阈值）。但是，当我将其应用于图像时，我没有得到我想要的。例如：

My desired output should look like this:

似乎它还包括仿射变换以使卡片区域（奥巴马案例）正确，但我发现它很难理解。如果可能的话，我会进一步提取并单独保存图像。

有没有其他方法或算法可以达到我想要的效果？应考虑不同的照明条件和卡片方向。鉴于只有一张矩形身份证，我期待一种万能的解决方案。请用您认为有帮助的任何内容来指导我完成此操作。

请注意，我不能使用 CNN 作为目标检测器，它必须基于纯粹的图像处理。谢谢。

EDIT:上述结果的代码非常简单：

image = cv2.imread(args["image"])
gray_img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh_img = cv2.adaptiveThreshold(gray_img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,51,9)

cnts = cv2.findContours(thresh_img, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

area_treshold = 1000
for cnt in cnts:
    if cv2.contourArea(cnt) > area_treshold:
        x,y,w,h = cv2.boundingRect(cnt)
        print(x,y,w,h)
        cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 3)


resize = ResizeWithAspectRatio(image, width=640)
cv2.imshow("image", resize)
cv2.waitKey()

EDIT 2: I provide the gradient magnitude images below:

这是否意味着我必须同时涵盖低强度值和高强度值？因为底部的身份证边缘几乎看不出来。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从图像中提取矩形身份证区域的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
BRISK 特征检测器检测零个关键点

下面显示的 Brisk 探测器没有给我任何关键点有人可以提出一个问题吗我将尝试用一些代码解释我在下面所做的事情 include opencv2 features2d features2d hpp using namespace cv u
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
安卓的限制

我需要构建一个应用程序该应用程序拍摄相机图像并将其上传到网络在网络上进行一些处理并返回真假我在这方面遇到了一些问题希望得到澄清 1 我的应用程序有什么方法可以知道 Android 相机捕获的图像吗我从这里明白了什么 Androi
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

有没有一种方法可以将对象强制转换回其原始类型而不指定每种情况？

我有一个不同类型对象的数组我使用 BinaryWriter 将每个项目转换为其二进制等效项以便我可以通过网络发送该结构我目前正在做类似的事情 for i 0 i
点到线的距离

我创建了一个类 Point 我想计算给定点和一条线以另外 2 个点为特征之间的最短距离所有点都是已知的我尝试使用这个公式 Ax By C sqrt A 2 B 2 但我搞砸了并且变得更加困惑主要是因为数学公式我确实找到了一些网站
不良状态：意外诊断：flutter 升级到 1.20.1 后

有什么问题吗 xxx xxx Inspiron 14 3467 xxx flutter pub run build runner build INFO Generating build script INFO Generating buil
Cake PHP 致命错误 (256)

我刚刚使用蛋糕烘焙创建了一个应用程序当我运行它时我看到屏幕上写着 Sweet myApp got baked 但它上面没有样式并且在底部我收到以下错误 Fatal Error 256 ConnectionManager getData
如果我要用汇编语言编写程序，那么这个 HelloWorld 汇编代码的哪些部分是必不可少的？

我有这个简短的 hello world 程序 include
CSS 属性 border-bottom-image 不起作用？

这是我的 CSS 代码 header text moz border bottom image url images tour tab border gif 27 27 27 27 stretch stretch webkit border
MVVMCross 将小数绑定到 UITextField 删除小数点

将小数绑定到 UITextField 不允许您放置当您输入 1 时推送到源会将其删除我明白为什么会发生这种情况 MakeSafeValue 将其转换为十进制在没有的情况下读回覆盖输入的文本这看起来像是 keyup 与 onbl
JDBC：如果我丢失对 Connection 对象的引用，连接会中断吗？

如果我有以下方法 public static void C Connection con DriverManager getConnection code return 我不打电话con close 一旦方法返回连接会自动终止吗方法返回
AcmNotPossible 调用 acmStreamOpen，naudio

我正在尝试转换 PCM S16 LE araw Mono Sample rate 22050 Bit pr sample 16 to PCM mulaw PCM MU LAW Mono Sample rate 8000hz Bit pr s
使用Optional.of()方法进行方法链接是个好主意吗？

使用Optional of 方法进行方法链接是个好主意吗我与一群同事讨论了Optional of 方法目前他们正在使用Optional of 方法的项目之一实现方法链接函数式编程风格我在这里给出示例 TxResponse initT
dict.fromkeys 的不需要的行为[重复]

这个问题在这里已经有答案了我想使用初始化集合字典在Python 2 6中 dict fromkeys 但最终的结构表现得很奇怪进一步来说 gt gt gt gt x fromkeys range 10 set gt gt gt gt
理解 scipyIntegrate 的内部行为

我试图理解什么scipy integrate是在内部做的也就是说似乎发生了一些奇怪且不一致的事情如何让它正常工作我需要它一次执行一个集成步骤因为我用它做了一些事情t在 ODE 内部并且需要它保持一致所以这是我的 MWE imp
Java：对队列进行排序

我正在制作队列类型的包装器但每次添加元素时我想对里面的所有内容进行排序大部分都会是Integer 我对 Collections 框架不太熟悉有什么简单的解决方案吗 public class Round
如何构建更好的 React 列表容器组件？

我有一个获取电影的小应用程序组件树不是很深我在 App js 中有状态它将数据传递到 Movies js 组件现在 Movies js 只是一个渲染 Movies ul 列表的容器 App js 将数据传递给电影
循环打印以逗号分隔的迭代，末尾没有逗号

我是一名学生正在编写一个打印到innerHTML 中的JavaScript for 循环字符串的每个串联都添加到最后一个后跟一个逗号如何做到最后一次迭代后不打印逗号请注意逗号不是作业的一部分我只是想添加实际应用请不要使用 j
将列表内容附加到另一个列表 C#

我有以下内容名为 GlobalStrings 的主列表另一个名为 localStrings 的列表以循环为例 List
无限循环尝试从 IB 中的 xib 创建自定义视图

这是这个问题的后续使用 IB Xcode 4 5 1 和 iOS Simulator 6 0 自定义 UIView 操作方法但没有必要阅读这是我第一次尝试创建自定义 UIView 并且显然有一些东西我没有提前得到谢谢您可以提供的任何
请求：找不到连接适配器，Python3 中出现错误[重复]

这个问题在这里已经有答案了 import requests import xml etree ElementTree as ET import re gen news list r milligenel requests get http
Firestore：按对象属性查询文档

我有一个联系人集合其结构如下 name XPTO Company emails email protected name Susan text manager email protected name Fred text marketin
从图像中提取矩形身份证区域

I have a hundreds of ID card images which some of them provided below Disclaimer I downloaded the images from the Web al

从图像中提取矩形身份证区域

从图像中提取矩形身份证区域 的相关文章

随机推荐

热门标签

从图像中提取矩形身份证区域的相关文章