如何在opencv中从图片中检测文档？

2024-03-28

我正在尝试设计一个类似于 camscanner 的应用程序。为此，我必须拍摄一张图像，然后在其中找到文档。我从这里描述的代码开始 -http://opencvpython.blogspot.in/2012/06/sudoku-solver-part-2.html http://opencvpython.blogspot.in/2012/06/sudoku-solver-part-2.html

我发现轮廓和最大面积的矩形轮廓应该是所需的文件。对于每个轮廓，我都找到一个近似闭合的 PolyDP。在所有尺寸为 4 的 PolyDP 中，面积最大的应该是所需的文档。然而，这个方法不起作用。

The input image for the process is this

I tried to print the contour with max area and this resulted in this (Contour inside letter 'C')

Code:

img = cv2.imread('bounce.jpeg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray,(5,5),0) 
thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2)
_, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

def biggestRectangle(contours):
    biggest = None
    max_area = 0
    indexReturn = -1
    for index in range(len(contours)):
            i = contours[index]
            area = cv2.contourArea(i)
            if area > 100:
                    peri = cv2.arcLength(i,True)
                    approx = cv2.approxPolyDP(i,0.1*peri,True)
                    if area > max_area: #and len(approx)==4:
                            biggest = approx
                            max_area = area
                            indexReturn = index
    return indexReturn

indexReturn = biggestRectangle(contours)
cv2.imwrite('hola.png',cv2.drawContours(img, contours, indexReturn, (0,255,0)))

这到底是怎么回事？还有其他方法可以捕获这张图片中的文档吗？

尝试这个：输出图像 https://i.stack.imgur.com/52xOs.jpg

import cv2
import numpy as np

img = cv2.imread('bounce.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
invGamma = 1.0 / 0.3
table = np.array([((i / 255.0) ** invGamma) * 255
for i in np.arange(0, 256)]).astype("uint8")

# apply gamma correction using the lookup table
gray = cv2.LUT(gray, table)

ret,thresh1 = cv2.threshold(gray,80,255,cv2.THRESH_BINARY)

#thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2)
_, contours, hierarchy = cv2.findContours(thresh1, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

def biggestRectangle(contours):
    biggest = None
    max_area = 0
    indexReturn = -1
    for index in range(len(contours)):
            i = contours[index]
            area = cv2.contourArea(i)
            if area > 100:
                peri = cv2.arcLength(i,True)
                approx = cv2.approxPolyDP(i,0.1*peri,True)
                if area > max_area: #and len(approx)==4:
                        biggest = approx
                        max_area = area
                        indexReturn = index
    return indexReturn

indexReturn = biggestRectangle(contours)
hull = cv2.convexHull(contours[indexReturn])
cv2.imwrite('hola.png',cv2.drawContours(img, [hull], 0, (0,255,0),3))
#cv2.imwrite('hola.png',thresh1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

imageprocessing

edgedetection

如何在opencv中从图片中检测文档？的相关文章

在linux上编译一个基本的OpenCV + Cuda程序

我过去在linux上使用过opencv 但没有使用过cuda 几个月来我一直在与以下编译错误作斗争在尝试了许多解决方案后我放弃并使用 Windows 不过我真的很想在 Linux 上工作这是我用来编译 opencv gpu 网站上给
使用额外模块构建 opencv 错误 ocv_download

我尝试使用 Extramodules 构建 openCV 如果我尝试使用 cmake 配置项目文件 Windows 10 上的 vc14 x32 则会出现错误 opencv contrib master modules xfeatures2
使用 ffmpeg 进行视频标准化

无论如何有没有使用 ffmpeg 脚本将视频亮度标准化为其完整的动态范围我一直在尝试用 lutyuv 这样做 ffmpeg i input mp4 vf lutyuv y val minval 255 maxval minval 输出
ORB 演示代码出现 cv2.error 错误：来自 OpenCV 代码的未知 C++ 异常

ORB 演示代码位于https opencv python tutroals readthedocs io en latest py tutorials py feature2d py orb py orb html https openc
无法保存从网络摄像头捕获的图像（OpenCV 2.3 的 imwrite 编译错误）

我正在使用 OpenCV 2 3 制作简单的网络摄像头程序但遇到了编译错误任何想法将不胜感激编译后我在 imwrite 处收到以下错误在下面代码的 read 函数中这个样本 https code ros org svn open
如何从Python使用OpenCV的C++函数？

我正在使用 OpenCV 的 Python 绑定它真的很棒但是 C 版本中的某些函数在 Python 绑定 BackgroundSubstractorMOG2 和许多特征检测算法中缺失从 Python 调用它们的最简单方法是什么我希
筛选提取-opencv

我正在尝试开始使用 C OpenCv 进行筛选特征提取我需要使用 SIFT 提取特征将它们在原始图像例如一本书和场景之间进行匹配然后计算相机姿势到目前为止我已经找到了这个算法 http opencv itseez com doc
如何从opencv中的轮廓中提取简单的几何形状

我有一个Mat contours我已经近似了每个contour with approxPolyDP 我现在想做的是检测矩形三角形圆形等形状以及例如用不同的颜色或使用画布等重新绘制它们有没有办法利用轮廓我如何访问点Mat conto
python中图像的几何扭曲

我想使用 python 对图像执行几何变换以沿给定曲线拉直或校正图像似乎 scikit imageProjectiveTransform and warp 对此非常有用但文档很少我按照文档进行操作here http scikit
从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
opencv中如何使用腐蚀和膨胀函数？

我试图通过侵蚀和膨胀过程消除数字周围的东西我尝试过但什么也没发生我更改这些值只是为了看看是否会改变某些内容但同样什么都没有改变图像继续如上面的链接所示这个参数怎么样我阅读了文档但不太明白正如你所看到的我在函数中猜测我究
C++/OpenCV - 用于视频稳定的卡尔曼滤波器

我尝试使用卡尔曼滤波器稳定视频以进行平滑但我有一些问题每次我都有两帧一帧是当前帧另一帧是当前帧这是我的工作流程计算 goodFeaturesToTrack 使用 calcOpticalFlowPyrLK 计算光流只保留优点
在python中使用tesseract 3.02的C API与ctypes和cv2

我正在尝试在 python 中将 Tesseract 3 02 与 ctypes 和 cv2 一起使用 Tesseract 提供了一组公开的 DLL C 风格 API 其中之一如下 TESS API void TESS CALL TessB
删除图像中小于 n 大小（噪声）的像素 - open CV python

我正在尝试减少图像中的噪音目前正在运行此代码 import numpy as np import argparse import cv2 from skimage import morphology Construct the argum
OpenCV Python - 如何实现RANSAC来检测直线？

我正在尝试检测包含道路的图像上的线条使用高斯平滑和 Canny 边缘检测我在尝试实现 RANSAC 时遇到了困难我基本上不知道如何去做我可以获得一个粗略的想法或一个带有实现 RANSAC 的随机图像 foo png 的工作代码吗 N
Android Camera2 API - 实时显示处理后的帧

我正在尝试创建一个实时处理相机图像并将其显示在屏幕上的应用程序我正在使用camera2 API 我创建了一个本机库来使用 OpenCV 处理图像到目前为止我已经成功设置了一个 ImageReader 来接收 YUV 420 888 格
在进行字符识别之前使用 OpenCV 进行图像预处理（超正方体）

我正在尝试开发简单的 PC 应用程序用于车牌识别 Java OpenCV Tess4j 图像不是很好进一步它们会很好我想对超立方体图像进行预处理但我被困在车牌检测矩形检测上我的步骤 1 源图像 Mat img new Mat i
防止 ffmpeg 在降低视频分辨率的同时改变颜色强度

我有一个用例我需要缩小规模716x1280mp4 视频到358x640 原件的一半我使用的命令是 ffmpeg i input mp4 vf scale 640 640 force original aspect ratio decre
我无法在 docker 中安装 opencv-contrib-python

我尝试安装opencv contrib python但我无法让它在 docker 上工作它说找不到满足 opencv contrib python 要求的版本 I tried pip install opencv contrib pyth
在Matlab中使用中心切片定理实现滤波反投影算法

我正在研究一种使用中心切片定理的滤波反投影算法作为家庭作业虽然我理解纸上的理论但在 Matlab 中实现它时遇到了问题我得到了一个可以遵循的框架但我认为我可能误解了一个步骤这是我所拥有的 function img sampleFB

随机推荐

TStringList 的 addObject 方法

我想知道这个方法调用的作用 stringList addObject String Object 我也想知道这个属性是做什么的 stringList Objects i 添加时看起来像键值对但是在循环检索时检索到了什么我还看到 ite
Tensorflow将LSTM的最终状态保存在dynamic_rnn中用于预测

我想保存 LSTM 的最终状态以便在恢复模型时将其包含在内并可用于预测如下所述当我使用时保护程序仅了解最终状态tf assign 但是这会引发错误也将在下面解释在训练期间我总是将最终的 LSTM 状态反馈回网络如中所述这个
Spring集成测试时如何mock Eureka？

我正在 Spring Boot 中运行一个简单的 Junit 测试控制器测试代码如下所示 RunWith SpringJUnit4ClassRunner class SpringApplicationConfiguration class
setEndTime 必须在 setStartTime 之后调用

尝试使用 JMeter JMS Publisher 推送消息但低于错误这是jmeter端错误还是服务器端错误 Error setEndTime must be called after setStartTime java lang Th
使用 Google App Engine 时需要解决哪些安全问题？

我一直在考虑将 Google App Engine 用于一些业余爱好项目虽然他们不会处理任何敏感数据但出于多种原因我仍然希望使它们相对安全例如了解安全性法律等使用 Google App Engine 时需要解决哪些安全问题它们
手动修改参考类实例的类定义

我知道这将是一个非常不可靠的黑客行为但出于纯粹的兴趣您需要手动更改什么 refClassDef如果已实例化的对象的引用类定义发生更改并且您希望它收到有关更新的通知而不重新实例化它则引用类对象的字段毕竟如果额外的方法被引入但
如何抑制有关 Sun 专有 API 的 java 编译器警告 [重复]

这个问题在这里已经有答案了我正在使用 sun misc BASE64Encoder 包中的encode 方法如何抑制它生成的编译器警告 sun misc BASE64Encoder 是 Sun 专有 API 可能会在作为后续为什么我
数组/数据存储选项

我是 Android 新手正在尝试开发我的第一个应用程序在我的应用程序中我有一个列出一组商店的列表视图活动当应用程序用户下载该应用程序的任何人选择他们最喜欢的商店时应将 1 添加到该商店计数中在一年中的特定时间我想按商店数
当我使用computeIfAbsent计算斐波那契数时，hashmap size()返回错误的值

我有以下代码 import java math BigInteger import java util HashMap import java util Map public class DynamicFib private static
错误消息“运算符 '.'将方法转换为扩展方法时，无法应用于“lambda 表达式”类型的操作数？

我有一个方法想要转换为扩展方法 public static string GetMemberName
String.replaceAll 比自己完成这项工作要慢得多

我有一段旧代码可以在字符串中执行查找和替换标记它收到一张地图from and to对迭代它们对于每个对迭代目标字符串查找from using indexOf 并将其替换为to 它完成了所有工作StringBuffer最终返回一个
QueryDSL 条件排序依据

我想翻译原生sql 例如 ORDER BY currency EUR DESC money DESC 进入查询DSL orderBy qItem currency eq EUR desc qItem money desc 然而它抛出 org
CMake - 安装第三方 dll 依赖项

我正在使用一个预编译的第三方库它有多个 DLL 一个用于实际的第三方还有一些作为其自己的依赖项我的目录结构如下 MyApp CMakeLists txt Root CMake file src MyCode cpp thirdpart
如何在两个 WiX 项目中共享 WiX 片段？

我们在 SomeDialog wxs 文件中有一个 WiX 片段它提示用户输入一些信息它在控制对话框顺序的 InstallerUI wxs 文件中的另一个片段中引用当然 Product wxs是我们的主文件效果很好现在我有第二个
如何获取具有相同键值并以逗号分隔的对象

我有一个对象数组每个对象都有键和值我希望如果对象具有相同的键那么它们的值应该以逗号分隔相同键的所有值我的html代码 p class item item id p
归并排序的实现

我是 C 新手正在尝试开发合并排序的代码我用大小为 5 的样本数组对其进行了测试但代码给出的答案不正确我不明白出了什么问题这是我的代码 include
确定数组是算术级数还是几何级数（来自 Coderbyte）

就 coderbyte 而言这是我的功能代码但我有一种感觉事情不应该这么复杂我错过了一个简单的技巧吗 function ArithGeo arr var array type 1 if arr length lt 2 return
不死对象 ([basic.life]/8)：为什么允许引用重新绑定（和 const 修改）？

不死条款我将 undead 子句称为 C 规则即在对象销毁后如果在同一地址创建新对象则有时可以将其视为与旧对象相同的对象该规则在 C 中始终存在但附加条件发生了一些变化我被迫阅读最新的不死条款这个问题 https stack
如何将 HTML 内容传递到 MVC-Razor 中的部分视图（如“for”块）

我在我的应用程序中使用 Chromatron 主题作为管理面板有一个侧边栏小工具其中包含 HTML 内容通过一点 CSS 技巧它可以显示完全不同的内容 section class sidebar nested h2 Nested S
如何在opencv中从图片中检测文档？

我正在尝试设计一个类似于 camscanner 的应用程序为此我必须拍摄一张图像然后在其中找到文档我从这里描述的代码开始 http opencvpython blogspot in 2012 06 sudoku solver par

如何在opencv中从图片中检测文档？

如何在opencv中从图片中检测文档？ 的相关文章

随机推荐

热门标签

如何在opencv中从图片中检测文档？的相关文章