使用卷积神经网络进行四边形/矩形检测的想法

2024-03-03

I'v been trying to do quadrangle detection and localization for weeks, my goal is to have a robust way of getting the 4 points of an quadrangle(rectangle), so I can apply projective transform to an Image then attach it to the source image. I have try the classic opencv contour method, and also using hough transform to find lines then calculate intersections, those two methods is unusable when apply it to real life images.

所以我向CNN寻求帮助，但目前我还没有找到任何人尝试使用CNN来解决这个简单的问题。

我的第一次尝试是使用最先进的对象检测和定位方法来获取四边形的边界框，这样我就可以缩小 4 个点的搜索范围，然后使用图像处理和计算机视觉方法进一步搜索 4 个点。但尝试YOLOv2和Faster-RCNN后，预测精度并不理想。

所以我想知道是否有任何想法可以使用单个神经网络进行端到端的训练和前馈。它还必须能够很好地处理遮挡问题。

目前我的想法是删除 fc 层并制作一个与第一个输入层具有相同宽度和高度的巨大激活图（例如 448x448），然后优化 4 个最高度激活的区域，使用 argmax 来获取位置。但这种方法仅适用于一个四边形，对于角遮挡也效果不佳。

如果有人能提供任何建议，我将不胜感激。多谢！

您提到的第一种方法是完全正确的。霍夫变换之类的方法很旧，对于野外图像没有用处。当然，随着深度学习的兴起，计算机视觉领域转向了目标检测和识别。

然而，最近出现了一个非常好的讨论。我们是否忘记了计算机视觉中的几何？ http://alexgkendall.com/computer_vision/have_we_forgotten_about_geometry_in_computer_vision/

我的建议是轮廓检测，然后应用霍夫变换（使用最先进的）方法来检测您想要的矩形，关于遮挡，您可以设置霍夫变换的参数，以便对带有参数的丢失边缘像素更加宽容。例如，您可以检查最新的轮廓检测方法，如最近的CVPR论文 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shen_DeepContour_A_Deep_2015_CVPR_paper.pdf.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用卷积神经网络进行四边形/矩形检测的想法的相关文章

Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
caret::train：为 mlpWeightDecay（RSNNS 包）指定更多非调整参数

我在使用插入符号包和 RSNNS 包中的 mlpWeightDecay 方法指定学习率时遇到问题 mlpWeightDecay 的调整参数是大小和衰减将大小保持为 4 并在 c 0 0 0001 0 001 0 002 上调整衰减的示例
神经网络的局部逆

我有一个带有 N 个输入节点和 N 个输出节点的神经网络可能还有多个隐藏层和循环但让我们先忘记这些神经网络的目标是学习一个N维变量Y 给定N维值X 假设神经网络的输出是Y 学习后应该接近Y 我的问题是是否有可能得到输出 Y 的神经网
如何以 HDF5 格式提供 caffe 多标签数据？

我想将 caffe 与矢量标签一起使用而不是整数我检查了一些答案似乎 HDF5 是更好的方法但后来我陷入了这样的错误 precision layer cpp 34 检查失败 outer num inner num bottom 1
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
使用 Keras 的 ImageDataGenerator 预测单个图像

我对深度学习很陌生所以请原谅我这个可能很简单的问题我训练了一个网络来分类positive and negative 为了简化图像生成和拟合过程我使用了ImageDataGenerator和fit generator函数如下图 imp
具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
多视图几何

我从相距一定距离的两台相同品牌的相机捕获了两张图像捕获了相同的场景我想计算两个相机之间的现实世界旋转和平移为了实现这一点我首先提取了两张图像的 SIFT 特征并进行匹配我现在有基本矩阵也单应性矩阵然而无法进一步进行有很多混乱
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
归一化互相关的基础知识

我正在尝试使用范数校正2 归一化互相关 http en wikipedia org wiki Cross correlation Normalized cross correlation 来自 MATLAB 用于计算发育中胚胎中移动形状的速
Matlab颜色检测

我试图一致地检测同一场景的图像之间的某种颜色这个想法是根据颜色配置文件识别一组对象因此例如如果给我一个带有绿色球的场景并且我选择绿色作为我的调色板的一部分我想要一个具有反映它检测到球的矩阵的函数任何人都可以为这个项目推荐一些
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl

随机推荐

Firebase从中间键上下查询数据

我有一个有日期的数据列表我通常查询按日期排序的数据但我遇到的情况是我需要从中间键来回检索一些数据我有按日期排序的数据 orderByChild date 像这样 key1 date 2016 07 25 key2 date 2016
Body/HTML 元素缩小到比视口小得多

我正在使我的 WordPress 网站具有响应能力我正在处理的页面上有两个图像我想将它们设置为max width100 使它们响应这是我在我制作的另一个网站上所做的并且效果很好然而我注意到当我在 Chrome 开发工具中缩小页面
仅更改底部导航视图的一个图标的大小（Android）

我只想更改底部导航视图中使用的 5 个图标中的一个图标第三个图标的大小我想要中心图标像这样大这是我尝试过的 private fun setReportPainIconSize val bottomNavigationView fin
Sql：优化 BETWEEN 子句

我写了一份声明需要将近一个小时才能运行因此我寻求帮助以便我可以更快地完成此操作那么我们开始吧我正在对两个表进行内部联接我有许多由间隔表示的时间间隔并且我想仅从这些间隔内的测量中获取测量数据 intervals 有两列一列是间
如何在UWP中访问本地网络（SMB）？

我现在正在寻找很长一段时间但我找不到针对这个特定问题的任何有效解决方案我的目标是为主 HoloLens 应用程序创建一个后台应用程序这意味着它必须在 UWP 中完成它应该能够访问本地文件和本地网络 SMB 以便它可以映射文件层次结构
有哪些方法可以清除 R 环境中的对象？

我知道我可以使用 ls 和 rm 来查看和删除环境中存在的对象然而在处理旧 RData 文件时有时需要选择一个环境的一部分来查找要保留的内容和要省略的内容我想做的是有一个类似 GUI 的界面让我可以查看对象对它们进行排序例如
如何在android中为按钮添加图像？

如何向按钮添加图像而不是文本相当幽默的是考虑到你的标签只需使用ImageButton http developer android com reference android widget ImageButton html widge
在 Kubernetes 部署中指定 Depends on

我有两个 Kubernetes 部署即后端和前端前端部署取决于后端部署意味着后端部署 Pod 准备就绪后应该创建前端的 Pod 如何在部署 yaml 中指定这一点您正在寻找的解决方案是初始化容器 Pod 可以有一个或多个 Init
如何将 Parse Push 与 Cordova、Appcelerator 等一起使用

Parse 的 JavaScript SDK 不支持注册推送通知但 Parse 知道如何将推送发送到 iOS 和 Android 设备有什么方法可以设置 iOS Android 等的推送吗确实 Parse 的 JS SDK 不直接支持
Bootstrap modal：禁用关闭背景单击而不禁用背景控件

如何防止模式在后台单击时关闭并且仍然让单击注册以与屏幕上的其余控件一起使用使用静态方法 myModal modal backdrop static keyboard false 禁用整个背景编辑我的确切问题是这样的我在屏幕上有不同
使用 PHP 为 Bootstrap 3 编译更少的 CSS

据我所知 PHP 中有两个 LessCSS 编译器 http leafo net lessphp http leafo net lessphp http lessphp gpeasy com http lessphp gpeasy com
在

使用卷积神经网络进行四边形/矩形检测的想法

neuralnetwork

ComputerVision

deeplearning

objectdetection

使用卷积神经网络进行四边形/矩形检测的想法的相关文章

Tensorflow构建量化工具-bazel构建错误

torch.stack() 和 torch.cat() 函数有什么区别？

caret::train：为 mlpWeightDecay（RSNNS 包）指定更多非调整参数

神经网络的局部逆

如何以 HDF5 格式提供 caffe 多标签数据？

BERT 输出不确定

在 TensorFlow 中将多个字节读取到单个值中

Caffe，在层中设置自定义权重

使用 Keras 的 ImageDataGenerator 预测单个图像

具有多个输入的 Keras TimeDistributed 层

如何在 Caffe 的网络中出现多次损失？

多视图几何

Encog - 如何加载神经网络的训练数据

如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

归一化互相关的基础知识

Matlab颜色检测

从图像坐标获取对象的世界坐标

Caffe 的 LSTM 模块

在 Tensorflow 对象检测 API 中绘制验证损失

预测测试图像时出现错误 - 无法重塑大小数组

随机推荐

Firebase从中间键上下查询数据

Body/HTML 元素缩小到比视口小得多

仅更改底部导航视图的一个图标的大小（Android）

Sql：优化 BETWEEN 子句

如何在UWP中访问本地网络（SMB）？

有哪些方法可以清除 R 环境中的对象？

如何在android中为按钮添加图像？

在 Kubernetes 部署中指定 Depends on

如何将 Parse Push 与 Cordova、Appcelerator 等一起使用

Bootstrap modal：禁用关闭背景单击而不禁用背景控件

使用 PHP 为 Bootstrap 3 编译更少的 CSS

在

使用卷积神经网络进行四边形/矩形检测的想法

使用卷积神经网络进行四边形/矩形检测的想法 的相关文章

随机推荐

使用卷积神经网络进行四边形/矩形检测的想法的相关文章