现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗?

2024-04-28

众所周知,用于目标检测的 nVidia DetectNet - CNN(卷积神经网络)基于 Yolo/DenseBox 的方法:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

DetectNet 是流行的 GoogLeNet 网络的扩展。这 扩展与中采用的方法类似Yolo 和 DenseBox文件。

如图所示,DetectNet 可以检测任意旋转的物体(汽车):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗?

我可以在具有相同物体旋转角度的数千张不同图像上训练 DetectNet,以检测任何旋转角度的物体吗?

那么基于 DetectNet 的 Yolo、Yolo v2、DenseBox 的旋转不变式又如何呢?


No

在分类问题中,CNN 不是旋转不变的。您需要在训练集中包含每一次可能的旋转图像。

您可以训练 CNN 将图像分类为预定义的类别(如果您想像示例中那样检测图像中的多个对象,则需要使用分类器扫描图像的每个位置)。

然而,这是一个对象检测问题,而不仅仅是一个分类问题。

在目标检测问题中,可以使用滑动窗口方法,但效率极低。相反,简单的 CNN 其他架构都是最先进的。例如:

  • 更快的 RCNN:https://arxiv.org/pdf/1506.01497.pdf https://arxiv.org/pdf/1506.01497.pdf
  • 优乐网:https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/
  • SSD: https://arxiv.org/pdf/1512.02325.pdf https://arxiv.org/pdf/1512.02325.pdf

这些架构可以检测图像中任何位置的对象,但您还必须在训练集中包含具有不同旋转的样本(并且训练集必须使用边界框进行标记,这非常耗时)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗? 的相关文章

随机推荐

  • R从原始数据生成二维直方图

    我有一些 2D x y 的原始数据 如下所示 我想从数据生成二维直方图 通常 将 x y 值划分为大小为 0 5 的 bin 并计算每个 bin 中出现的次数 同时针对 x 和 y 有什么办法可以做到这一点吗 gt df x y 1 4 2
  • 在多处理中出现异常时,我是否需要手动调用 pool.terminate ?

    看来以下两个片段具有相同的行为 def sqr a time sleep 1 2 print local format os getpid if a 20 raise Exception fff return a a pool Pool p
  • 如何缩小 Windows Phone 中的图像尺寸

    我正在尝试将我的应用程序移植到 Windows Phone 中 我必须在服务器上上传图像 所以它的尺寸很小为了上传我已经在Widows中成功完成了这件事 但问题是当我失败时 这是我的Windows应用程序代码 public void Com
  • 如何在(非 Android)Java 应用程序中检索 Firebase 数据?

    有没有办法将数据从 Firebase 检索到 Java 应用程序 我有一个 Android 应用程序 它将数据存储到 Firebase 数据库中 我需要在 Java 应用程序中读取该数据 我在网上搜索过 但没有找到明确的答案 不是浏览器的U
  • 错误:样式父级的资源类型“attr”无效

    将我的 Android 项目升级到 Studio 3 0 1 和 Gradle 3 0 后 我在构建过程中遇到了一个问题 MAFLogonUI 3 15 6 aar 46f903e9d58266c453b893b9caa03deb res
  • 如何转换该对象数组?

    我有个问题 我有该对象数组 const iHaveThis question What s your name answer dda form filled key 15 question What s your e mail answer
  • 查找每个 pandas 数据帧行中前 n 个最高值列的名称

    我有以下数据框 id p1 p2 p3 p4 1 0 9 1 4 2 0 2 3 4 3 1 3 10 7 4 1 5 3 1 5 2 3 7 10 我需要以一种方式重塑数据框 对于每个 id 来说 它将具有具有最高值的前 3 列 结果会是
  • 有条件跳过 TestNG 测试

    我对 TestNG 注释没有太多经验 但是我正在尝试使用 TestNG 框架和 POM 设计模式为零售网站构建测试套件 我计划使用数据驱动的方法 我的计划是通过 Excel 驱动我的测试场景 而不是使用 testng xml 例如 我将拥有
  • 本地计算机的 Onenote API

    这是我在 Stackoverflow 上的第一篇文章 我正在寻找有关 OneNote API 的指导 我期待开发一个主要用于 自己使用 的解决方案 在我的本地计算机上创建 打开和关闭 OneNote 部分 不使用云等 请指导是否可以 我希望
  • 如何获取真实的屏幕高度和宽度?

    DisplayMetrics metrics new DisplayMetrics this getWindowManager getDefaultDisplay getMetrics metrics screenWidth metrics
  • 如何以 OO 风格打开管道?

    我用新风格重写了旧代码 如下所示 old style open FD file new style fh IO File gt new file r 文件没问题 但我不知道如何打开管道 read from pipes open PIPE s
  • dotnet 技术中的类库和安全性

    假设我已经开发了类库 并且我希望我只能在我的项目中使用这个库 但是如果有人尝试复制 dll 文件并想在他的项目中使用它 那么他将无法这样做 所以我只是想知道如何在 dll 文件中嵌入这种类型的安全性 请告诉我所有方法 谢谢 您可以在程序集中
  • Hibernate NoCacheRegionFactoryAvailableException

    我遇到了一个奇怪的 Hibernate 异常 我无法解释 它告诉我我正在使用二级缓存 但没有在哪里hibernate cfg xml我是否指定二级缓存 这是例外情况 org hibernate cache NoCacheRegionFact
  • Redux Toolkit RTK Query 发送查询参数

    如何使用 Redux Toolkit RTK 查询将查询参数传递到 api import createApi fetchBaseQuery from reduxjs toolkit query react const baseUrl xxx
  • 仅对 Visual Studio 团队服务强制执行拉取请求

    有一种方法可以强制某些人只能通过拉取请求为一个分支做出贡献 我希望他们能够接受拉取请求 但不能直接推送更改 这将很有用 因为我们有一些分支策略 对于接受拉取请求的人来说 例如构建必须通过 问题是 如果我们允许某人接受拉取请求 我们将允许他们
  • Enterprise Java Bean 到底是什么?

    Tomcat FAQ 上说 Tomcat 不是 EJB 服务器 Tomcat 不是完整的 J2EE 服务器 但如果我 使用 Spring 提供应用程序上下文 使用 JPA 注释我的实体 注释 并使用 Hibernate 作为 JPA 提供商
  • 在 SSIS 中插入新记录之前如何清空目标表?

    我使用 SSIS 生成和转换新数据 以便以后在新系统中使用 每次运行 SSIS 包时我都会遇到问题 它不断将新记录插入到我的目标表中 如何先清空目标表 OLE DB Destination 然后插入新生成的记录 目前此问题的解决方法是执行d
  • 访问Firebase规则中的电子邮件地址[重复]

    这个问题在这里已经有答案了 我正在使用 Firebase 3 编写 firebase 规则时 auth 对象仅包含 uid 和提供程序 有什么方法可以增强此功能以提供电子邮件地址吗 我试图解决的问题是 我正在处理的网站的所有者希望根据用户的
  • HTML 语义:将链接(锚元素)放在标题中是个好主意吗?

    以这种方式建立新闻列表是错误的吗 h1 a href article 1 html That happened a h1 div class short Just like planned div 我应该更喜欢这个吗 h1 That hap
  • 现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗?

    众所周知 用于目标检测的 nVidia DetectNet CNN 卷积神经网络 基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj