现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

2024-04-28

众所周知，用于目标检测的 nVidia DetectNet - CNN（卷积神经网络）基于 Yolo/DenseBox 的方法：https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

DetectNet 是流行的 GoogLeNet 网络的扩展。这扩展与中采用的方法类似Yolo 和 DenseBox文件。

如图所示，DetectNet 可以检测任意旋转的物体（汽车）：https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

我可以在具有相同物体旋转角度的数千张不同图像上训练 DetectNet，以检测任何旋转角度的物体吗？

那么基于 DetectNet 的 Yolo、Yolo v2、DenseBox 的旋转不变式又如何呢？

No

在分类问题中，CNN 不是旋转不变的。您需要在训练集中包含每一次可能的旋转图像。

您可以训练 CNN 将图像分类为预定义的类别（如果您想像示例中那样检测图像中的多个对象，则需要使用分类器扫描图像的每个位置）。

然而，这是一个对象检测问题，而不仅仅是一个分类问题。

在目标检测问题中，可以使用滑动窗口方法，但效率极低。相反，简单的 CNN 其他架构都是最先进的。例如：

更快的 RCNN：https://arxiv.org/pdf/1506.01497.pdf https://arxiv.org/pdf/1506.01497.pdf
优乐网：https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/
SSD: https://arxiv.org/pdf/1512.02325.pdf https://arxiv.org/pdf/1512.02325.pdf

这些架构可以检测图像中任何位置的对象，但您还必须在训练集中包含具有不同旋转的样本（并且训练集必须使用边界框进行标记，这非常耗时）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？的相关文章

HTML 嵌入对象具有灰色背景。可以透明吗？

我使用带有开源插件的 Firefox 来播放视频视频被尽可能好地缩放以适应嵌入对象的宽度和高度中定义的可用空间但有时右侧和或底部会有一点灰色边框看来这不是我的父 div 的背景颜色因为更改它根本没有效果这是 HTML div
Xcode 6.4 Swift 单元测试无法编译：“GPUImage.h 未找到”“无法导入桥接标头”

我的 Xcode 项目构建并运行良好它有 Swift 和 Objective C 代码它已安装 GPUImage 我向它添加了单元测试现在它将不再编译找不到 GPUImage h 文件导入桥接标头失败以下是我发现并尝试过的解决方
按列分组的数据帧上 R 中的行之间的差异

我希望通过 app name 获得不同版本的计数差异我的数据集如下所示 app name version id count difference 这是数据集 data structure list app name structure c
如何防止 Safari 滚动溢出：隐藏的 iframe？

使用 Safari 您可以通过设置 style overflow hide 来禁用大多数 iframe 滚动在 iframe 上但是如果您单击 iframe 并移动鼠标内容无论如何都会滚动 Example 滚动内容 html
使用 AWS MSK 连接器连接到 AWS VPC 内的 MongoDB atlas

我正在尝试使用MongoDB使用更改流Kafka 我选择 AWS MSK 是因为我的整个基础设施都位于 AWS 内并且可以轻松与其他 AWS 服务集成 I created an AWS MSK cluster within the VPC
安装 APK 时出现会话“应用程序”错误

我在将 Android Studio 1 1 编写的项目导入 Android Studio 2 1 2 时遇到困难每当在平板电脑上测试应用程序之前构建 gradle 时我都会收到此错误下面是错误的屏幕截图有谁知道是什么问题我尝试过
为什么我们不能在函数式接口中重载抽象方法？（爪哇）

所以我熟悉java中的函数式接口以及它们与lambda表达式的使用一个函数式接口只能包含一个抽象方法当从 lambda 表达式使用这一孤独方法时您不需要指定其名称因为接口中只有一个抽象方法编译器知道这就是您正在引用的方法 Exa
使用 wmi 获取活动会话（Win32_LogonSession 还返回非活动/旧会话）

有没有办法只显示 wmi 的活动会话问题是 Win32 LogonSession 还显示不活动断开连接的会话 ManagementScope scope new ManagementScope ManagementPath Defaul
如何在Asp.Net Core中自定义开发者异常页面？

这常见于ConfigureStartup cs 文件的方法具有如下所示的代码 if env IsDevelopment app UseDeveloperExceptionPage new DeveloperExceptionPageOpti
DELPHI 和 WANT 或 NANT

We use 巡航控制 net http confluence public thoughtworks org display CCNET Welcome to CruiseControl NET在 Delphi 2006 应用程序中进行持
RetentionPolicy CLASS 与 RUNTIME

两者之间有什么实际区别RetentionPolicy CLASS and RetentionPolicy RUNTIME 看起来两者都被记录到字节码中并且无论如何都可以在运行时访问无论如何两者都可以在运行时访问那不是那个javado
CSS - 为什么我无法设置元素的高度和宽度？

我正在尝试使用以下 html 标记创建 css 按钮 a href access php class css button red Forgot password a 但它最终不会比中间的文本大即使我已经设置了班级的高度和宽度顺便说一句
如何将 c_uint 的 ctypes 数组转换为 numpy 数组

我有以下 ctypes 数组 data ctypes c uint 100 我想创建一个 numpy 数组np data包含来自 ctypes 数组数据的整数值 ctypes 数组显然稍后会填充值我看到numpy中有一个ctypes接口
如何使用 Spark 2 屏蔽列？

我有一些表我需要屏蔽其中的一些列要屏蔽的列因表而异我正在读取这些列application conf file 例如对于员工表如下所示 id name age address 1 abcd 21 India 2 qazx 42 Ger
在应用程序内核中找不到 FOSUserBundle

我在 Windows 上使用 symfony 并尝试按照官方文档中的描述配置 FOSUserBundle 尝试更新架构时出现此错误 Class FOS UserBundle FOSUserBundle not found in app Ap
你将如何开始自动化我的工作？ - 第2部分

后续这个问题 https stackoverflow com questions 2796128 how would you start automating my job 在经历了第一波进货 9 小时的复制粘贴后我现在相信我已经满足
KIOSK 系统的一台 PC 上有多个显示器

我正在使用 PHP HTML5 和 Javascript 开发 KIOSK 系统我想在一台 PC 上连接多个触摸屏显示器我希望这些监视器以全屏模式显示浏览器用户只能访问我的网站而无需任何其他控件他们不会有鼠标或键盘他们不应
C++20 范围太多 |运营商？

我在这段代码中使用 g 10 2 有谁知道为什么我最后收到编译器错误std views reverse on results3 include
Swift - 在 TableView 单元格中使用步进器递增标签

这里又是一个 Swift 初学者我只是想在每个 TableView 单元格中使用一个步进器来增加同一单元格中的标签我发现了关于这个主题的几个问题但它们包含其他元素我无法提取基本概念 Swift Stepper Action 更改同一
为什么 DbSet 不是协变的？

我有一个工厂函数来返回DbSet Of IItemType 实际的返回类型始终是一个实现IItemType 例如DbSet Of CategoryType 我认为泛型支持协方差并且此方法可以正常工作但是当我尝试运行代码时出现异常无法转

随机推荐

R从原始数据生成二维直方图

我有一些 2D x y 的原始数据如下所示我想从数据生成二维直方图通常将 x y 值划分为大小为 0 5 的 bin 并计算每个 bin 中出现的次数同时针对 x 和 y 有什么办法可以做到这一点吗 gt df x y 1 4 2
在多处理中出现异常时，我是否需要手动调用 pool.terminate ？

看来以下两个片段具有相同的行为 def sqr a time sleep 1 2 print local format os getpid if a 20 raise Exception fff return a a pool Pool p
如何缩小 Windows Phone 中的图像尺寸

我正在尝试将我的应用程序移植到 Windows Phone 中我必须在服务器上上传图像所以它的尺寸很小为了上传我已经在Widows中成功完成了这件事但问题是当我失败时这是我的Windows应用程序代码 public void Com
如何在（非 Android）Java 应用程序中检索 Firebase 数据？

有没有办法将数据从 Firebase 检索到 Java 应用程序我有一个 Android 应用程序它将数据存储到 Firebase 数据库中我需要在 Java 应用程序中读取该数据我在网上搜索过但没有找到明确的答案不是浏览器的U
错误：样式父级的资源类型“attr”无效

将我的 Android 项目升级到 Studio 3 0 1 和 Gradle 3 0 后我在构建过程中遇到了一个问题 MAFLogonUI 3 15 6 aar 46f903e9d58266c453b893b9caa03deb res
如何转换该对象数组？

我有个问题我有该对象数组 const iHaveThis question What s your name answer dda form filled key 15 question What s your e mail answer
查找每个 pandas 数据帧行中前 n 个最高值列的名称

我有以下数据框 id p1 p2 p3 p4 1 0 9 1 4 2 0 2 3 4 3 1 3 10 7 4 1 5 3 1 5 2 3 7 10 我需要以一种方式重塑数据框对于每个 id 来说它将具有具有最高值的前 3 列结果会是
有条件跳过 TestNG 测试

我对 TestNG 注释没有太多经验但是我正在尝试使用 TestNG 框架和 POM 设计模式为零售网站构建测试套件我计划使用数据驱动的方法我的计划是通过 Excel 驱动我的测试场景而不是使用 testng xml 例如我将拥有
本地计算机的 Onenote API

这是我在 Stackoverflow 上的第一篇文章我正在寻找有关 OneNote API 的指导我期待开发一个主要用于自己使用的解决方案在我的本地计算机上创建打开和关闭 OneNote 部分不使用云等请指导是否可以我希望
如何获取真实的屏幕高度和宽度？

DisplayMetrics metrics new DisplayMetrics this getWindowManager getDefaultDisplay getMetrics metrics screenWidth metrics
如何以 OO 风格打开管道？

我用新风格重写了旧代码如下所示 old style open FD file new style fh IO File gt new file r 文件没问题但我不知道如何打开管道 read from pipes open PIPE s
dotnet 技术中的类库和安全性

假设我已经开发了类库并且我希望我只能在我的项目中使用这个库但是如果有人尝试复制 dll 文件并想在他的项目中使用它那么他将无法这样做所以我只是想知道如何在 dll 文件中嵌入这种类型的安全性请告诉我所有方法谢谢您可以在程序集中
Hibernate NoCacheRegionFactoryAvailableException

我遇到了一个奇怪的 Hibernate 异常我无法解释它告诉我我正在使用二级缓存但没有在哪里hibernate cfg xml我是否指定二级缓存这是例外情况 org hibernate cache NoCacheRegionFact
Redux Toolkit RTK Query 发送查询参数

如何使用 Redux Toolkit RTK 查询将查询参数传递到 api import createApi fetchBaseQuery from reduxjs toolkit query react const baseUrl xxx
仅对 Visual Studio 团队服务强制执行拉取请求

有一种方法可以强制某些人只能通过拉取请求为一个分支做出贡献我希望他们能够接受拉取请求但不能直接推送更改这将很有用因为我们有一些分支策略对于接受拉取请求的人来说例如构建必须通过问题是如果我们允许某人接受拉取请求我们将允许他们
Enterprise Java Bean 到底是什么？

Tomcat FAQ 上说 Tomcat 不是 EJB 服务器 Tomcat 不是完整的 J2EE 服务器但如果我使用 Spring 提供应用程序上下文使用 JPA 注释我的实体注释并使用 Hibernate 作为 JPA 提供商
在 SSIS 中插入新记录之前如何清空目标表？

我使用 SSIS 生成和转换新数据以便以后在新系统中使用每次运行 SSIS 包时我都会遇到问题它不断将新记录插入到我的目标表中如何先清空目标表 OLE DB Destination 然后插入新生成的记录目前此问题的解决方法是执行d
访问Firebase规则中的电子邮件地址[重复]

这个问题在这里已经有答案了我正在使用 Firebase 3 编写 firebase 规则时 auth 对象仅包含 uid 和提供程序有什么方法可以增强此功能以提供电子邮件地址吗我试图解决的问题是我正在处理的网站的所有者希望根据用户的
HTML 语义：将链接（锚元素）放在标题中是个好主意吗？

以这种方式建立新闻列表是错误的吗 h1 a href article 1 html That happened a h1 div class short Just like planned div 我应该更喜欢这个吗 h1 That hap
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj

热门标签