深度学习笔记1：end-to-end、anchor box解释、人体检测代码

2023-05-16

SSD（SSD: Single Shot MultiBox Detector）是采用单个深度神经网络模型实现目标检测和识别的方法。该方法是综合了Faster R-CNN的anchor box和YOLO单个神经网络检测思路(end-to-end).

https://github.com/weiliu89/caffe/tree/ssd (人体检测代码)

非end-to-end方法：
目前目标检测领域，效果最好，影响力最大的还是RCNN那一套框架，这种方法需要先在图像中提取可能含有目标的 候选框（region proposal），然后将这些候选框输入到CNN模型，让CNN判断候选框中是否真的有目标，以及目标的类别是什么。在我们看到的结果中，往往是类似与下图这种，在整幅图中用矩形框标记目标的位置和大小，并且告诉我们框中的物体是什么。
这种标记的过程，其实是有两部分组成，一是目标所在位置及大小，二是目标的类别。在整个算法中，目标位置和大小其实是包含在region proposal的过程里，而类别的判定则是在CNN中来判定的。

这种标记的过程，其实是有两部分组成，一是目标所在位置及大小，二是目标的类别。在整个算法中，目标位置和大小其实是包含在region proposal的过程里，而类别的判定则是在CNN中来判定的。

end-to-end方法：
end-to-end方法的典型代表就是有名的 yolo。前面的方法中，CNN本质的作用还是用来分类，定位的功能其并没有做到。而yolo这种方法就是只通过CNN网络，就能够实现目标的定位和识别。也就是原始图像输入到CNN网络中，直接输出图像中所有目标的位置和目标的类别。 这种方法就是end-to-end（端对端）的方法，一端输入我的原始图像，一端输出我想得到的结果。只关心输入和输出，中间的步骤全部都不管。

候选区域（anchor）

备注：具体是咋样实现的，目前还没搞清楚，先知道大概是个啥就ok,后续弄明白就好。

特征可以看做一个尺度51*39的256通道图像，对于该图像的每一个位置，考虑9个可能的候选窗口：三种面积 {1282,2562,5122}× 三种比例 {1:1,1:2,2:1} 。这些候选窗口称为anchors。下图示出51*39个anchor中心，以及9种anchor示例。

参考文献：
https://www.zhihu.com/question/51435499/answer/129543052 (end-to-end)
http://blog.csdn.net/shenxiaolu1984/article/details/51152614 (anthor)
https://zhuanlan.zhihu.com/p/25100992?refer=shanren7(ssd源码解释)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习笔记1：end-to-end、anchor box解释、人体检测代码的相关文章

带有 Javascript onclick 事件的 HTML 锚标记

在使用 Google 时我发现他们在锚标记中使用 onclick 事件 In more谷歌标题部分中的选项它看起来像普通的标签但单击它不会被重定向而是打开一个菜单一般情况下使用时 a href more php More gt g
如何防止点击标签时页面刷新？

我需要将一个参数传递到 URL 中同时阻止页面在单击任何一个时重新加载 a 带有空白的标签href属性 a href 有没有办法用 JS jQuery 来做到这一点我已经有了这个 jQuery list group item a cli
是否可以通过 PHP 访问查询字符串中的锚点？

我有一个通过如下 URL 访问的页面 http power coder net Test something php id 3 Page1 我知道如何使用 GET 访问 id 参数但是有没有办法让我访问 Page1 部分我查看了 SER
机器学习的12个基础问题

1 阐述批归一化的意义算法 1 批归一化变换在一个 mini batch 上应用于激活 x 批归一化是一种用于训练神经网络模型的有效方法这种方法的目标是对特征进行归一化处理使每层网络的输出都经过激活得到标准差为 1 的零均值状态
使用 javascript 创建的锚点下载属性在 iOS Chrome 上不起作用

我在 AWS S3 存储桶中保存了一个视频 mp4 文件当用户单击图标时应从客户端设备手机或计算机下载该文件我首先使用发出请求fetch 然后创建一个blob响应中的对象接下来我使用 javascript 创建一个锚元素附加
如何将 HTML 页面滚动到给定的锚点

我想让浏览器将页面滚动到给定的锚点只需使用 JavaScript 我已经指定了一个name or id我的 HTML 代码中的属性 a a or h1 h1 我希望获得与您导航到相同的效果http server com path anch
链接到没有锚标记的网页上的任意内容

我正在寻找一种方法来链接到网页上特定范围的单词图像或其他任意内容一种替代方法是在页面上引入大量锚点但我可以接受需要 JavaScript 的解决方案最好也是突出目标内容的一种如果页面内容已被修改并且链接不再有效那么最好有某种保护
Android Webview 锚链接（跳转链接）不起作用

我的 Android 应用程序中有一个 WebView 它使用 loadDataWithBaseURL 方法加载 HTML 字符串问题是本地锚链接 a href link 无法正常工作单击链接时它会突出显示但不会滚动到相应的锚点如
如何链接到页面的一部分？（哈希？）

你如何链接与 a 以便浏览器转到目标页面上的某些副标题而不是顶部如果有任何标签带有id e g div 那么你可以简单地附加 foo到网址否则您不能任意链接到页面的某些部分这是一个完整的示例 a href http example
如何消除 Spotfire 箱形图中的异常值

提前感谢您的帮助问候拉杰将值添加到MAX 即使可能值也会扭曲数据不过有两种技巧可以做到这一点右键单击 gt 属性 gt Y 轴 gt 设置MIN范围值和MAX将值范围设置为可以消除所有异常值的值这实际上只适用于所有值都彼此接
使用锚标记将值传递到另一个 php 页面

我尝试将 PersonID 的值从 list php 传递到 Delete php 使用锚标记这是我的代码 a href Delete a 该值已正确传递但不知怎的我没有被重定向到Delete php 任何人都可以注意到上面一行中的问
如何链接相同或不同文件夹中的html页面？

如果 html 页面位于相同或不同的文件夹中而无需编写完整路径如何链接到它们在同一文件夹中只需使用文件名 a href thefile html my link a 在父文件夹的目录中 a href thefile html my
AngularJS 锚点点击第二次不起作用

这是我的Demo http plnkr co edit GArzH9gTQCd0r53WhuWO p preview app run function rootScope location anchorScroll when the rou
使用 Jquery 禁用锚标记

我有一个与锚标记关联的图像一旦用户单击该图像就会加载弹出窗口我想禁用这个锚标记 html 代码如下所示 a href class openModalLink img style border none width 9 alt clas
不可点击的锚标记

我使用这个html代码 div class titleIn h2 a href link2 link2 a h2 div 并且由于某种原因link2不可点击没有手形光标 CSS 是 titleIn direction rtl margin
链接到网页的特定部分

如何创建指向我无法控制的另一个网站上的长网页的一部分的链接我认为您可以在链接末尾使用 partofpage 的变体有什么建议么只需附加一个随后是该人的 ID a 标签或其他 HTML 标签例如 section 你想要达到的目标
为什么我的一些 HTML 内部链接有效，而另一些则无效？

救命我对这个世界完全陌生我正在首页上制作一个菜单栏并链接到网站上的其他页面以下是代码示例 ul li a href About a li li a href The Therapist a li li a href Pay what
引导程序和访问过的链接

我们使用 Bootstrap 为我们的网站提供响应能力指示后续链接是良好的用户体验实践但由于 Bootstrap 是为应用程序构建的因此它不支持这一点人们使用过任何解决方法吗一年多前问题已通过 bootstrap 记录并关闭请
在 Ruby on Rails 中获取控制器中 URL 的锚点部分

有没有办法在控制器中获取 URL 的锚点部分示例如果我输入http www foo com bar anchor123 http www foo com bar anchor123我可以在我的控制器中获取字符串anchor123吗在
使用锚标记和 IE7 进行标头位置重定向

嘿这是我的问题它可能只是浏览器问题但任何帮助想法都会很棒几乎我有以下重定向 header Location page php images 在大多数现代浏览器中它会毫无问题地重定向到 page php images 但在 IE

随机推荐

修改conda环境和缓存默认路径

默认情况下 xff0c conda 创建的新环境以及过往安装的模块缓存都存储在用户目录下 xff0c 这一点不会在 conda xff08 user specific xff09 配置文件 HOME condarc 中体现出来 xff0c
融合人体姿态估计和目标检测的学生课堂行为识别

融合人体姿态估计和目标检测的学生课堂行为识别参考网摘要 xff1a 在課堂教学中 xff0c 人工智能技术可以帮助实现学生行为分析自动化 xff0c 让教师能够高效且直观地掌握学生学习行为投入的情况 xff0c 为后续优化教学设计与实施
Python实例详解pdfplumber读取PDF写入Excel

一 Python操作PDF 13大库对比 PDF xff08 Portable Document Format xff09 是一种便携文档格式 xff0c 便于跨操作系统传播文档 PDF文档遵循标准格式 xff0c 因此存在很多可以操作PD
如何使用ChatGPT API训练自定义知识库AI聊天机器人

原文 xff1a 如何使用ChatGPT API训练自定义知识库AI聊天机器人闪电博在我们之前的文章中 xff0c 我们演示了如何用ChatGPT API建立一个AI聊天机器人 xff0c 并指定一个角色来进行个性化处理但如果你想在自
哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型

原文 xff1a CVHub 门头沟学院AI视觉实验室御用公众号学术科研就业 185篇原创内容公众号 Title HuaTuo Tuning LLaMA Model with Chinese Medical Knowledge PD
开源数字人Fay

原文 xff1a 别再因AI焦虑 xff0c 这波年轻人已经用中国版ChatGPT 创业成功了数字人 AI 创业新浪新闻开源 xff1a GitHub TheRamU Fay Fay是一个完整的开源项目 xff0c 包含Fay控制器
推荐 3 个令你惊艳的 GitHub 项目

原文 xff1a 推荐 3 个令你惊艳的 GitHub 项目昨日 GitHub Trending 上榜的开源项目 xff0c 基于 AI 技术提高你的生产力借助 AI 你能搭建自己的数字人搭建自己的法律助手文档分析助手本期推荐开源
AI 数字人制作（方案一）：输入一张图片和一段文字即可生成数字人

方案一 xff1a 原文 xff1a AI 数字人制作 xff08 方案一 xff09 哔哩哔哩 bilibili AI 文字和图片生成数字人输入一张图片和一段文字即可生成数字人用三个开源项目整合成可以商用的数字人项目文本生成语音开源
大量数据情况下单线程插入和多线程insert数据库的性能测试

大量数据情况下单线程插入和多线程insert数据库的性能测试之前一直没有遇到过大批量数据入库的场景 xff0c 所以一直没有思考过在大量数据的情况下单线程插入和多线程插入的性能情况今天在看一个项目源代码的时候发现使用了多线程insert
查看tensorflow 安装目录

使用命令 xff1a pip show f tensorflow 图和张量源码 xff1a C Program Files Anaconda3 Lib site packages tensorflow python framework op
FP-growth算法，fpgrowth算法详解

FP growth算法 xff0c fpgrowth算法详解使用FP growth算法来高效发现频繁项集前言你用过搜索引擎挥发现这样一个功能 xff1a 输入一个单词或者单词的一部分 xff0c 搜索引擎酒会自动补全查询词项 xff0
如何将一个矩阵化为行阶梯形矩阵

2016 03 29 尾巴线性代数有同学反映上一课过于冷冰冰 xff0c 都是一些不带证明的公式如果线性代数所有公式都要证明的话 xff0c 线性代数的难度会上好几个量级 xff0c 有的公式的证明是特别特别难的还有一个 xff0c
Activity启动模式与任务栈(Task)全面深入记录（上）

转载请注明出处 xff08 谢谢 xff09 xff1a http blog csdn net javazejian article details 52071885 任务栈简单入门最近又把两本进阶书看了一遍 xff0c 但总感觉好记性不
VSCode自定义代码片段3——url大全

url大全 url 39 3 如何自定义用户代码片段 xff1a VSCode 61 左下角设置 61 用户代码片段 61 新建全局代码片段文件 61 自定义片段名称 61 编辑用户片段 61 ctrl 43 S 保存 url大全 34 P
mac中如何使用vsode愉快地运行C、C++程序

闲来无事 xff0c 想在mac中写写C C 43 43 程序 xff0c 打开应用商店 xff0c 准备下个xcode玩玩 xff0c 结果小30G的空间占用直接劝退因为一直使用vscode开发 xff0c 便萌生了使用插件来运行C C
CMake入门3之静态链接库和动态链接库

目录目标 xff1a 环境创建静态和动态链接库文件准备构建安装静态链接库使用静态链接库和动态库使用动态库使用静态库目标 xff1a 构建静态链接库和动态链接库 xff0c 安装到系统 xff0c 写一个程序使用安装的静态链
行人检测数据集

MIT数据库该数据库为较早公开的行人数据库 xff0c 共924张行人图片 xff08 ppm格式 xff0c 宽高为64 128 xff09 xff0c 肩到脚的距离约80象素该数据库只含正面和背面两个视角 xff0c 无负样本 xf
opencv中solvePnPRansac函数求解相机位姿

PnP xff08 Perspective n Points xff09 xff1a 2D 3D xff0c 求解相机位姿 PnP xff08 Perspective n Points xff09 就是你有n个点的3D位置和它们的投影 xf
如何查看ubuntu下显卡驱动是否已经成功安装

首先得安装 mesa utils xff0c 在终端输入命令 xff1a sudo apt get install mesa utils 然后再运行命令 xff1a glxinfo grep rendering 如果结果是 yes xff0
深度学习笔记1：end-to-end、anchor box解释、人体检测代码

SSD xff08 SSD Single Shot MultiBox Detector xff09 是采用单个深度神经网络模型实现目标检测和识别的方法该方法是综合了Faster R CNN的anchor box和YOLO单个神经网络检测思

深度学习笔记1：end-to-end、anchor box解释、人体检测代码

候选区域（anchor）

深度学习笔记1：end-to-end、anchor box解释、人体检测代码 的相关文章

随机推荐

热门标签

深度学习笔记1：end-to-end、anchor box解释、人体检测代码的相关文章