【论文记录】Boosting Detection in Crowd Analysis via Underutilized Output Features

2023-11-09

Boosting Detection in Crowd Analysis via Underutilized Output Features

Abstract

  Crowd Hat使用一种混合的2D-1D压缩技术进行细化空间特征与获取特定人群信息的空间和数量分布。进一步的,Crowd Hat采用自适应区域的NMS阈值与一个解耦然后对齐的范式来解决基于检测方法的缺陷。

Methodology

  作者认为检测得到预测的Bounding Boxes和Proposals包含丰富的特定人群信息。作者采用检测结果的区域尺寸和置信度分数。他认为这些特征对于人群分析是Pure。
image.png

Output Feature Compression

  直接把检测结果的中心坐标映射到输入图片上,得到的生成特征图存在着预测的Bounding Boxes和Proposals数量远小于图片中像素的数量,会导致特征图过于稀疏无法传递关键信息。
  作者提出了一种混合的2D-1D压缩方法进一步细化输出特征,获得这些特定人群信息的空间和数量分布。
image.png

2D Compression

  作者首先根据Proposal或者Bounding Box的中心坐标把他们映射到输入图片上,然后把图片分成S×S个Patches,将Patches的元素相加获得压缩矩阵M中的相应元素。
image.png
image.png

1D Compression

  1D压缩用来寻找输出特征的数值分布。例如一个低的输出Bounding box area sizes分布可能暗示一个很高的人群密度。
  首先,作者正则化置信度分数和区域尺寸值到[0,1]区间。然后将区间分成L个间隔。最后,计算落入每个区间值的数量。
image.png
image.png
image.png

Crowd Hat Network

  把2D压缩矩阵堆叠成t2d,把1D压缩矩阵堆叠成t1d
image.png

Region-Adaptive NMS Decoder

  将全局特征与局部特征进行连接,然后输入到MLP中,生成region-adaptive NMS阈值。
image.png

Decouple-then-Align Paradigm

  作者通过直接使用全局特征回归人群数量,对模型的检测过程与计数过程进行了解耦,使用一个独立的MLP作为Count Decoder PC去预测人群数量。
image.png
  将Bounding Boxes与Count中值小的且置信度高的作为最终结果。

Summary

  本文的主要思想是通过Proposals和Bounding Boxes获取特定人群的空间信息和数值信息,根据这些信息学习自适应的NMS阈值与人群数量。
image.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【论文记录】Boosting Detection in Crowd Analysis via Underutilized Output Features 的相关文章

随机推荐

  • mysql5.7安装及配置超详细教程_MySQL5.7的安装与配置详细操作步骤

    一 MySQL的下载 二 解压安装包 将下载的ZIP压缩包解压到任意文件夹 此处为 C mysql5 7 三 修改配置文件 将解压文件夹目录下的my default ini 文件重命名为 my ini 用文本编辑器打开并清空其中内容 添加内
  • InetAddress的用法

    InetAddress的用法 下面这个程序利用InetAddress getByName 来得到你的和百度IP地址 马克 to win 马克 java社区 防盗版实名手机尾号 73203 例 2 1 1 import java net pu
  • 【工具】网站工具转换链接推荐

    1 Json 解析及格式化验证工具 Json 在线解析及格式化验证 JSON cn 2 Properties 和 Yaml 格式互转工具 在线 yaml 转 properties 在线 properties 转 yaml ToYaml co
  • uni-app实现广告滚动条

    参数说明 circular Boolean false 是否采用衔接滑动 即播放到末尾后重新回到开头 vertical Boolean false 滑动方向是否为纵向 previous margin String 0px 前边距 可用于露出
  • 网络的基本概念

    网络 网络是由若干节点和连接这些结点的链路组成 网络中的节点可以是计算机 交换机 路由器等设备 网络设备有 交换机 路由器 集线器 传输介质有 双绞线 同轴电缆 光纤 简单的网络示意图 互联网 把多个网络连接起来就构成了互联网 目前最大的互
  • 朴素贝叶斯分类

    先上问题吧 我们统计了14天的气象数据 指标包括outlook temperature humidity windy 并已知这些天气是否打球 play 如果给出新一天的气象指标数据 sunny cool high TRUE 判断一下会不会去
  • 解决 Fedora 下部分网页不能正常打开的问题(Linux 通用)

    使用命令 ifconfig 可以查看本地的网卡信息 ifconfig a 一般以wlp开头的为无线网卡 用 ifconfig XXXX 网卡名可以单独查看某一个网卡的信息 如下所示 wlp0s20f3 flags 4163
  • 异常的笔记

    异常 很重要 有利于我们平时处理问题 异常就是代表程序出现了问题 常见的异常比如说 数组越界 除法除0 异常的体系是什么 java lang Throwable Error Exception RuntimeException 其他异常 E
  • UE4 Niagara粒子系统基础笔记

    目录 Niagara基础概念 Niagara官方建议 Niagara堆栈面板 Niagara渲染模式 材质 Niagara和蓝图 Niagara常用模块 Niagara常用技巧 Niagara ModuleScript Niagara基础概
  • RTP和RTCP详解

    1 RTP和RTCP详解 文章目录 1 RTP和RTCP详解 1 1 概述 1 2 RTP协议详解 1 3 RTCP协议详解 1 1 概述 在流媒体相关的领域 我们进场会看到RTP RTCP 其用于流式传输的最常见的码流传输协议 位于传输层
  • Python单元测试:pytest

    pytest默认使用的是main system packages 如果需要在虚拟环境中运行 需要运行 python m pytest test py 如果需要打印中间结果 pytest test py s
  • 跨时钟域电路设计——多bit信号&FIFO

    多个bit信号的跨时钟域仅仅通过简单的同步器同步时不安全的 如下图 虽然信号都同步到目的时钟域 可完成的功能却与设计的初衷不相符 解决方案之一为对信号进行格雷码编码 但此方案只适用于连续变化的信号 另一种方案为增加新的控制信号en 确保传输
  • 机器学习和深度学习引用量最高的20篇论文(2014-2017)

    机器学习和深度学习的研究进展正深刻变革着人类的技术 本文列出了自 2014 年以来这两个领域发表的最重要 被引用次数最多 的 20 篇科学论文 以飨读者 机器学习 尤其是其子领域深度学习 在近些年来取得了许多惊人的进展 重要的研究论文可能带
  • 1200兆路由器网速_家庭网络配置问题案例:六类网线上网速度只有100兆

    有这样一个案例 家中布置了一根6类网线 8芯中间带个塑料十字的双绞线 网线约10米长 全部为埋地管道暗线 水晶头为568B线序 电脑插也为6类 西门子 568B线序接法 现在出现一个问题 就是网线一个连接移动光猫 为路由器模式 千兆口 然后
  • mac-右键-用VSCode打开

    1 点击访达 搜索自动操作 2 选择快速操作 3 执行shell脚本 替换代码如下 for f in do open a Visual Studio Code f done command s保存会出现一个弹框 保存为 用VSCode打开
  • IDEA2021.2创建java web项目(很详细,手把手创建)

    该文章适合人群 初学java web 不用maven或者gradle创建java web项目 忘记了怎么创建web项目 错误示范 上来直接创建java ee 项目 这样创建出来的项目有Maven或者Gradle包管理 正确演示 1 创建项目
  • “威胁”员工全来上班后,马斯克“尴尬”了:车没地停、工位不够坐、Wi-Fi 还太差

    点击蓝色 程序员黄小斜 关注我哟 加个 星标 每天和你一起多进步一点点 整理 郑丽媛 出品 程序人生 ID coder life 每一个特斯拉员工每周都要在办公室工作 40 个小时 如果你不来 那么我们就认为你辞职了 在马斯克 蛮横 地放出
  • python机器学习——NLTK及分析文本数据(自然语言处理基础)

    NLTK NLTK Natural Language Toolkit 自然语言处理工具包 在NLP 自然语言处理 领域中 最常使用的一个Python库 自带语料库 词性分类库 自带分类 分词功能 NLTK安装 安装 pip install
  • OpenCart 常见错误解决

    1 GC 报错 错误内容 opencart SessionHandler gc ps files cleanup dir opendir var lib php5 failed Permission denied 解决方法 更改 php i
  • 【论文记录】Boosting Detection in Crowd Analysis via Underutilized Output Features

    Boosting Detection in Crowd Analysis via Underutilized Output Features Abstract Crowd Hat使用一种混合的2D 1D压缩技术进行细化空间特征与获取特定人群