目标检测发展方向(1)

2023-05-16

从目标检测发展到目标追踪

** 目标检测(监督学习)
FasterRCNN、CascadeRCNN
YOLOX、Complex-YOLO
SSD、RetinaNet,FOCS、ATSS
CornerNet、CenterNet
BOXInst

** 目标检测(无监督学习)
SimCLR
MoCov1
MoCov2

目标跟踪

1、MOT
FairMOT
FastMOT
DeepMOT
2、DeepSORT
在这里插入图片描述

目标检测发展历史

模型综述

该部分内容是我阅读知乎时候发现很好自己稍微整理一下:
从近几年CVPR、ICCV、ECCV三大会议及NIPS上看深度学习已经成为研究计算机视觉的一种标准。主流的应用方向:人脸识别、图像识别、视频识别、行人检测、大规模场景识别等。
个人理解国内这些技术起源于亚研院,例如曹旭东、孙剑、何凯明。其中有人在亚研已经从事13年之久的技术与研究,这从实际线上看刚好接上了郑南宁老师曾经研究的模式识别在数字图像处理。刚好西交大和亚研院有个实习和研发的合作,暂时个人理解为国内图像的学派鼻祖。
深度学习中的物体检测与特点:
首先很多深度学习平台的算法或多或少的模型来自于opencv的数字图像处理基础,对于物体检测深度学习与传统方法的优缺点根据知乎总结如下:
一种基于滑动窗口的搜索框架,把一张图分成若干不同位置不同尺度的子图针对每一个子图使用分类器判别是非包含物体部分。传统方法对不同的物体需要设计不同的特征提取方法和分类算法。
人脸检测:Harr特征+Adaboosting的分类器
行人检测:HOG(histogram of gradients)+support Vector machine
普通物体:HOG+DPM(deformable part model)

深度学习方法:
图像识别比图像分类多一个回归的任务
RCNN、fastRCNN(Ross Girshick)、faster RCNN(任少卿、何凯明、孙剑、Ross)。使用CNN判别候选区域的类别(分类工作),使用预计算技术sharing feature map加速模型训练和物体检测速度,同时共享特征图提高计算ROI的速度(使用了RPN),其次采用全卷积海量滑动窗口分类检测物体。
RCNN系列算法检测步骤:第一步实现分类第二步实现回归,由于改进现在也很多端到端一步方法yolo,Unified,Real-Time Object Detection,Single Shot MultiBox Detector,特点物体检测样本正负极端不均衡,two-stage-cascade更好对应非均衡。所以端到端需要更多研究研究,不过最近很多方法,上海交大等研究模型进步很快。
法国Inria研究所的研究人员Nikos paragios描述原因及特点。
第一深度学习可以做的传统方法无法达到的高精度准确,工业上非常实用。
第二深度学习的算法通用性强fasterRCNN都可以用在检测人脸、行人、一般物体。
第三深度学习获取特征有很强的迁移能力,知识表示能力很强。例如ImageNet训练完很多场景都能用。
第四工程维护成本低,主要是矩阵乘和卷积通过现有的层可以开发复杂网络结构实现功能的融合,可以对比维护Boosting、Random Forest。

深度学习与机器学习的区别:
深度学习是学习输入到输出的多层的复合映射,二而机器学习只是一种映射。学习目标和学习方法可以通过调节层之间卷积或全连接的关系或其他映射得到不同的知识表示。亚研院用RF做过一个新映射关系研究等。
商汤CVPR2016年发布的论文是目前工业级主要的应用,四篇论文分别是《物体分割》、《服饰识别搜索术》、《行为识别与定位》、《人脸检测中级联卷积神经网络联合训练》,基础技术Alexnet、VGGnet、GoogleNet、ResNet、DensNet完成任务:检测、识别、分割、特征定位、序列学习。
第一篇主要解决的学术问题:Instance segmentation(Simultaneous Detection and Segementation)
主要解决了object Detection检测和语义分割Semantic Segmentation需要得到物体精确的边界信息和区分不同物体。
从语义分割上升到场景理解,解决joint cascade face detection and alignment,facial landmark detection by deep mulit -task learning。有多个标注的任务并列Multi-Task Learning。
所以多感知学习是非监督学习的方向主要是借助动态规划和图解决学习局限,实现迁移学习基础上的增强学习
Deep Residual learing for image Recognition和Structural—RNN:deep learning Spatio-Temporal Graphs值得阅读。
论文太对了,可以阅读最近几年CVPR、ECCV、ICCV的最近论文和最佳学术论文。
孙剑和何凯明等主要解决了超过20层的训练和测试不再下降,随着层数增加loss会逐渐增加。通过跨层反传skip-layer把loss反传到中间的很多层,解决梯度传播问题,同时提出一种思路:resNet通过skip-layer可以做到多模型融合。

模型优化有本书《解析卷积神经网络》第四章有压缩方案
前端压缩和后端压缩,分别是剪枝、低秩近似和参数量化。
前端方法:
剪枝,思想来自决策树解决冗余参数。流程
1、衡量神经元的重要程度,L1和L2范数来衡量channel维滤波器的重要程度
2、按照重要程度降序删除影响小神经元
3、网络微调
4、循环操作
一种基于滤波器权重的剪枝一种基于数据驱动根据某一个channel输出的稀疏程度,也可能反应出了滤波器权重的稀疏程度。另外计算滤波器对于损失函数的影响程度减去小滤波器。所以适用于前端压缩技术,对网络破坏性小。
低秩近似(后端)
卷积的基本操作矩阵的相乘和相加,权重矩阵的特征比较巨大和稠密,计算开销和存储很大,所以进行矩阵的若干个小规模矩阵近似重构。奇异值分解SVD分解全链接层的权重。
但是由于这种方法的本质是重构近似矩阵,大型神经网络秩很高不一定能用,所以适合小网络。

参数量化
权重聚类,通过类别索引代替原权重矩阵。步骤如下:
1、归纳权重代表,代表某一类权重的具体数值。
2、将代表数存在码本中
3、将原矩阵中的权重替换成索引标量表示

采用思想:二值网络、知识蒸馏、紧凑网络结构技术。
相关机构:云从研究院、《ICLR2016Bestpaper》song Han、ISCA2018、
发展方向:Non-fine-tuning or Unsupervised Compression
self-adaptive Compression
Network Acceleration for other tasks
Hardware-Software Co-design
Binarized Neural Networks 等VALSE2018深度神经网络加速与压缩

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测发展方向(1) 的相关文章

  • Docker 大势已去,Podman 万岁

    前言 郑重声明 xff1a 本文不是 Podman 的入门篇 xff0c 入门请阅读这篇文章 xff1a 再见 Docker xff0c 是时候拥抱下一代容器工具了 Podman 原来是 CRI O 项目的一部分 xff0c 后来被分离成一
  • 使用node开发一个解放双手的小工具《二》- vsCode插件包装

    背景 xff1a 此篇是上篇 使用node开发一个解放双手的小工具 的后续 xff0c 前边遗留了一些问题 xff0c 最近完善了一下 因为发现实际使用起来 xff0c 有很多的不方便 xff1a 使用上 xff0c 需要配置对应的根目录
  • 使用网络调试助手时,踩坑

    在使用网络调试助手时 xff0c 踩坑很多 xff1a 1 作为tcp的客户端 xff0c 或者服务端 xff0c 没有注意发送设置以ASCII还是HEX 导致目标环境接收解析数据异常出现段错误 2 xff1a 作为UDP作为客户端 xff
  • Win7 32 不能安装STM32 虚拟串口驱动解决方法

    1 对于一些精简过的系统 xff0c 无法安装虚拟串口 xff0c 是由于系统缺少mdmcpq inf和usbser sys文件所造成的 只需要将文件下载下来放在相应的文件夹下面就行了 文件对应的目录如下 xff1a mdmcpq inf在
  • gitee使用教程

    目录 版本控制 1 Gitee上注册账户 2 新建一个远程代码仓 xff0c 点击右上方的加号 3 修改远程仓为开源的 编辑 4 本地下载git 5 克隆远程仓到本地 xff0c 复制地址 6 创建代码并提交到远程仓库 7 将本地代码提交到
  • Telnet 接口的使用(一):Telnet的安装与开启

    什么是 Telnet 简介 telnet 用于远程登录 xff0c Telnet的工作方式为 服务器 客户端 方式 xff0c 它提供了从一台设备 xff08 Telnet客户端 xff09 远程登录到另一台设备 xff08 Telnet服
  • Android系统四层体系架构

    Android体系架构分为四层 xff1a 应用层 应用框架层 库层 内核层 xff08 盗用一张图 xff09 一 应用层 应用层包括手机上的所有APP xff0c 无论是系统自带的还是用户开发的 他们都是基于第二层应用框架层开发的 二
  • 芯片的开发板和评估板的区别

    评估版一般都是半导体生产厂家所提供的 xff0c 用于器件性能评估用 xff0c 大公司不用他来赚钱 xff1b 开发板大多说是通过板子赚钱的 xff0c 就是很多的网友工程师做的 xff1b 目标板是在开发产品的过程中 xff0c 相对于
  • 增量式pid+位置式PID(电机位置闭环控制)

    ps xff1a 2022更新 pid详细解释 一般很少用增量式 xff0c 都是用位置式 xff0c 下文增量式可以不看 本文分为几个部分 xff1a 1 编码器 2 定时器输入捕获 xff08 把定时器初始化为编码器模式 xff09 3
  • Vmware 扩容磁盘

    Vmware 扩容磁盘 第一步 xff0c 首先添加一块磁盘 xff0c 进行分区第二步 xff0c 创建物理卷加入组第三步 xff0c 进行扩容 目录第四步 xff0c 刷新逻辑卷 第一步 xff0c 首先添加一块磁盘 xff0c 进行分
  • 思科模拟器中的交换机使用方法

    思科模拟器中的交换机使用方法 思科模拟器中有较多种交换机型号 xff0c 这里只是简单的介绍一下二层交换机2960 xff0c 以及三层交换机中的3560 1 关于交换机的原理 xff1a 交换机是通过其保存的MAC地址表来进行工作的 xf
  • 计算机发展15件重大事件(图说)

    链接 xff1a https vision xitek com famous 201001 28 36559 html 一 1946年 xff0c 第一台电子计算机 埃尼阿克 问世 二 1976年 xff0c 苹果电脑Apple I现世 三
  • vsftp登录报530 Login incorrect无法登录问题解决

    vsftp登录报530 Login incorrect无法登录问题解决 今天在搭建FTP服务器的时候遇到了530 Login incorrect这个问题 通过修改配置文件解决了 总结了一下在搭建FTP服务器的时要注意的地方大概有下面这几点
  • Linux上SMB挂载提示mount: block device //xxx.xxx.xx.xx/xx is write-protected, mounting read-only时解决办法

    当在Linux上挂载SMB服务器时候有时会提示如下错误 xff1a root 64 test mount o username 61 lisi 192 168 23 32 smb test mount block device 192 16
  • Linux下的LAMP环境搭建时访问PHP页面时变成下载页面的原因

    在搭建LAMP环境的时候遇到了配置完PHP环境后测试访问PHP页面的时候却变成下载的情况 xff0c 主要的影响有一下两个方面 1 PHP的配置问题 2 主要原因是httpd conf配置文件内容出错大致有下面几个地方 xff1a Load
  • 服务器肉鸡/入侵被恶意利用的排查和优化方案

    排查方法 xff1a 1 账户方面 xff1a Windows xff1a xff08 1 xff09 检查服务器内是否有异常的账户 xff0c 查看下服务器内是否有非系统和用户本身创建的账户 xff0c 一般黑客创建的账户账户名 后会有
  • Opensuse如何安装桌面环境

    安装必须的范式 xff1a zypper install t pattern kde kde plasma 编辑 etc sysconfig displaymanager 文件并设定 DISPLAYMANAGER 61 kdm xff0c
  • 怎么用谷歌学术检索下载外文文献

    谷歌学术是一个可以免费搜索外文学术文章的搜索引擎 xff0c 包括了世界上绝大部分出版的学术期刊 xff0c 可广泛搜索学术文献 谷歌学术可了解有关某一领域的学术文献 xff1b 了解某一作者的著述 xff0c 并提供书目信息 xff08
  • 英文文献去哪里查找,8个超强英文文献查找网站建议收藏

    英文文献去哪里查找 xff1f 找对方向用对工具可大幅提升学习和研究效率 xff01 下面详细介绍8个查找英文文献非常好用的网站 一 文献党下载器 xff08 wxdown org xff09 xff1a 该网站几乎整合汇聚了所有文献数据库
  • 基于STM32系列的模拟串口(非阻塞式)

    STM32单片机一般少则3个串口 多则5个 而我这次的项目还偏偏5个硬件串口还是不够用 至于不够用的原因 哎 是项目做到后面有定制 随便哪个串口都省不得 没得办法 只能另想法子咯 板子上有几个预留IO口 可以用来模拟串口 模拟串口一般都选9

随机推荐

  • 复制一个目录下的所有文件到另外一个目录(Java实现)

    首先说说我的思路 xff0c 要复制一个目录下的所有文件到另外的一个目录下 xff0c 我们不知道目录下的结构是怎么样的 xff0c 也不知道目录有多少层 xff0c 文件有多少个 xff0c 这样我们会想用循环 xff0c for 但是我
  • RT-Thread嵌入式操作系统

    一 系统架构 RT Thread xff0c 全称是 Real Time Thread xff0c 顾名思义 xff0c 它是一个嵌入式实时多线程操作系统 RT Thread 主要采用 C 语言编写 xff0c 浅显易懂 xff0c 方便移
  • 1.javascript类型中你不知道的细节

    1 数据类型 基本数据类型 xff1a Undefined xff1b Null xff1b Boolean xff1b String xff1b Number xff1b Symbol xff1b Object 1 1 undefined
  • RT-Thread内核基础

    RT Thread内核基础 1 RT Thread 内核介绍 下图为 RT Thread 内核架构图 xff0c 内核处于硬件层之上 xff0c 内核部分包括内核库 实时内核实现 实时内核的实现包括 xff1a 对象管理 线程管理及调度器
  • 安装和配置VNC服务器的法则

    这是一个关于怎样在你的 CentOS 7 上安装配置VNC服务的教程 当然这个教程也适合 RHEL 7 在这个教程里 xff0c 我们将学习什么是 VNC 以及怎样在 CentOS 7 上安装配置VNC 服务器 我们都知道 xff0c 作为
  • 阿里云轻量应用服务器使用教程

    阿里云轻量应用服务器怎么远程连接 xff1f 轻量服务器可以更换操作系统吗 xff1f 使用轻量应用服务器如何搭建网站 xff1f 轻量应用服务器端口如何开通 xff1f 阿里云百科来详细说下轻量服务器远程连接 搭建网站 开放端口等详细使用
  • 超详细!阿里内部都在用的K8S实战手册,新手看这一篇就够了

    一直关注云计算领域的人 xff0c 必定知道Kubernetes的崛起 如今 xff0c 世界范围内的公有云巨头 xff08 谷歌 亚马逊 微软 华为云 阿里云等等 xff09 都在其传统的公共云服务之上提供托管的Kubernetes服务
  • YOLO目标检测多种改进模型

    写于2020年11月 一 SlimYOLOv3 论文链接 xff1a arxiv org abs 1907 11093 代码链接 xff1a https github com PengyiZhang SlimYOLOv3 二 YOLOV3
  • 解决cv2.error报错解决方案

    问题摘要 xff1a 一般出现如下 xff1a 解决cv2 error OpenCV 4 2 0 C projects opencv python opencv 报错 cv2 error OpenCV 4 2 0 C projects op
  • YOLOv5网络结构分析

  • EraseNet:端到端的真实场景文本擦除方法

    六 相关资源 EraseNet论文链接 xff1a https ieeexplore ieee org document 9180003 EraseNet代码 xff1a https github com lcy0604 EraseNet
  • 《程序人生》

    对乔布斯和马斯克访谈的反思 xff1a 1 这个世界不在乎你的自尊 xff0c 只在乎你自我感觉良好的同时有所成就 说明大多数人的观点是 乌合之众 xff0c 必须有从想到去做到的能力 xff0c 面子是无能者维护尊严的盾牌 2 年轻时候一
  • DiffusionDet:Diffusion Model for Object Detection

    Diffusion Model for Object Detection 一种用于目标检测的扩散模型 Motivation 1 如何使用一种更简单的方法代替可查询的object queries 2 Bounding box的生成方式过去是三
  • springboot整合shiro的小demo(一)

    刚学shiro整合springboot xff0c 在此做一个笔记 xff0c 以便后期忘了查阅 本文分以下几个方面进行整合以及验证 xff1a 1 springboot项目搭建整合thymeleaf实现页面访问 2 springboot整
  • ChatGPT:通用人工智能设计范式方法

    通用人工智能设计范式未来发展方向 https openai com https riscv org 一 ChatGPT xff08 AIGC xff09 开启通用人工智能AGI新纪元时代 二 通用人工智能设计范式现状和方法 目前随着Chat
  • 格拉布斯法—异常值判断(异常值)

    数值数据类型 xff1a 方法一 xff1a Z Score 方法二 xff1a DBSCAN 方法三 xff1a Lsolation Forest 方法四 xff1a Mahalanobis距离 xff08 主要解决多元离散群点问题 xf
  • 你会为AI转型吗? 土豆的思考浅谈

    人工智能意味着什么 xff1f 终身学习与人工智能 复杂 读后感 0 经历 按照自己生活规律每天早上第一件事收发邮件这是昨天打开邮箱后看到的论文和相关论文推荐 xff0c 从1956年诞生以来到2013开始接触这个东西 xff0c 国内我曾
  • 神经网络的过去、现状、未来!

    从BP CNN RNN DCN GAN GNN图网络 GCN CAP三维卷积胶囊模型及融合 人工神经网络是计算智能和机器学习研究的最活跃的分支之一 xff0c 它是从人脑的生理结构出发探讨人类智能活动的机理 从 1943年 McCulloc
  • 场景理解类目标检测SENet

    论文 xff1a Squeeze and Excitation Networks 论文链接 xff1a https arxiv org abs 1709 01507 代码地址 xff1a https github com hujie fra
  • 目标检测发展方向(1)

    从目标检测发展到目标追踪 目标检测 xff08 监督学习 xff09 FasterRCNN CascadeRCNN YOLOX Complex YOLO SSD RetinaNet xff0c FOCS ATSS CornerNet Cen