Paper and Codes Leaderboard

2023-11-10

介绍

此榜单用于评比网上开源的目标检测模型；

模型入选标准

以开源代码的精度为准；
【数据源一】Paper with Code – SOTA

1. 目标检测

COCO test-dev Benchmark (Object Detection) | Papers With Code

Paper and Codes for COCO (by 2023.3.31)

1. EVA, boxAP: 64.7 (test)
模型： EVA-CMaskRCNN
Note：EVA在进行检测任务时，是基于Cascade Mask R-CNN的。

1.1* Co-DETR, boxAP: 66.0 (test)
BoxAP-66.0对应的权重尚未公布，我们在其GitHub上咨询了开发者相关情况；

1.2* InternImage-H, boxAP: 65.5
Github-page: OpenGVLab/InternImage
Note：InternImage进行检测任务适配Mask
R-CNN；论文中没有提到“65.5”，而是用“65.4”作为主要贡献点，该结果基于用于DINO实现，不过目前训练配置未在GitHub上公开，（我们已经其repo上提出issue）

1.2* M3I Pre-training, boxAP: 65.4
根据 Papers with Code 的资料显示，这里的“65.4”就是使用了"M3I Pre-training"的“InternImage-H”。

1.3* Co-DETR, boxAP: 64.5
查看其Sense-X/Co-DETR，发现目前代码并未公布；

1.4* Group DETR v2 - pwc, boxAP: 64.5
Group DETR v2 的GitHub主页分数没有这么高，请参见 Group DETR v2 - github；
需要Object365预训练，暂时无法复现

2. FocalNet (DINO), boxAP: 63.5 (github, val)
FocalNet-L-DINO

3. Group DETR v2 - github, boxAP: 63.3 (val)
在其PaddleDetection主分支中，未发现相关代码；

PaddleDetection - 文玉老师：

在develop里了 https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/group_detr

你clone代码之后checkout到develop就行，等到release分支里的话得下一次发版

需要等到下一次PaddleDetection发版才可以获得稳定版的代码；

4. Dual-Swin-B-CBNetv2, boxAP: 60.1
模型： HTC-DB-Swin-L (TTA)

4.1* Focal-L, boxAP: 58.9
Github-page: https://github.com/microsoft/Focal-Transformer
在其Github主页上未发现关于COCO数据集的精度数据，最高精度51.2；
（Focal-T-Cascade-Mask-R-CNN精度为51.5，不过会使用mask数据所以没有收录）；
4.2* DyHead: 58.7
Github-page: DynamicHead
在其Github主页上最高精度为49.8，暂时不予收录；
5. Swin-L: 58.0(val)
Github-page: Swin-L
在其Github主页上最高精度为58.0(val)；
6. YOLOR-D6*: 57.8
Github-page: YOLOR-D6*
7. SOLQ-{Swin-L & 1536}, boxAP: 56.5
模型：SOLQ-{Swin-L & 1536}
8. InternImage-XL, boxAP: 56.2
模型：InternImage-XL–Cascade
9. QueryInst , boxAP: 56.1
模型：QueryInst–Swin_L_300_queries–single_scale_testing
10. RT-DETR-R101, boxAP: 54.3
Note:

榜单上收录的模型分数一般是val集的分数，因为val集的结果我们是可以复现的；

COCO FPS Models (by 2023.02.18)

1. YOLOv7, boxAP: 56.8, FPS: 36
模型: YOLOv7-E6E
2. YOLOv5, boxAP: 55.0, FPS: 1e3/26.2=38.2
模型: YOLOv5x6
3. PP-YOLOE+, boxAP: 54.9, FPS: 45.0
模型: PP-YOLOE+_x
4. YOLOv8, boxAP: 53.9, FPS: 283.3
模型: YOLOv8x
4. RTMDet, boxAP: 52.6, FPS: 322.6
模型: RTMDet-x
5. YOLOv6, boxAP: 52.5, FPS: 98
模型: YOLOv6-L
6. PP-YOLOE, boxAP: 52.2, FPS: 95.2
模型: PP-YOLOE-x
7. PP-YOLOv2, boxAP: 50.3, FPS: 49.5
模型: PP-YOLOv2–ResNet101vd
PP-YOLOv2是由Paddle推出的目标检测模型；
8. FastViT-MA36-paper, boxAP: 45.1, FPS: 122.0 (8.2ms)
模型: FastViT-MA36-MaskRCNN
9. NanoDet-Plus-m-1.5x, boxAP: 34.1, FPS: 87.0 (11.50ms)
模型: NanoDet-Plus-m-1.5x
Note:

这里的“Real-Time”指的是FPS在30以上的模型；

Look at Batch Size

Model	mAP	FPS
YOLOv7	51.4	161
YOLOv7-X	53.1	114
YOLOv5n	28.0	Q
YOLOv5s	37.4	Q
YOLOv5m	45.4	Q
YOLOv5l	49.0	Q
YOLOv5x	50.7	Q
YOLOv5n6	36.0	Q
YOLOv5s6	44.8	Q
YOLOv5m6	51.3	Q
YOLOv5l6	53.7	Q
YOLOv5x6	55.0	Q
YOLOv5x6+TTA	55.8	Q
PP-YOLOE-s	43.1	Q
PP-YOLOE-m	48.9	Q
PP-YOLOE-l	51.4	Q
本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@) 《南溪的目标检测学习笔记》目标检测 FocalNet Paper and Codes Leaderboard 的相关文章【计算机视觉文章目录一问题二个人的理解 2 1 线性层的理解 2 2 pseudo words的理解 2 2 1 详细一点 2 2 2 为什么可以使用文本嵌入空间中的技术 2 2 3 pseudo word的本质是什么 2 2 4 好处 2 2 【论文笔记_目标检测_2022】Cross Domain Object Detection by Target-Perceived Dual Branch Distillation 基于目标感知双分支提取的跨域目标检测摘要在野外跨领域目标检测是一项现实而具有挑战性的任务由于数据分布的巨大变化和目标域中缺乏实例级注释它的性能会下降现有的方法主要关注这两个困难中的任何一个即使它们在跨域对象检测中紧密耦合为了 Coordinate attention,SE,CBAM 1 SE 因为普通卷积难以建模信道关系 SE考虑通道的相互依赖关系增强模型对信息通道的敏感性同时全局平均池化可以帮助模型捕获全局信息然而SE只考虑了内部通道信息而忽略了位置信息的重要性输入X首先经过全局平均池化然后经过全连接层来捕获 Pycharm上Modify Run Configuration的使用方法，带参数配置前言我们在搭建yolo系列目标检测模型时往往需要对代码进行逐步调试及时发现错误所以本文在pycharm的基础上对yolov6中的infer py进行逐步调试首先我们在conda环境一切准备就绪的情况下能在终端tenminal中 Object Detection(目标检测神文) 目标检测神文非常全而且持续在更新转发自 https handong1587 github io deep learning 2015 10 09 object detection html 如有侵权联系删除更新时间 20190226 import tensorflow as tf报错ModuleNotFoundError: No module named 'tensorflow' 在安装tenserflow和keras的时候安装完毕进行验证的时候会报错解决方法就是需要安装tf nightly 安装完毕错误就不再报了 pip install tf nightly 特定场景小众领域数据集之——焊缝质量检测数据集写这篇文章最大的初衷就是最近频繁的有很多人私信问我相关的数据集的问题基本上都是从我前面的目标检测专栏里面的这篇文章过来的感兴趣的话可以看下轻量级模型YOLOv5 Lite基于自己的数据集焊接质量检测从零构建模型超详细教程保姆级的【计算机视觉文章目录一检测相关 8篇 1 1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection 1 2 A Theoretical and 【目标检测】32、让你一文看懂且看全 NMS 及其变体文章目录一 NMS 1 1 背景 1 2 方法 1 3 代码 1 4 不足二 Soft NMS 2 1 背景 2 2 方法 2 3 效果 2 4 代码 2 5 不足三 Softer NMS 3 1 背景 3 2 方法四 IoU Ne 睿智的目标检测60——Tensorflow2 Focal loss详解与在YoloV4当中的实现睿智的目标检测60 Tensorflow2 Focal loss详解与在YoloV4当中的实现学习前言什么是Focal Loss 一控制正负样本的权重二控制容易分类和难分类样本的权重三两种权重控制方法合并实现方式学习前言目标检测综述-P1-yolov1（20201017初稿）目标检测综述 P1 yolov1 写在最初一 yolov1的提出二 yolov1如何进行检测三 yolov1的loss函数四 yolov1训练过程 1 训练前处理 2 五 yolov1的优缺点写在最初关于基于深度学习的目标检测相从近两年的CVPR会议来看，目标检测的研究方向是怎么样的？ Old Xie CS2EE2CS Naiyan Wang 等 85 人赞同目前object detection的工作可以粗略的分为两类 1 使用region proposal的目前是主流比如RCNN SPP Net Fast RCNN （linux系统下）MMCV及MMClassification教程及安装问题解决说一下依托关系 MMCV是面向计算机视觉的一个基础库它支持OpenMMLab的各个模块包括MMClassification图像分类 MMDetectionm目标检测 MMOCR文字检测识别等等本文主要详细介绍一下mmcv和mmcls的安【目标检测】OneNet: Towards End-to-End One-Stage Object Detection label assignment是指在训练过程中如何将某个prediction指定给某个GT 用于计算损失训练网络对于上一篇文章他们首先用one to one label assignment替换了one to many label YOLOV5加速之TensorRT篇之前写过一篇Android版本yolov5s的博客最近工作搞了下TensorRT 也遇到几个坑不过最终还是实现了做一下小小的分享这里直接上github上大牛的连接我的代码是在他的基础上改的里面有很多模型的加速直接看里面的yolov 目标检测之二（传统算法和深度学习的源码学习）目标检测之二传统算法和深度学习的源码学习本系列写一写关于目标检测的东西包括传统算法和深度学习的方法都会涉及到注重实验而不着重理论理论相关的看论文去哈主要依赖opencv 本文主要内容简单分析下yolo9000的原理然后使用o 机器学习课程总结3--基本卷积神经网络+评价指标+目标检测与Yolo网络提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档目录一基本卷积神经网络 1 AlexNet 2 VGG 16 3 残差网络二常用数据集与评价指标 1 数据集 2 评价指标三目标检测 YOLO 1 1 目标检测问 FPN网络详解 1 特征金字塔特征金字塔 Feature Pyramid Networks FPN 的基本思想是通过构造一系列不同尺度的图像或特征图进行模型训练和测试目的是提升检测算法对于不同尺寸检测目标的鲁棒性但如果直接根据原始的定义进行FPN计算 SimMIM：一种更简单的MIM方法自从何恺明的MAE 点击蓝字查看文章详情出来之后基于MIM Masked Image Modeling 的无监督学习方法越来越受到关注这里介绍一篇和MAE同期的工作 SimMIM A Simple Framework for Mask STM32f103增加ESP8266模块，通过Wifi用手机TCP服务端远程与STM32通信 STM32f103增加ESP8266模块通过Wifi用手机TCP服务端远程与STM32通信提示 esp8266开启透传模式连上路由器Wifi 电脑热点接入STM32串口引脚另外手机TCP服务端是手机IP地址串口号大于8000滴随机推荐 2022 年企业 Java 面试前复习的正确姿势（已助力 512 人入职大厂）前言这份面试清单是今年 1 月份之后开始收集的一方面是给公司招聘用另一方面是想用它来挖掘在 Java 技术栈中还有一些知识点是我还在探索的我想找到这些技术盲点然后修复它以此来提高自己的技术水平说实话刚开始的时候整理这些面试题 Docker第二篇-Linux和Windows下安装Docker 文章目录 Docker版本说明 CentOS安装Docker 前提条件安装镜像加速删除Docker CE Windows安装Docker 前提条件安装镜像加速 Docker版本说明 Docker 分为 CE 和 EE 两大版本 C 树莓派烧录准备工作树莓派一张SD卡 SD尽可能的大不然安装完系统就没什么空间了建议64G 软件准备 1 洗卡软件 SDcard Formatter 2 烧录软件 win32diskimager 3 镜像文件可以从树莓派官网进行下载Rasp MySQL数据行溢出的深入理解一从常见的报错说起故事的开头我们先来看一个常见的sql报错信息相信对于这类报错大家一定遇到过很多次了特别对于OMG这种已内容生产为主要工作核心的BG 在内容线的存储中数据大一定是个绕不开的话题这里的数据大远不止存储空间占用多 jenkins搭建自动化部署(Windows) 官网 https jenkins io 选择相应版本下载安装后找到安装目录下jenkins war 可以放在tomcat下运行也可直接运行命令 java jar jenkins war 启动关闭命令 net start jenkins mysql 5.6压缩安装_mysql5.6zip格式安装过程第一步到官网下载mysql 5 6 44 winx64的压缩包文件格式第二步在我的电脑 gt 属性 gt 高级 gt 环境变量 path变量中添加mysql bin文件夹的路径第三步配置完环境变量之后先别忙着启动mysql 我们还 08-分布式 1 分布式中接口的幂等性的设计在高并发场景的架构里幂等性是必须得保证的比如说提交作业查询和删除不在幂等讨论范围 1 建唯一索引id 每次操作都根据操作和内容生成唯一的id 在执行之前先判断id是否存在如果不存在则执行后续 rem的使用方式 rem是什么 rem是指相对于根元素的字体大小的单位在日常开发过程中我们通常把根元素 html body 的字体设置为10px 方便于我们计算此时子元素的1rem就相当于10px rem与em的区别各自的优缺点 em子元素字体大小的e CVPR 2019 论文大盘点—人体姿态篇 CV君盘点了CVPR 2019 中有关人体姿态的论文其中研究 3D人体姿态估计的论文最多有 11 篇研究 2D 姿态估计的 7 篇姿态迁移 2 篇人体图像生成 1 篇人体捕捉 2 篇另外还有2篇创建了新的基准数据集姿态估计是 python云图安装相关插件 python3 m pip install jieba wordcloud matplotlib import matplotlib pyplot as plt import jieba from wordcloud impo 【Spring Boot】【前后端分离】后端接口返回结果统一封装文章目录创建 SpringBoot 项目封装返回结果实现返回对象的自动封装处理异常测试最近在尝试使用前后端分离的模式写一个简单的个人博客遇到接口数据返回结构的问题在网上查了一圈发现了一个很好用的方法在复现的过程中也遇到了算法设计与分析课后总结算法设计与分析课后总结算法设计与分析第1章算法设计基础课后习题第二章算法分析基础课后习题 1 考虑下面算法回答下列问题算法完成什么功能算法的基本语句时什么基本语句执行了多少次 2 分析以下程序段中基本语句的执行次数要求 100天精通Python（可视化篇）——第92天：Pyecharts绘制炫酷柱状图、条形图实战大全文章目录专栏导读 1 基础柱状图 2 旋转x轴标签 3 旋转坐标轴 4 添加坐标轴名称 5 添加标记点 6 添加标注线 7 添加数据 8 添加自定义背景图 9 堆叠柱状图 10 柱状图与折线图组合 11 三维柱状图 12 水平滑动鼠标滚包、模块、函数的关系结构三者关系 python中程序的结构是由包模块函数类大致构成其关系如下 package module function 模块定义与调用 1 python中一个 py文件都可以是一个module module可以有函数类代码组成如使用python解决中英混合参考文献中et al 和等的问题这个代码使用zipfile将docx进行解压然后操作document xml文件找到中文中的et al之后替换为等然后再压缩为docx import zipfile import re import os import shutil curl服务器文件,curl 向远程服务器传输file文件 public function upload 获取上传文件信息文件名称以自己实际上传文件名称为准 fileinfo FILE filename 请求参数依据商户自己的参数为准 requestParam version requestPa 声网(agora)音视频通话sdk—微信小程序demo 首先需要注册一个声网账号注册成功后创建项目 appid是指声网项目的appid 后续会在小程序的配置文件中用到微信小程序接入视频通话需要声网给开通小程序的权限给声网邮箱发送邮件注明开通微信小程序接入权限并给发送appid app Python代码扫描：企业级代码代码安全漏洞扫描Bandit 目录什么是Bandit 特点安装配置配置Bandit Pycharm配置外置工具使用实践命令行参数检查单个文件检查整个目录 PyCharm中对单个文件或者项目目录的扫描一个使用案例应用场景总结参考资料注意后续技术 js DOM DOM Document Object Model HTML 和 XML 文档的编程接口通过 DOM JavaScript 能够访问和改变 HTML 文档的所有元素 1 查找通过 id 查找 HTML 元素 div div 2 通过标签 Paper and Codes Leaderboard 目录介绍模型入选标准 1 目标检测 Paper and Codes for COCO by 2023 3 31 COCO FPS Models by 2023 02 18 Look at Batch Size 2 图像分类 ImageN 热门标签复杂表达式手写数据集 github与git 前端错误信息主板 Win10技巧文件web服务器搭建 nlp基础同步机制 lxmlhtml方法比赛amp复现学术讨论研究微信小程序x app接口开发 MSG1 随机接入训练算法感知器 redis常用命令面试笔试总结 Powered by Hwhale

Paper and Codes Leaderboard

目录

介绍

模型入选标准

1. 目标检测

Paper and Codes for COCO (by 2023.3.31)

COCO FPS Models (by 2023.02.18)

Look at Batch Size

Paper and Codes Leaderboard 的相关文章

随机推荐

热门标签