Paper and Codes Leaderboard

2023-11-10

介绍

此榜单用于评比网上开源的目标检测模型;

模型入选标准

  1. 以开源代码的精度为准;
  2. 【数据源一】Paper with Code – SOTA

1. 目标检测

COCO test-dev Benchmark (Object Detection) | Papers With Code

Paper and Codes for COCO (by 2023.3.31)

1. EVA, boxAP: 64.7 (test)
模型: EVA-CMaskRCNN
Note:EVA在进行检测任务时,是基于Cascade Mask R-CNN的。

1.1* Co-DETR, boxAP: 66.0 (test)
BoxAP-66.0对应的权重尚未公布,我们在其GitHub上咨询了开发者相关情况

1.2* InternImage-H, boxAP: 65.5
Github-page: OpenGVLab/InternImage
Note:InternImage进行检测任务适配Mask
R-CNN
;论文中没有提到“65.5”,而是用“65.4”作为主要贡献点,该结果基于用于DINO实现,不过目前训练配置未在GitHub上公开,(我们已经其repo上提出issue

1.2* M3I Pre-training, boxAP: 65.4
根据 Papers with Code 的资料显示,这里的“65.4”就是使用了"M3I Pre-training"的“InternImage-H”。

1.3* Co-DETR, boxAP: 64.5
查看其Sense-X/Co-DETR,发现目前代码并未公布;

1.4* Group DETR v2 - pwc, boxAP: 64.5
Group DETR v2 的GitHub主页分数没有这么高,请参见 Group DETR v2 - github
需要Object365预训练,暂时无法复现

2. FocalNet (DINO), boxAP: 63.5 (github, val)
FocalNet-L-DINO

3. Group DETR v2 - github, boxAP: 63.3 (val)
在其PaddleDetection主分支中,未发现相关代码;

PaddleDetection - 文玉老师:

  1. 在develop里了 https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/group_detr
  2. 你clone代码之后checkout到develop就行, 等到release分支里的话得下一次发版

需要等到下一次PaddleDetection发版才可以获得稳定版的代码;

4. Dual-Swin-B-CBNetv2, boxAP: 60.1
模型: HTC-DB-Swin-L (TTA)

4.1* Focal-L, boxAP: 58.9
Github-page: https://github.com/microsoft/Focal-Transformer
在其Github主页上未发现关于COCO数据集的精度数据,最高精度51.2;
(Focal-T-Cascade-Mask-R-CNN精度为51.5,不过会使用mask数据所以没有收录);
4.2* DyHead: 58.7
Github-page: DynamicHead
在其Github主页上最高精度为49.8,暂时不予收录;
5. Swin-L: 58.0(val)
Github-page: Swin-L
在其Github主页上最高精度为58.0(val);
6. YOLOR-D6*: 57.8
Github-page: YOLOR-D6*
7. SOLQ-{Swin-L & 1536}, boxAP: 56.5
模型:SOLQ-{Swin-L & 1536}
8. InternImage-XL, boxAP: 56.2
模型:InternImage-XL–Cascade
9. QueryInst , boxAP: 56.1
模型:QueryInst–Swin_L_300_queries–single_scale_testing
10. RT-DETR-R101, boxAP: 54.3
Note:

  • 榜单上收录的模型分数一般是val集的分数,因为val集的结果我们是可以复现的;

COCO FPS Models (by 2023.02.18)

1. YOLOv7, boxAP: 56.8, FPS: 36
模型: YOLOv7-E6E
2. YOLOv5, boxAP: 55.0, FPS: 1e3/26.2=38.2
模型: YOLOv5x6
3. PP-YOLOE+, boxAP: 54.9, FPS: 45.0
模型: PP-YOLOE+_x
4. YOLOv8, boxAP: 53.9, FPS: 283.3
模型: YOLOv8x
4. RTMDet, boxAP: 52.6, FPS: 322.6
模型: RTMDet-x
5. YOLOv6, boxAP: 52.5, FPS: 98
模型: YOLOv6-L
6. PP-YOLOE, boxAP: 52.2, FPS: 95.2
模型: PP-YOLOE-x
7. PP-YOLOv2, boxAP: 50.3, FPS: 49.5
模型: PP-YOLOv2–ResNet101vd
PP-YOLOv2是由Paddle推出的目标检测模型;
8. FastViT-MA36-paper, boxAP: 45.1, FPS: 122.0 (8.2ms)
模型: FastViT-MA36-MaskRCNN
9. NanoDet-Plus-m-1.5x, boxAP: 34.1, FPS: 87.0 (11.50ms)
模型: NanoDet-Plus-m-1.5x
Note:

  • 这里的“Real-Time”指的是FPS在30以上的模型;

Look at Batch Size

Model mAP FPS
YOLOv7 51.4 161
YOLOv7-X 53.1 114
YOLOv5n 28.0 Q
YOLOv5s 37.4 Q
YOLOv5m 45.4 Q
YOLOv5l 49.0 Q
YOLOv5x 50.7 Q
YOLOv5n6 36.0 Q
YOLOv5s6 44.8 Q
YOLOv5m6 51.3 Q
YOLOv5l6 53.7 Q
YOLOv5x6 55.0 Q
YOLOv5x6+TTA 55.8 Q
PP-YOLOE-s 43.1 Q
PP-YOLOE-m 48.9 Q
PP-YOLOE-l 51.4 Q
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Paper and Codes Leaderboard 的相关文章

  • 【计算机视觉

    文章目录 一 问题 二 个人的理解 2 1 线性层的理解 2 2 pseudo words的理解 2 2 1 详细一点 2 2 2 为什么可以使用文本嵌入空间中的技术 2 2 3 pseudo word的本质是什么 2 2 4 好处 2 2
  • 【论文笔记_目标检测_2022】Cross Domain Object Detection by Target-Perceived Dual Branch Distillation

    基于目标感知双分支提取的跨域目标检测 摘要 在野外 跨领域目标检测是一项现实而具有挑战性的任务 由于数据分布的巨大变化和目标域中缺乏实例级注释 它的性能会下降 现有的方法主要关注这两个困难中的任何一个 即使它们在跨域对象检测中紧密耦合 为了
  • Coordinate attention,SE,CBAM

    1 SE 因为普通卷积难以建模信道关系 SE考虑通道的相互依赖关系增强模型对信息通道的敏感性 同时全局平均池化可以帮助模型捕获全局信息 然而SE只考虑了内部通道信息而忽略了位置信息的重要性 输入X首先经过全局平均池化 然后经过全连接层来捕获
  • Pycharm上Modify Run Configuration的使用方法,带参数配置

    前言 我们在搭建yolo系列目标检测模型时 往往需要对代码进行逐步调试 及时发现错误 所以本文在pycharm的基础上 对yolov6中的infer py进行逐步调试 首先我们在conda环境一切准备就绪的情况下 能在终端tenminal中
  • Object Detection(目标检测神文)

    目标检测神文 非常全而且持续在更新 转发自 https handong1587 github io deep learning 2015 10 09 object detection html 如有侵权联系删除 更新时间 20190226
  • import tensorflow as tf报错ModuleNotFoundError: No module named 'tensorflow'

    在安装tenserflow和keras的时候 安装完毕进行验证的时候会报错 解决方法就是需要安装tf nightly 安装完毕错误就不再报了 pip install tf nightly
  • 特定场景小众领域数据集之——焊缝质量检测数据集

    写这篇文章最大的初衷就是最近频繁的有很多人私信问我相关的数据集的问题 基本上都是从我前面的目标检测专栏里面的这篇文章过来的 感兴趣的话可以看下 轻量级模型YOLOv5 Lite基于自己的数据集 焊接质量检测 从零构建模型超详细教程 保姆级的
  • 【计算机视觉

    文章目录 一 检测相关 8篇 1 1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection 1 2 A Theoretical and
  • 【目标检测】32、让你一文看懂且看全 NMS 及其变体

    文章目录 一 NMS 1 1 背景 1 2 方法 1 3 代码 1 4 不足 二 Soft NMS 2 1 背景 2 2 方法 2 3 效果 2 4 代码 2 5 不足 三 Softer NMS 3 1 背景 3 2 方法 四 IoU Ne
  • 睿智的目标检测60——Tensorflow2 Focal loss详解与在YoloV4当中的实现

    睿智的目标检测60 Tensorflow2 Focal loss详解与在YoloV4当中的实现 学习前言 什么是Focal Loss 一 控制正负样本的权重 二 控制容易分类和难分类样本的权重 三 两种权重控制方法合并 实现方式 学习前言
  • 目标检测综述-P1-yolov1(20201017初稿)

    目标检测综述 P1 yolov1 写在最初 一 yolov1的提出 二 yolov1如何进行检测 三 yolov1的loss函数 四 yolov1训练过程 1 训练前处理 2 五 yolov1的优缺点 写在最初 关于基于深度学习的目标检测相
  • 从近两年的CVPR会议来看,目标检测的研究方向是怎么样的?

    Old Xie CS2EE2CS Naiyan Wang 等 85 人赞同 目前object detection的工作可以粗略的分为两类 1 使用region proposal的 目前是主流 比如RCNN SPP Net Fast RCNN
  • (linux系统下)MMCV及MMClassification教程及安装问题解决

    说一下依托关系 MMCV是面向计算机视觉的一个基础库 它支持OpenMMLab的各个模块包括MMClassification图像分类 MMDetectionm目标检测 MMOCR文字检测识别等等 本文主要详细介绍一下mmcv和mmcls的安
  • 【目标检测】OneNet: Towards End-to-End One-Stage Object Detection

    label assignment是指 在训练过程中如何将某个prediction指定给某个GT 用于计算损失 训练网络 对于上一篇文章 他们首先用one to one label assignment替换了one to many label
  • YOLOV5加速之TensorRT篇

    之前写过一篇Android版本yolov5s的博客 最近工作搞了下TensorRT 也遇到几个坑不过最终还是实现了 做一下小小的分享 这里直接上github上大牛的连接 我的代码是在他的基础上改的 里面有很多模型的加速直接看里面的yolov
  • 目标检测之二(传统算法和深度学习的源码学习)

    目标检测之二 传统算法和深度学习的源码学习 本系列写一写关于目标检测的东西 包括传统算法和深度学习的方法都会涉及到 注重实验而不着重理论 理论相关的看论文去哈 主要依赖opencv 本文主要内容 简单分析下yolo9000的原理 然后使用o
  • 机器学习课程总结3--基本卷积神经网络+评价指标+目标检测与Yolo网络

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 目录 一 基本卷积神经网络 1 AlexNet 2 VGG 16 3 残差网络 二 常用数据集与评价指标 1 数据集 2 评价指标 三 目标检测 YOLO 1 1 目标检测问
  • FPN网络详解

    1 特征金字塔 特征金字塔 Feature Pyramid Networks FPN 的基本思想是通过构造一系列不同尺度的图像或特征图进行模型训练和测试 目的是提升检测算法对于不同尺寸检测目标的鲁棒性 但如果直接根据原始的定义进行FPN计算
  • SimMIM:一种更简单的MIM方法

    自从何恺明的MAE 点击蓝字查看文章详情 出来之后 基于MIM Masked Image Modeling 的无监督学习方法越来越受到关注 这里介绍一篇和MAE同期的工作 SimMIM A Simple Framework for Mask
  • STM32f103增加ESP8266模块,通过Wifi用手机TCP服务端远程与STM32通信

    STM32f103增加ESP8266模块 通过Wifi用手机TCP服务端远程与STM32通信 提示 esp8266开启透传模式 连上路由器Wifi 电脑热点 接入STM32串口引脚 另外手机TCP服务端是手机IP地址 串口号 大于8000滴

随机推荐

  • 2022 年企业 Java 面试前复习的正确姿势(已助力 512 人入职大厂)

    前言 这份面试清单是今年 1 月份之后开始收集的 一方面是给公司招聘用 另一方面是想用它来挖掘在 Java 技术栈中 还有一些知识点是我还在探索的 我想找到这些技术盲点 然后修复它 以此来提高自己的技术水平 说实话刚开始的时候整理这些面试题
  • Docker第二篇-Linux和Windows下安装Docker

    文章目录 Docker版本说明 CentOS安装Docker 前提条件 安装 镜像加速 删除Docker CE Windows安装Docker 前提条件 安装 镜像加速 Docker版本说明 Docker 分为 CE 和 EE 两大版本 C
  • 树莓派烧录

    准备工作 树莓派 一张SD卡 SD尽可能的大 不然安装完系统 就没什么空间了 建议64G 软件准备 1 洗卡软件 SDcard Formatter 2 烧录软件 win32diskimager 3 镜像文件 可以从树莓派官网进行下载Rasp
  • MySQL数据行溢出的深入理解

    一 从常见的报错说起 故事的开头我们先来看一个常见的sql报错信息 相信对于这类报错大家一定遇到过很多次了 特别对于OMG这种已内容生产为主要工作核心的BG 在内容线的存储中 数据大一定是个绕不开的话题 这里的数据 大 远不止存储空间占用多
  • jenkins搭建自动化部署(Windows)

    官网 https jenkins io 选择相应版本下载 安装后找到安装目录下jenkins war 可以放在tomcat下运行 也可直接运行命令 java jar jenkins war 启动 关闭命令 net start jenkins
  • mysql 5.6压缩安装_mysql5.6zip格式安装过程

    第一步 到官网下载mysql 5 6 44 winx64的压缩包文件格式 第二步 在我的电脑 gt 属性 gt 高级 gt 环境变量 path变量中添加mysql bin文件夹的路径 第三步 配置完环境变量之后先别忙着启动mysql 我们还
  • 08-分布式

    1 分布式中 接口的幂等性的设计 在高并发场景的架构里 幂等性是必须得保证的 比如说提交作业 查询和删除不在 幂等讨论范围 1 建唯一索引id 每次操作 都根据操作和内容生成唯一的id 在执行之前先判断id是否存在 如果不存在 则 执行后续
  • rem的使用方式

    rem是什么 rem是指相对于根元素的字体大小的单位 在日常开发过程中我们通常把根元素 html body 的字体设置为10px 方便于我们计算 此时子元素的1rem就相当于10px rem与em的区别 各自的优缺点 em子元素字体大小的e
  • CVPR 2019 论文大盘点—人体姿态篇

    CV君盘点了CVPR 2019 中有关人体姿态的论文 其中研究 3D人体姿态估计的论文最多 有 11 篇 研究 2D 姿态估计的 7 篇 姿态迁移 2 篇 人体图像生成 1 篇 人体捕捉 2 篇 另外还有2篇创建了新的基准数据集 姿态估计是
  • python云图

    安装相关插件 python3 m pip install jieba wordcloud matplotlib import matplotlib pyplot as plt import jieba from wordcloud impo
  • 【Spring Boot】【前后端分离】后端接口返回结果统一封装

    文章目录 创建 SpringBoot 项目 封装返回结果 实现返回对象的自动封装 处理异常 测试 最近在尝试使用前后端分离的模式写一个简单的个人博客 遇到接口数据返回结构的问题 在网上查了一圈 发现了一个很好用的方法 在复现的过程中也遇到了
  • 算法设计与分析课后总结

    算法设计与分析课后总结 算法设计与分析 第1章 算法设计基础 课后习题 第二章算法分析基础 课后习题 1 考虑下面算法 回答下列问题 算法完成什么功能 算法的基本语句时什么 基本语句执行了多少次 2 分析以下程序段中基本语句的执行次数 要求
  • 100天精通Python(可视化篇)——第92天:Pyecharts绘制炫酷柱状图、条形图实战大全

    文章目录 专栏导读 1 基础柱状图 2 旋转x轴标签 3 旋转坐标轴 4 添加坐标轴名称 5 添加标记点 6 添加标注线 7 添加数据 8 添加自定义背景图 9 堆叠柱状图 10 柱状图与折线图组合 11 三维柱状图 12 水平滑动 鼠标滚
  • 包、模块、函数的关系结构

    三者关系 python中程序的结构是由包 模块 函数 类大致构成 其关系如下 package module function 模块定义与调用 1 python中一个 py文件都可以是一个module module可以有函数 类 代码组成 如
  • 使用python解决中英混合参考文献中et al 和等的问题

    这个代码使用zipfile将docx进行解压 然后操作document xml文件 找到中文中的et al之后替换为 等 然后再压缩为docx import zipfile import re import os import shutil
  • curl服务器文件,curl 向远程服务器传输file文件

    public function upload 获取上传文件信息 文件名称以自己实际上传文件名称为准 fileinfo FILE filename 请求参数 依据商户自己的参数为准 requestParam version requestPa
  • 声网(agora)音视频通话sdk—微信小程序demo

    首先需要注册一个声网账号 注册成功后创建项目 appid是指声网项目的appid 后续会在小程序的配置文件中用到 微信小程序接入视频通话 需要声网给开通小程序的权限 给声网邮箱发送邮件 注明开通微信小程序接入权限 并给发送appid app
  • Python代码扫描:企业级代码代码安全漏洞扫描Bandit

    目录 什么是Bandit 特点 安装 配置 配置Bandit Pycharm配置外置工具 使用实践 命令行参数 检查单个文件 检查整个目录 PyCharm中对单个文件或者项目目录的扫描 一个使用案例 应用场景 总结 参考资料 注意 后续技术
  • js DOM

    DOM Document Object Model HTML 和 XML 文档的编程接口 通过 DOM JavaScript 能够访问和改变 HTML 文档的所有元素 1 查找 通过 id 查找 HTML 元素 div div 2 通过标签
  • Paper and Codes Leaderboard

    目录 介绍 模型入选标准 1 目标检测 Paper and Codes for COCO by 2023 3 31 COCO FPS Models by 2023 02 18 Look at Batch Size 2 图像分类 ImageN
Powered by Hwhale