63万张!旷视发布最大物体检测数据集Objects365,物体检测竞赛登陆CVPR

2023-10-30

郭一璞 发自 北京会议中心 
量子位 报道 | 公众号 QbitAI

比ImageNet大的图像数据集来了。

在4月16日的智源学者计划启动暨联合实验室发布会上,旷视科技发布了通用物体检测数据集Objects365,包含63万张图像,远超ImageNet、COCO等数据集。

另外,还开办了针对此数据集的CVPR Workshop竞赛。

史上最大通用物体检测数据集

旷视科技首席科学家孙剑介绍了旷视研究院最近发布的通用物体检测数据集Objects365,总共包含63万张图像数量,覆盖365个类别数量,高达 1000 万的框数,超越了Pascal VOC、ImageNet、COCO数据集。

640?wx_fmt=png

数据集包括人、衣物、居室、浴室、厨房、办公、电器、交通、食物、水果、蔬菜、动物、运动、乐器14个大类,每一类都有数十个小类。

640?wx_fmt=png

有人群的场景:

640?wx_fmt=png

动物的场景:

640?wx_fmt=png

房间的场景:

640?wx_fmt=png

如果只考虑收录于COCO和VOC数据集的80类和20类,在每张图像平均框数和类别数这两项指标上,Objects365依然优于COCO和VOC,标注过程中减少了漏标,平均标注区域占比也超过COCO和VOC。

640?wx_fmt=png

另外,在每张图像覆盖的类别方面,相比此前的数据集,Objects365覆盖类别更广。

640?wx_fmt=png

数据集传送门:
http://www.objects365.org/overview.html

CVPR DIW挑战赛

针对Objects365以及之前发布的大规模拥挤场景数据集CrowdHuman,旷视科技与北京智源人工智能研究院还将举办Detection In the Wild 2019(DIW 2019)挑战赛,目前挑战赛已成功申请为2019 CVPR Workshop。

竞赛分为三个赛道,分别是Objects365通用物体检测完整赛道,Objects365通用物体检测迷你赛道,以及CrowdHuman密集人体检测。

640?wx_fmt=png

目前比赛已经正式开始,参赛队伍可以开始注册,训练集和验证集已经发布;

5月10日(23:59 PST)发布测试集数据;

6月10日(23:59 PST)测试集提交阶段结束,比赛截止;

最终结果将于6月17日公布,获胜队可以在长滩的CVPR Workshop上介绍参赛经验。

智源-旷视联合实验室

此外,发布会上海宣布了北京智源-旷视智能模型设计与图像感知联合实验室成立,由旷视研究院院长孙剑任实验室主任。

联合实验室平台面向高校院所等科研单位和创新创业主体开放,支持高校本科及研究生教学,提供实验例程,开源完整的训练代码库,计划每年培训学生人数不少于500人。

智源学者:每人每年50W

另外,去年11月成立的北京智源人工智能研究院也在发布会上公布了智源学者的候选人名单。

智源研究院的每个重大学术方向下设置一位首席科学家、一位研究项目经理、以及数位研究员与青年科学家(38岁以下)。

今天公布的智源学者属于人工智能数理基础重大研究方向,首席科学家由中国科学院院士、北京大学数学科学学院张平文教授担任,智源研究项目经理由北京大学夏壁灿教授担任,10位智源研究员为北京大学董彬副教授、李铁军教授、林伟研究员、文再文副教授、杨超教授、张志华教授,清华大学邓柯副教授、史作强副教授、中科院数学与系统科学研究院戴彧虹研究员、明平兵研究员。

另外,还有九位候选的青年科学家:

北京大学特聘研究员朱占星
北京大学副研究员章斯鑫
北京应用物理与计算数学研究所副研究员王涵
北京大学副教授邵嗣烘
清华大学助理教授林乾
清华大学助理教授黄高
旷视研究院研发总监张祥雨博士
清华大学长聘副教授崔鹏
清华大学长聘副教授唐平中

所有候选人将经过一个月的公示期后正式成为智源学者。

北京智源人工智能研究院院长、北京大学计算机系主任黄铁军表示,研究院将不经过任职单位、直接为受聘的智源学者支付费用,每人每年不低于50万元;另外还会支付科研经费,只要不违规都可以自由使用。

另外,智源学者不采用传统机构的申报机制,没有批次概念,符合要求的人才可以随时获得研究院的支持。

2019年,智源学者计划将支持100人,覆盖5-7个重大方向,青年科学家30-50人;明年后年再分别增加百人,智源学者总体规模保持在300人左右。

活动报名|多模态视频人物识别

640?wx_fmt=jpeg

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;


欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)


640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

63万张!旷视发布最大物体检测数据集Objects365,物体检测竞赛登陆CVPR 的相关文章

随机推荐

  • 省市区地区编码获取

    获取国家统计局省市区代码 在之前作者代码基础上进行了修改 1 解决了重复报错问题 2 只获取三级地址 3 获取2022年的 具体看代码 注意看Readme md https gitee com ctcncom crawler blob ma
  • 爬取新浪微博(搜索含关键词微博及其评论)

    import csv import requests import json import re import jieba import matplotlib pyplot as plt from wordcloud import Word
  • 关于vue播放flv,m3u8视频流(监控)的方法

    前文 随着前端大屏页面的逐渐壮大 客户的需求也越来越多 大屏上面展示的事物也越来越丰 富 其中实时播放监控的需求逐步增加 视频流格式也是有很多种 用到最多的 flv m3u8 一 JessibucaPlayer插件用来播放flv流 1 首先
  • 有没有工业软件发展历史方面的书籍?讲公司、技术的发展历程?

    好像没有吧 况且工业软件的发展在智能制造的时代已经发生根本性的转变 传统的工业软件逐渐退出历史舞台 由新兴的工业软件所取代 即工业APPs 我们现在讲的工业软件通常意义就是说的工业APP 是工业互联网的重要组成部分 在实现人 机 物全面互联
  • 【CSS3高级应用】

    CSS3高级应用 一 页面中的多媒体嵌入 二 CSS3中过渡效果 transition 三 CSS3中变形效果 transform 四 CSS3的动画效果 animation 五 CSS3的滤镜效果 Filters 六 CSS3精灵技术 s
  • Field injection is not recommended 依赖注入方式

    参考文章 http vojtechruzicka com field dependency injection considered harmful 首先对于还不熟悉 Autowired的同学当然也包括我先去看看它到底有什么作用 自动装配
  • VLCDotNet在C#中的使用说明

    摸索了半天终于搞定了 记录一下 首先到开源网站下载压缩包 https github com ZeBobo5 Vlc DotNet releases 下载解压有四个类库工程和两个实例项目 Vlc DotNet Core Interops Vl
  • 66.加一[Leetcode 力扣 Java&C完整解答]

    为什么我要给出完整解答 因为要搜索个题目的解答 很多都偷懒只给个方法的实现 结果跑都跑不起来 于是我就决定 每一题 都给出Java C两种完整的解答 直接就可以运行 Debug Leetcode题目来源 66 加一 给定一个由整数组成的非空
  • idea中的项目没有蓝色小方块

    将idea右侧的加号 加上该项目的pom xml 刷新即可 浪费了哥十几分钟时间
  • 如何提交代码到github仓库(2022最新最详细)

    一 github注册及创建仓库 首先得先注册一个github账号 如何注册在这就不多陈述 如果注册过程中有任何疑问可以去网上查阅资料 也可以私聊我 2 注册好github账号后 来到如图画面 点击new建立一个github仓库 设置好后点击
  • 关于错误 The type or namespace name `Vuforia' could not be found. Are you missing an assembly reference?

    今天想用unity打包一个AR的demo到手机里试试截屏功能 在客户端运行都好好的 一打包就出现了标题里面的问题 不仅如此 还有一连带的 意思就是找不到你using的这些命名空间 我百度都找遍了 还是未果 我就开始在工程里寻找哪里有这些命名
  • 小程序顶部返回按钮

    一 小程序顶部返回按 直接只用uni navigateTo 相当于再压一次栈 同时在onBackPress中不能直接调用uni navigateBack 否则会无限循环 导致返回无法生效 onBackPress options if opt
  • Windows下批处理文件(.bat)的使用

    批处理 Batch 就是进行批量的处理 英文译文BATCH 批处理文件后缀BAT就取的前三个字母 通常被认为是一种简化的脚本语言 它应用于DOS和Windows系统中 批处理文件是扩展名为 bat或 cmd的文本文件 包含一条或多条命令 由
  • idea快捷键设置(Idea常用快捷键大全)

    目录 友情提醒 第一章 IDEA常用快捷键 1 1 快捷键 查找 提示类 1 2 快捷键 修改代码类 1 3 快捷键 光标移动类 第二章 Idea如何修改快捷键 2 1 已知快捷键 通过搜索快捷键查找 2 2 已知快捷键含义 通过输入快捷键
  • SpringBoot 如何实现多文件的上传和下载

    在前面的文章中 我们介绍了如何在Spring Boot中实现单个文件的上传和下载 但是 有时候我们需要实现多个文件的上传和批量下载 本文将介绍如何在Spring Boot中实现多文件上传和批量下载的功能 多文件上传 在Spring Boot
  • 通过transpose和flip实现图像旋转90/180/270度

    在fbc cv库中 提供了对图像进行任意角度旋转的函数rotate 其实内部也是调用了仿射变换函数warpAffine 如果图像仅是进行90度倍数的旋转 是没有必要用warpAffine函数的 这里通过transpose和flip函数实现对
  • 上网流量不够用,办无限流量卡吗?python程序员教你暴力破解wifi

    流量不够用怎么办 随着时代的发展 流量也是越来越不够用了 办无限网卡吗 月租太贵不划算 还是用Wi Fi舒服 不用担心流量用没了 今天用python教大家写一个暴力破解Wi Fi的程序 Wi Fi在手 天下我有 上网流量不够用 办无限流量卡
  • STM32中断优先级彻底讲解

    一 综述 STM32 目前支持的中断共为 84 个 16 个内核 68 个外部 16 级可编程中断优先级的设置 仅使用中断优先级设置 8bit 中的高 4 位 和16个抢占优先级 因为抢占优先级最多可以有四位数 二 优先级判断 STM32
  • STM32:寄存器概念

    目录 1 STM32长什么样 2 STM32内部有什么 2 1 STM32芯片架构简图 3 存储器映射 3 1 什么叫存储器映射 3 2 让GPIOB端口的16个引脚输出高电平 要怎么实现 4 什么是寄存器 4 1 总线基地址 4 2 寄存
  • 63万张!旷视发布最大物体检测数据集Objects365,物体检测竞赛登陆CVPR

    郭一璞 发自 北京会议中心 量子位 报道 公众号 QbitAI 比ImageNet大的图像数据集来了 在4月16日的智源学者计划启动暨联合实验室发布会上 旷视科技发布了通用物体检测数据集Objects365 包含63万张图像 远超Image