时隔一年,盘点CVPR 2019影响力最大的20篇论文

2023-05-16

CVPR 2019 已经过去一年了,本文盘点其中影响力最大的 20 篇论文,这里的影响力以谷歌学术上显示的论文的引用量排序,截止时间为2020年7月22日。

其中的一些结论蛮有意思的:

1. 这 20 篇论文全部开源了。不开源的论文复现代价大,别人参考的门槛会高很多,维护好论文对应的开源软件能极大提高论文影响力。

2. 方向分布在GAN、人脸识别、神经架构搜索、语义分割、图像合成、姿态估计、迁移学习、3D目标检测、全景分割、目标跟踪、图像分类、网络结构设计(可变形卷积)、对抗学习、三维重建等方向。

3. 引用数排名第一的 StyleGAN 引用次数 956 远超第二名 ArcFace 689 次,和第三名 Mnasnet 486 次。第 10 名 FBnet 228次,第20 名 Sophie 157 次。

4. 这些论文绝大多数有工业界巨头的身影,英伟达贡献 2 篇 (第一名来自英伟达),谷歌贡献 4 篇,Facebook 贡献 4 篇,亚马逊1篇, 国内微软亚研院2篇,商汤 1 篇,京东 1篇。

5. 目标检测是计算机视觉领域非常火的方向,但入选的两篇全是3D点云目标检测。

6. 人脸识别在工业界应用很火,但只有一篇论文入前20(大名鼎鼎的 ArcFace),说明这个领域的技术也许已经趋于成熟。

。。。

大家发现还有那些有意思的规律,欢迎在文末留言交流。

   No.1  StyleGAN

A style-based generator architecture for generative adversarial networks

StyleGAN-基于样式的生成对抗网络

作者 | Tero Karras, Samuli Laine, Timo Aila

单位 | 英伟达

论文 | https://arxiv.org/abs/1812.04948

代码 | https://github.com/NVlabs/stylegan

解读 | https://zhuanlan.zhihu.com/p/63230738

引用次数 | 956

   No.2  Arcface 人脸识别

Arcface: Additive angular margin loss for deep face recognition

用于深度人脸识别的加法角余量损失

作者 | Jiankang Deng, Jia Guo, Niannan Xue, Stefanos Zafeiriou

单位 | 伦敦帝国学院;InsightFace

论文 | https://arxiv.org/abs/1801.07698

代码 | https://github.com/deepinsight/insightface

解读 | https://zhuanlan.zhihu.com/p/76541084

引用次数 | 689

   No.3 Mnasnet,神经架构搜索

Mnasnet: Platform-aware neural architecture search for mobile

移动端自动设计网络

作者 | Mingxing Tan, Bo Chen, Ruoming Pang, Vijay Vasudevan, Mark Sandler, Andrew Howard, Quoc V. Le

单位 | 谷歌

论文 | https://arxiv.org/abs/1807.11626

代码 | https://github.com/tensorflow/tpu/tree/

master/models/official/mnasnet

引用次数 | 486

   No.4 DANet 场景分割(语义分割)

Dual attention network for scene segmentation

场景分割的双注意力网络

作者 | Jun Fu, Jing Liu, Haijie Tian, Yong Li, Yongjun Bao, Zhiwei Fang, Hanqing Lu

单位 | 中科院自动化所;京东;国科大

论文 | https://arxiv.org/abs/1809.02983

代码 | https://github.com/junfu1115/DANet

引用次数 | 400

   No.5 AutoAugment 数据增广

AutoAugment: Learning augmentation strategies from data

作者 | Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, Quoc V. Le

单位 | 谷歌大脑

论文 | https://arxiv.org/abs/1805.09501

代码 | https://github.com/tensorflow/models/tree/

master/research/autoaugment

引用次数 | 377

   No.6 SPADE 图像合成

Semantic image synthesis with spatially-adaptive normalization

具有空间适应性归一化的语义图像合成技术

作者 | Taesung Park, Ming-Yu Liu, Ting-Chun Wang, Jun-Yan Zhu

单位 | UC Berkeley ;英伟达;MIT CSAIL

论文 | https://arxiv.org/abs/1903.07291

代码 | https://github.com/NVlabs/SPADE

备注 | CVPR 2019 Oral

引用次数 | 292

   No. 7 HRNet 人体姿态估计

Deep high-resolution representation learning for human pose estimation

用于人体姿态估计的深度高分辨率表征学习

作者 | Ke Sun, Bin Xiao, Dong Liu, Jingdong Wang

单位 | 中国科学技术大学;微软亚洲研究院

论文 | https://arxiv.org/abs/1902.09212

代码 | https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

解读 | https://zhuanlan.zhihu.com/p/57876066

引用次数 | 282

   No.8 Auto-Deeplab NAS+语义分割

Auto-deeplab: Hierarchical neural architecture search for semantic image segmentation

作者 | Chenxi Liu, Liang-Chieh Chen, Florian Schroff, Hartwig Adam, Wei Hua, Alan Yuille, Li Fei-Fei

单位 | 约翰斯霍普金斯大学;谷歌;斯坦福大学

论文 | https://arxiv.org/abs/1901.02985

代码 | https://github.com/tensorflow/models/tree/

master/research/deeplab

解读 | 谷歌Auto-DeepLab:自动搜索图像语义分割架构算法开源实现

备注 | CVPR 2019 Oral

引用次数 | 233

   No.9 迁移学习

Do better imagenet models transfer better?

作者 | Simon Kornblith, Jonathon Shlens, Quoc V. Le

单位 | 谷歌大脑

论文 | https://arxiv.org/abs/1805.08974

代码 | https://github.com/lsh3163/Imagenet-Better

备注 | CVPR 2019 Oral

引用次数 | 232

   No.10 FBNet 神经架构搜索

FBnet: Hardware-aware efficient convnet design via differentiable neural architecture search

通过可微的神经架构搜索实现硬件感知的高效convnet设计

作者 | Bichen Wu, Xiaoliang Dai, Peizhao Zhang, Yanghan Wang, Fei Sun, Yiming Wu, Yuandong Tian, Peter Vajda, Yangqing Jia, Kurt Keutzer

单位 | UC Berkeley;普林斯顿大学;Facebook

论文 | https://arxiv.org/abs/1812.03443

代码 | https://github.com/facebookresearch/

mobile-vision

引用次数 | 228

   No.11 PointRCNN 3D目标检测

Pointrcnn: 3d object proposal generation and detection from point cloud

PointRCNN 第一个基于原始点云的3D目标检测

作者 | Shaoshuai Shi, Xiaogang Wang, Hongsheng Li

单位 | 香港中文大学

论文 | https://arxiv.org/abs/1812.04244

代码 | https://github.com/sshaoshuai/PointRCNN

解读 | https://zhuanlan.zhihu.com/p/71564244

引用次数 | 207

   No.12 Pointpillars 3D目标检测

Pointpillars: Fast encoders for object detection from point clouds

从点云中进行目标检测的快速编码器

作者 | Alex H. Lang, Sourabh Vora, Holger Caesar, Lubing Zhou, Jiong Yang, Oscar Beijbom

单位 | nuTonomy: an APTIV company

论文 | https://arxiv.org/abs/1812.05784

代码 | https://github.com/nutonomy/second.pytorch

引用次数 | 191

   No.13 全景分割开山之作

Panoptic segmentation

‍作者 | Alexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, Piotr Dollár

单位 | FAIR;海德堡大学

论文 | https://arxiv.org/abs/1801.00868

代码 | https://github.com/facebookresearch/detectron2/

引用次数 | 186

   No.14 Siamrpn++ 目标跟踪

Siamrpn++: Evolution of siamese visual tracking with very deep networks

作者 | Bo Li, Wei Wu, Qiang Wang, Fangyi Zhang, Junliang Xing, Junjie Yan

单位 | 商汤;中科院自动化所;中科院计算所

论文 | https://arxiv.org/abs/1812.11703

代码 | http://github.com/STVIR/pysot

主页 | http://bo-li.info/SiamRPN++/

解读 | https://zhuanlan.zhihu.com/p/56254712

引用次数 | 188


   No.15 SiamMask 目标跟踪

Fast Online Object Tracking and Segmentation: A Unifying Approach

作者 | Qiang Wang, Li Zhang, Luca Bertinetto, Weiming Hu, Philip H.S. Torr

单位 | 中科院自动化所;牛津大学;FiveAI

论文 | https://arxiv.org/abs/1812.05050

代码 | https://github.com/foolwood/SiamMask

主页 | http://www.robots.ox.ac.uk/~qwang/SiamMask/

解读 | CVPR 2019 | 惊艳的SiamMask:开源快速同时进行目标跟踪与分割算法

引用次数 | 185

   No.16 亚马逊图像分类大礼包

Bag of tricks for image classification with convolutional neural networks

作者 | Tong He, Zhi Zhang, Hang Zhang, Zhongyue Zhang, Junyuan Xie, Mu Li

单位 | 亚马逊

论文 | https://arxiv.org/abs/1812.01187

代码 | https://github.com/dmlc/gluon-cv

引用次数 | 183

   No.17 升级版可变形卷积

Deformable convnets v2: More deformable, better results

作者 | Xizhou Zhu, Han Hu, Stephen Lin, Jifeng Dai

单位 | 中国科学技术大学;微软亚洲研究院

论文 | https://arxiv.org/abs/1811.11168

代码 | https://github.com/msracver/Deformable-ConvNets

解读 | https://zhuanlan.zhihu.com/p/77644792

引用次数 | 182

   No.18 对抗学习

Feature denoising for improving adversarial robustness

作者 | Cihang Xie, Yuxin Wu, Laurens van der Maaten, Alan Yuille, Kaiming He

单位 | 约翰斯霍普金斯大学;FAIR

论文 | https://arxiv.org/abs/1812.03411

代码 | https://github.com/facebookresearch/ImageNet-Adversarial-Training

引用次数 | 179

   No. 19 DeepSDF 三维模型表示(三维重建)

Deepsdf: Learning continuous signed distance functions for shape representation

作者 | Jeong Joon Park, Peter Florence, Julian Straub, Richard Newcombe, Steven Lovegrove

单位 | 华盛顿大学;麻省理工学院;Facebook Reality Labs

论文 | https://arxiv.org/abs/1901.05103

代码 | https://github.com/facebookresearch/DeepSDF

引用次数 | 172

   No. 20 Sophie 行人路径预测(自动驾驶领域)

Sophie: An attentive gan for predicting paths compliant to social and physical constraints

作者 | Amir Sadeghian, Vineet Kosaraju, Ali Sadeghian, Noriaki Hirose, S. Hamid Rezatofighi, Silvio Savarese

单位 | 斯坦福大学;佛罗里达大学;阿德莱德大学

论文 | https://arxiv.org/abs/1806.01482

代码 | https://github.com/StanfordVL/sophie

引用次数 | 157

备注:CV

计算机视觉学习交流群

更多最新CV学习技术信息,

若已为CV君其他账号好友请直接私信。

OpenCV中文网

微信号 : iopencv

QQ群:805388940

微博/知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

时隔一年,盘点CVPR 2019影响力最大的20篇论文 的相关文章

  • Linux内核 申请和释放内存流程

    1 内核初始化 xff1a 内核建立好内核页目录页表数据库 xff0c 假设物理内存大小为len xff0c 则建立了 3G 3G 43 len 0 len 这样的虚地址vaddr和物理地址paddr的线性对应关系 xff1b 内核建立一个
  • 编译器"自举与移植"原理

    本文基于对 编译原理与实践 中有关编译器自举与移植部分的读书 笔记 形式 xff0c 因为原书是老外写的 xff0c 感觉翻译的地方好多语句不通或难以理解 xff0c 所以花了好多功夫研究这一块 注 xff1a 本文中与原书一致的地方都是P
  • Linux 内核 由block_read和block_write函数引发的设备块号转换问题的思考

    在1 2内核版本中 xff0c 在Linux fs目录下 xff0c 有一个block dev c文件 xff0c 里面主要包含了block read block write block fsync函数 先说说我遇到的问题 xff0c 在块
  • Linux 进程调度时机

    Linux调度时机主要 有 xff1a 1 进程状态转换的时刻 xff1a 进程终止 进程睡眠 2 当前进程的时间 片用完时 xff08 current gt counter 61 0 xff09 3 设备驱动程序 4 进程从中断 异常及系
  • linux 下批量转换pdf的命令方法

    由于在windows下的图形界面 xff0c 难以批量进行其他格式的文件到PDF格式文件的转换 xff0c 而一些其他的软件也不是很满意 xff0c 所以转到linux下 xff0c 想利用linux强大的命令行来完成这件事 linux下有
  • Linux内核 内存映射文件机制mmap

    今天研究Linux1 2内核运行加载a out格式的可执行文件的代码时 xff0c 无意中研究明白了内核提供的内存映射机制 mmap xff08 memory map xff09 当内核要加载可执行文件到相应的用户地址空间时 xff0c 有
  • bash提示符的配置:

    bash提示符的配置 xff1a 如果您很容易使 shell 提示行变得色彩绚烂斓且带有更多信息 xff0c 为什么还要坚持用单调的标准 shell 提示行呢 xff1f 在这篇技巧中 xff0c Daniel Robbins 将说明如何获
  • Linux线性地址空间的划分及内核寻址方式

    今天研究Linux1 2内核时 xff0c 注意到该版本中的PAGE OFFSET宏被定义为0 xff0c 考虑到进程的地址空间被划分为3G的用户态地址空间和1G的内核态地址空间 xff0c 于是深入的研究了一下这个问题 一开始我只是疑惑
  • linux 最简单的模块的编写和运行

    第一次动手编写一个内核模块 xff0c 但是查找了许多资料没有一个可以完美通过编译的 xff0c 郁闷 xff0c 最后还是解决了 xff0c 分享出来 首先是hello c include lt linux kernel h gt Nee
  • 截获或替换linux系统调用

    直接上代码吧 xff1a hello c include lt linux kernel h gt Needed by all modules include lt linux module h gt Needed for KERN inc
  • oracle临时表实际应用

    xff08 这段是后面添加的 xff1a 临时表 xff0c 在实际应用中 xff0c 其实和nologging的固定表 xff0c 是差不多的 xff0c 都是中间表 xff0c 所以这里为什么添加这段话 xff0c 是让自己记得 xff
  • linux sys_call_table 初始化

    前几天看内核中系统调用代码 xff0c 在系统调用向量表初始化中 xff0c 有下面这段代码写的让我有点摸不着头脑 xff1a const sys call ptr t sys call table NR syscall max 43 1
  • Linux gcc 利用反汇编来研究C语言函数堆栈的分配方式

    越来越感觉学习C和汇编才是最能接近计算机本质的途径 所以 xff0c 今天开始研究汇编了 xff0c 先从gcc反汇编开始 首先是下面的C代码 xff1a include lt stdio h gt int sum int a int b
  • ubuntu linux GAIM QQ

    sudo add apt repository ppa lainme pidgin lwqq sudo apt get update sudo apt get install pidgin lwqq sudo apt get install
  • Ubuntu 14.10 播放avi视频闪屏的简单解决方案

    昨天将ubuntu升级到了14 10版本 xff0c 没有得到想象中的视觉效果 但是 xff0c 后来却发现不能播放avi视频了 xff0c 尝试了各种播放器 xff0c 都无解 xff0c 总是闪屏 xff0c 而播放flv格式的视频就没
  • Ubuntu删除Compiz之后 恢复方法

    因为ubuntu14 10不能播放avi的问题纠结了很久 xff0c 最终使用转码软件解决的 但是还是不甘心啊 xff0c 总想解决这个问题或者知道问题的原因 偶然看到了系统中的compiz软件 xff0c 想到在网上看到的有人说是因为系统
  • Ubuntu14.10 unity-tweak-tool 不能正常打开的解决方法

    新的系统 xff0c 风格都变了 xff0c 折腾了一晚上 xff0c 想安装个苹果主题 xff0c 可是unity tweak tool 这个东西就是死活打不开 这么晚了 xff0c 不想多说了 xff0c 直接给解决方法吧 xff1a
  • 安装ubuntu14.04后做的一些事情

    ubuntu又折腾坏了 xff0c 于是有重新装系统了 装完之后 xff0c 美化美化 xff1a 1 本来嫌每次都sudo麻烦 xff0c 于是想将我的帐号设置为sudo不用输入密码 xff0c 但是编辑sudoer文件的时候 xff0c
  • LFS编译GCC GNU_USER_TARGET_OS_CPP_BUILTINS not declared in this scope

    gcc v 发现使用的gcc版本是4 7 安装gcc 4 4 or 4 3 xff0c 重新链接 xff0c 问题解决 apt get install gcc 4 4 g 43 43 4 4 进入 usr bin cd usr bin 建个
  • 将LFS系统通过grub装到优盘上启动

    最近在搞LFS xff0c 就是通过自己动手 xff0c 亲自编译源代码的方式 xff0c 建立自己的linux发行版 通过这个过程可以详细的深入了解linux内部的工作方式 xff0c 对理解操作系统的机制有很大的帮助 做这个项目 xff

随机推荐

  • kali linux 解决风扇猛转

    之前玩ubuntu的时候 xff0c 就感觉风扇猛转个不停 xff0c 之前是通过安装nvidia的闭源驱动 xff0c 然后再安装一个管理双显卡的工具解决的 xff0c 确实风扇及立马安静了下来 http www linuxidc com
  • PHP下十六位数值转IP地址

    PHP函数提供的long2ip和ip2long是IP和整形数值之间的转换 xff0c 没有和十六位数值的转换 xff0c 所以写下这个函数 function ntoip iphex len 61 strlen iphex 得到16进制字符串
  • linux系统备份命令

    tar cvpzf backup tgz exclude 61 proc exclude 61 lost 43 found exclude 61 backup tgz exclude 61 mnt exclude 61 sys exclud
  • 硬盘寻址能力的变换

    1 8G限制 硬盘寻址的限制 硬盘最初使用的寻址方法是柱面 磁头 扇区CHS xff08 Cylinder Head Sector xff09 xff0c 也称为3D模式 xff0c 是硬盘最早采用的寻址模式 通过分别指定柱面 磁头 扇区来
  • 关于动态new二维数组的问题

  • Linux 调节并自动保存屏幕亮度,重启有效

    用过几个Linux的发行版 xff0c 发现在笔记本上每次调节亮度后 xff0c 不能固定下来 xff0c 重新开机后就又恢复最大亮度了 之前一直用的是网上流行的方法 xff0c 即往etc rc local文件写入命令 xff0c 使其每
  • kali linux 安装Pidgin QQ

    首先 xff0c 需要kali开启PPA源 PPA xff08 Personal Package Archives xff1a 个人软件包档案 xff09 是Ubuntu Launchpad网络提供的一项服务 xff0c 允许个人用户上传软
  • 教你如何用Kali Linux制作windows 10安装优盘

    最近win10发布了 xff0c 看样子挺不错 虽然我一直用的是Linux xff0c 但是还是想体验一把win10 主要是尼玛我想看百度云里存放的教学视频 xff0c 但是里面的视频还需要特殊的播放器 xff0c 也是不得己 xff0c
  • kali linux安装搜狗输入法

    昨天安装了kali linux2 0 xff0c 感觉输入法没有以前好了 于是查资料安装搜狗输入法 xff0c 还是搜狗输入法好使 有几篇文章倒是谈到如何在kali上安装搜狗了 xff0c 但是一方面是文章太老了 xff0c 二是还得自己下
  • 关于android系统对AndroidManifest文件的解析机制

    最近在学习android的过程中一直在思考一个问题 xff0c 我们都知道 xff0c 在android的AndroidManifest xml 是每个android程序中必须的文件 它位于整个项目的根目录 xff0c 描述了package
  • Android对xml文件的解析

    今天阅读android sdk官方文档时 xff0c 看到这么一段话 xff1a 感觉深受启发 xff1a 1 android的图形界面内部逻辑结构是树形结构 xff0c 这个从xml文件的结构可以直观的看出来 如果我们要使用java代码来
  • kail linux 安装QQ

    腾讯QQ 下载地址 xff1a http www ubuntukylin com appli p lang 61 cn amp id 61 23 下载后解压得到wine qqintl文件夹 xff0c 里面有三个deb包 xff1a fon
  • ubuntu kylin下宽带拨号

    用pppoeconf这个命令 xff0c 一般来说 xff0c 里面已经安装好了的 按照提示过程处理即可 xff0c 要提供adsl用户名和密码 一般很多用户会配置成开机自动启动adsl xff0c 也可以手动 xff1a pon dsl
  • linux主机远程桌面

    利用xrdp 43 rdesktop可以实现
  • 把vim打造成C++ IDE

    目录 准备工作第一个插件pathogenauto pairsNERDTreeMiniBufExplorerctagstaglistomnicppcomplete ctagstaglistOmniCppCompleteSuperTab 最终的
  • MatConvNet compiled with '-R2018a' and linked with '-R2017b'

    modify line 620 to args 61 horzcat 39 outdir 39 mex dir flags base flags mexlink 39 R2018a 39 39 LDFLAGS 61 LDFLAGS 39 s
  • Java篇 - 聊聊Serializable (常见问题集锦)

    接着来聊聊Serializable xff0c Serializable的意思是序列化 1 序列化的概念 序列化 Serialization 将对象的状态信息转换为可以存储或传输的形式的过程 在序列化期间 xff0c 对象将其当前状态写入到
  • 总结:在树莓派中安装Ubuntu后无法连接WiFi的问题

    采用Raspberry官方的工具 官方提供的镜像 官方的配置方法 xff0c 结果发现系统启动后无法连接无线网 xff0c 也没办法配置后续的更新 xff0c 陷入沉思和懵逼 于是不断的换方法 换镜像 换工具 xff0c 依然没有解决问题
  • PX4_mixer通道分配的深度解析

    上文写了PIXHAWK的姿态控制算法 xff0c 该文主要对姿态控制输出到电机输出的通道分配环节进行深入解析 PX4的通道分配环节查看mixer multirotor cpp xff08 对应多旋翼的通道分配 xff09 PX4的mixer
  • 时隔一年,盘点CVPR 2019影响力最大的20篇论文

    CVPR 2019 已经过去一年了 xff0c 本文盘点其中影响力最大的 20 篇论文 xff0c 这里的影响力以谷歌学术上显示的论文的引用量排序 xff0c 截止时间为2020年7月22日 其中的一些结论蛮有意思的 xff1a 1 这 2