ECCV22 最新论文汇总(目标检测、图像分割、监督学习、GAN等)

2023-11-08

强烈感谢极市平台提供的论文资源

ECCV 2022 已经放榜,共有1629篇论文中选,录用率还不到20%。为了让大家更快地获取和学习到计算机视觉前沿技术,作者对ECCV2022最新论文进行追踪,包括分研究方向的论文及代码汇总。

         本次更新的 ECCV 2022 论文,包含检测,分割,图像处理,视频理解,神经网络结构设计,无监督学习,自监督学习,迁移学习等方向。项目地址:https://github.com/extreme-assistant/ECCV2022-Paper-Code-Interpretation

  • 检测
  • 分割
  • 图像处理
  • 视频处理
  • 图像、视频检索与理解
  • 估计
  • 目标跟踪
  • 文本检测与识别
  • GAN/生成式/对抗式
  • 神经网络结构设计
  • 数据处理
  • 模型训练/泛化
  • 模型压缩
  • 模型评估
  • 半监督学习/自监督学习
  • 多模态/跨模态学习
  • 小样本学习
  • 强化学习

检测

2D目标检测

[1] Point-to-Box Network for Accurate Object Detection via Single Point Supervision (通过单点监督实现精确目标检测的点对盒网络)

paper:https://arxiv.org/abs/2207.06827
code:https://github.com/ucas-vg/p2bnet

[2] You Should Look at All Objects (您应该查看所有物体)

paper:https://arxiv.org/abs/2207.07889
code:https://github.com/charlespikachu/yslao

[3] Adversarially-Aware Robust Object Detector (对抗性感知鲁棒目标检测器)

paper:https://arxiv.org/abs/2207.06202
code:https://github.com/7eu7d7/robustdet

3D目标检测

[1] Rethinking IoU-based Optimization for Single-stage 3D Object Detection (重新思考基于 IoU 的单阶段 3D 对象检测优化)

paper:https://arxiv.org/abs/2207.09332

人物交互检测

[1] Towards Hard-Positive Query Mining for DETR-based Human-Object Interaction Detection (面向基于 DETR 的人机交互检测的硬性查询挖掘)

paper:https://arxiv.org/abs/2207.05293
code:https://github.com/muchhair/hqm

图像异常检测

[1] DICE: Leveraging Sparsification for Out-of-Distribution Detection (DICE:利用稀疏化进行分布外检测)

paper:https://arxiv.org/abs/2111.09805
code:https://github.com/deeplearning-wisc/dice

分割

实例分割

[1] Box-supervised Instance Segmentation with Level Set Evolution (具有水平集进化的框监督实例分割)

paper:https://arxiv.org/abs/2207.09055

[2] OSFormer: One-Stage Camouflaged Instance Segmentation with Transformers (OSFormer:使用 Transformers 进行单阶段伪装实例分割)

paper:https://arxiv.org/abs/2207.02255
code:https://github.com/pjlallen/osformer

语义分割

[1] 2DPASS: 2D Priors Assisted Semantic Segmentation on LiDAR Point Clouds (2DPASS:激光雷达点云上的二维先验辅助语义分割)

paper:https://arxiv.org/abs/2207.04397
code:https://github.com/yanx27/2dpass

视频目标分割

[1] Learning Quality-aware Dynamic Memory for Video Object Segmentation (视频对象分割的学习质量感知动态内存)

paper:https://arxiv.org/abs/2207.07922
code:https://github.com/workforai/qdmn

图像处理

超分辨率

[1] Dynamic Dual Trainable Bounds for Ultra-low Precision Super-Resolution Networks (超低精度超分辨率网络的动态双可训练边界)

paper:https://arxiv.org/abs/2203.03844
code:https://github.com/zysxmu/ddtb

图像去噪

[1] Deep Semantic Statistics Matching (D2SM) Denoising Network (深度语义统计匹配(D2SM)去噪网络)

paper:https://arxiv.org/abs/2207.09302

图像复原/图像增强/图像重建

[1] Semantic-Sparse Colorization Network for Deep Exemplar-based Colorization (用于基于深度示例的着色的语义稀疏着色网络)

paper:https://arxiv.org/abs/2112.01335

[2] Geometry-aware Single-image Full-body Human Relighting (几何感知单图像全身人体重新照明)

paper:https://arxiv.org/abs/2207.04750

[3]Multi-Modal Masked Pre-Training for Monocular Panoramic Depth Completion (单目全景深度补全的多模态蒙面预训练)

paper:https://arxiv.org/abs/2203.09855

[4] PanoFormer: Panorama Transformer for Indoor 360 Depth Estimation (PanoFormer:用于室内 360 深度估计的全景变压器)

paper:https://arxiv.org/abs/2203.09283

[5] SESS: Saliency Enhancing with Scaling and Sliding (SESS:通过缩放和滑动增强显着性)

paper:https://arxiv.org/abs/2207.01769

[6] RigNet: Repetitive Image Guided Network for Depth Completion (RigNet:用于深度补全的重复图像引导网络)

paper:https://arxiv.org/abs/2107.13802

图像外推(Image Outpainting)

[1] Outpainting by Queries (通过查询进行外包)

paper:https://arxiv.org/abs/2207.05312
code:https://github.com/kaiseem/queryotr

风格迁移(Style Transfer)

[1] CCPL: Contrastive Coherence Preserving Loss for Versatile Style Transfer (CCPL:通用风格迁移的对比相干性保留损失)

paper:https://arxiv.org/abs/2207.04808
code:https://github.com/JarrentWu1031/CCPL

视频处理(Video Processing)

[1] Improving the Perceptual Quality of 2D Animation Interpolation (提高二维动画插值的感知质量)

paper:https://arxiv.org/abs/2111.12792
code:https://github.com/shuhongchen/eisai-anime-interpolator

[2] Real-Time Intermediate Flow Estimation for Video Frame Interpolation (视频帧插值的实时中间流估计)

paper:https://arxiv.org/abs/2011.06294
code:https://github.com/MegEngine/arXiv2020-RIFE

图像、视频检索与理解

动作识别

[1] ReAct: Temporal Action Detection with Relational Queries (ReAct:使用关系查询的时间动作检测)

paper:https://arxiv.org/abs/2207.07097
code:https://github.com/sssste/react

[2] Hunting Group Clues with Transformers for Social Group Activity Recognition (用Transformers寻找群体线索用于社会群体活动识别)

paper:https://arxiv.org/abs/2207.05254

视频理解

[1] GraphVid: It Only Takes a Few Nodes to Understand a Video (GraphVid:只需几个节点即可理解视频)

paper:https://arxiv.org/abs/2207.01375

[2] Deep Hash Distillation for Image Retrieval (用于图像检索的深度哈希蒸馏)

paper:https://arxiv.org/abs/2112.08816
code:https://github.com/youngkyunjang/deep-hash-distillation

视频检索(Video Retrieval)

[1] TS2-Net: Token Shift and Selection Transformer for Text-Video Retrieval (TS2-Net:用于文本视频检索的令牌移位和选择转换器)

paper:https://arxiv.org/abs/2207.07852
code:https://github.com/yuqi657/ts2_net

[2] Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval (轻量级注意力特征融合:文本到视频检索的新基线)

paper:https://arxiv.org/abs/2112.01832

估计

位姿估计

[1] Category-Level 6D Object Pose and Size Estimation using Self-Supervised Deep Prior Deformation Networks (使用自监督深度先验变形网络的类别级 6D 对象姿势和大小估计)

paper:https://arxiv.org/abs/2207.05444
code:https://github.com/jiehonglin/self-dpdn

深度估计

[1] Physical Attack on Monocular Depth Estimation with Optimal Adversarial Patches (使用最优对抗补丁对单目深度估计进行物理攻击)

paper:https://arxiv.org/abs/2207.04718

目标跟踪

[1] Towards Grand Unification of Object Tracking (迈向目标跟踪的大统一)

paper:https://arxiv.org/abs/2207.07078
code:https://github.com/masterbin-iiau/unicorn

文本检测与识别

[1] Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting (用于经济高效的端到端文本识别的动态低分辨率蒸馏)

paper:https://arxiv.org/abs/2207.06694
code:https://github.com/hikopensource/davar-lab-ocr

GAN/生成式/对抗式

[1] Eliminating Gradient Conflict in Reference-based Line-Art Colorization (消除基于参考的艺术线条着色中的梯度冲突)


paper:https://arxiv.org/abs/2207.06095
code:https://github.com/kunkun0w0/sga

[2] WaveGAN: Frequency-aware GAN for High-Fidelity Few-shot Image Generation (WaveGAN:用于高保真少镜头图像生成的频率感知 GAN)

paper:https://arxiv.org/abs/2207.07288
code:https://github.com/kobeshegu/eccv2022_wavegan

[3] FakeCLR: Exploring Contrastive Learning for Solving Latent Discontinuity in Data-Efficient GANs (FakeCLR:探索对比学习以解决数据高效 GAN 中的潜在不连续性)

paper:https://arxiv.org/abs/2207.08630
code:https://github.com/iceli1007/fakeclr

[4] UniCR: Universally Approximated Certified Robustness via Randomized Smoothing (UniCR:通过随机平滑获得普遍近似的认证鲁棒性)

paper:https://arxiv.org/abs/2207.02152

神经网络结构设计

神经网络架构搜索(NAS)

[1] ScaleNet: Searching for the Model to Scale (ScaleNet:搜索要扩展的模型)

paper:https://arxiv.org/abs/2207.07267
code:https://github.com/luminolx/scalenet

[2] Ensemble Knowledge Guided Sub-network Search and Fine-tuning for Filter Pruning (集成知识引导的子网络搜索和过滤器修剪微调)

paper:https://arxiv.org/abs/2203.02651
code:https://github.com/sseung0703/ekg

[3] EAGAN: Efficient Two-stage Evolutionary Architecture Search for GANs (EAGAN:GAN 的高效两阶段进化架构搜索)

paper:https://arxiv.org/abs/2111.15097
code:https://github.com/marsggbo/EAGAN

数据处理

归一化

[1] Fine-grained Data Distribution Alignment for Post-Training Quantization (训练后量化的细粒度数据分布对齐)

paper:https://arxiv.org/abs/2109.04186
code:https://github.com/zysxmu/fdda

模型训练/泛化

噪声标签

[1] Learning with Noisy Labels by Efficient Transition Matrix Estimation to Combat Label Miscorrection (通过有效的转移矩阵估计学习噪声标签以对抗标签错误校正)

paper:https://arxiv.org/abs/2111.14932

模型压缩

知识蒸馏

[1] Knowledge Condensation Distillation (知识浓缩蒸馏)

paper:https://arxiv.org/abs/2207.05409
code:https://github.com/dzy3/kcd

模型评估

[1] Hierarchical Latent Structure for Multi-Modal Vehicle Trajectory Forecasting (多模式车辆轨迹预测的分层潜在结构)

paper:https://arxiv.org/abs/2207.04624
code:https://github.com/d1024choi/hlstrajforecast

半监督学习/无监督学习/自监督学习

[1] FedX: Unsupervised Federated Learning with Cross Knowledge Distillation (FedX:具有交叉知识蒸馏的无监督联合学习)

paper:https://arxiv.org/abs/2207.09158

[2] Synergistic Self-supervised and Quantization Learning (协同自监督和量化学习)

paper:https://arxiv.org/abs/2207.05432
code:https://github.com/megvii-research/ssql-eccv2022

[3] Contrastive Deep Supervision (对比深度监督)

paper:https://arxiv.org/abs/2207.05306
code:https://github.com/archiplab-linfengzhang/contrastive-deep-supervision

[4] Dense Teacher: Dense Pseudo-Labels for Semi-supervised Object Detection (稠密教师:用于半监督目标检测的稠密伪标签)


paper:https://arxiv.org/abs/2207.02541

[1] Image Coding for Machines with Omnipotent Feature Learning (具有全能特征学习的机器的图像编码)

paper:https://arxiv.org/abs/2207.01932

多模态学习/跨模态

视觉-语言

[1] Contrastive Vision-Language Pre-training with Limited Resources (资源有限的对比视觉语言预训练)

paper:https://arxiv.org/abs/2112.09331
code:https://github.com/zerovl/zerovl

跨模态

[1] Cross-modal Prototype Driven Network for Radiology Report Generation (用于放射学报告生成的跨模式原型驱动网络)

paper:https://arxiv.org/abs/2207.04818v1
code:https://github.com/markin-wang/xpronet

小样本学习

[1] Learning Instance and Task-Aware Dynamic Kernels for Few Shot Learning (用于少数镜头学习的学习实例和任务感知动态内核)

paper:https://arxiv.org/abs/2112.03494

迁移学习/自适应

[1] Factorizing Knowledge in Neural Networks (在神经网络中分解知识)

paper:https://arxiv.org/abs/2207.03337
code:https://github.com/adamdad/knowledgefactor

[2] CycDA: Unsupervised Cycle Domain Adaptation from Image to Video (CycDA:从图像到视频的无监督循环域自适应)

paper:https://arxiv.org/abs/2203.16244

强化学习

[1] Target-absent Human Attention (目标缺失--人类注意力缺失)

paper:https://arxiv.org/abs/2207.01166
code:https://github.com/neouyghur/sess

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ECCV22 最新论文汇总(目标检测、图像分割、监督学习、GAN等) 的相关文章

  • TortoiseSVN设置忽略文件和目录文件夹

    参看 https blog csdn net bbj12345678 article details 80949556
  • sql server 查询表是否被哪些存储过程和视图引用

    select name from sysobjects as s inner join syscomments as o on s id o id where text like N 表名
  • GFS 阅读笔记

    这篇博客是我阅读著名的 GFS 论文 The Google File System 所总结的笔记以及自己一些的思考 这篇论文是一篇非常经典的论文 尤其对于想要了解分布式或者刚刚开始研究分布式的人来说 是一篇非常好的读物 它里面提到了许多分布
  • 使用python代码绘制一个会动的爱心

    你可以使用 matplotlib 库来绘制一个会动的爱心 下面是一个简单的代码示例 import matplotlib pyplot as plt import numpy asnp x np linspace np pi np pi 25
  • Apache Beam中的有状态计算

    Beam帮助我们处理流式 乱序 大规模的数据 并且提供了高度的抽象机制Pipeline 统一了流式和批量数据处理 从功能上流处理可以分为无状态 stateless 的和有状态 stateful 两种 在流处理的框架里引入状态管理大大提升了系
  • mysql怎么打开表ddl_MySQL数据表操作(DDL)

    一 创建数据表 语法 create table 表名称 字段 字段类型 约束 字段 字段类型 约束 表选项 约束 primary key not null auto increment等 表选项 数据表的属性 一般包括engine char
  • linux常用命令及解释大全(三)

    目录 前言 一 字符设置和文件格式转换 二 文件系统分析 三 初始化一个文件系统 四 备份 五 光盘 六 网络 总结 前言 本篇文章继续介绍了一部分linux常用命令 包括字符设置和文件格式转换 文件系统分析 初始化一个文件系统 备份 光盘

随机推荐

  • 模板类,模板类函数特例化,模板类特例化

    今天在看某c 框架源码时 发现模板类里的部分函数可以特例化 感觉很神奇便尝试了下 发现很多平时不会注意的c 细节及知识 写下来分享给大家 以便大家遇到相似问题时可以少踩点坑 模板类会出现链接问题 编译不通过 如果模板类 h文件和 cpp文件
  • matlab_一组数据元素随机排列

    如何生成一组数据元素随机排列 随机打乱顺序 产生新的排列 1 使用的matlab函数 randperm 1 语法格式 R randperm n 2 函数功能 将数字1 n进行随机排列 排列结果存储在行向量内 3 EX 输入 randperm
  • 网页端扫码通过公众号实现微信授权登录

    1 参考开发文档 https developers weixin qq com doc offiaccount OA Web Apps Wechat webpage authorization html 0 2 先调起微信授权页面 获取co
  • Java学习心得2——构造函数

    1 什么是构造函数 构造函数顾名思义 就是对象被构造的时候就会被调用的函数 例如当你new一个Cat对象的时候 Cat对象的构造函数就会被调用 public static void main String args Cat c new Ca
  • (如何读写文件)流-------输入流

    流 流是一组有序的数据序列 通过流来读写文件 流从方向分输入 输出流 流从单位份字节 字符流 字节输入流 InputStream 抽象父类 基类 常用方法 read 几个重载方法作用不同 int read 输入流一个字节一个字节的读 返回的
  • U3D中对象的自动销毁

    很多游戏中都会重用同一个游戏对象 比如说Dota 一波兵一波兵的被对方消灭 如果尸体不会自动销毁 恐怕地图中的尸体堆积如山不说 配置再厉害的电脑也架不住 这样游戏的性能太低了 需要自动销毁的情形有 游戏对象已经并且永远消失在视野中了 天空中
  • Java基础篇——集合

    活动地址 CSDN21天学习挑战赛 1 为什么使用集合 集合与数组类似 都是容器 我们为什么不用数组而还要使用集合呢 数组的特点 数组定义完成并启动后 类型确定 长度固定 不适合元素的个数和类型不确定的业务场景 更不适合做需要增删的操作 数
  • 如何在手机上运行c语言,各位前辈这两个程序怎么在手机上运行

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 made by ebhrz include include include include include include include global define int cfd 文件描述符
  • Python mailmerge库

    Python mailmerge库 本文使用环境 win10 python3 7 office2016 第0步 按装mailmerge pip install mailmerge 第1步 引用库 from mailmerge import
  • 测试用例设计(增量测试)

    增量测试 在执行模块测试过程中 我们主要有两点考虑 第一 如何设计一个有效的测试用例集 第二 将模块组装成工作程序的方式 第二点考虑很重要 因为它涉及模块测试用例编写的形式 可能用到的测试工具类型 模块编码和测试的顺序 生成测试用例的成本以
  • Markdown的十个常用标志符号

    Markdown 是一种轻量级的 标记语言 它的优点很多 目前也被越来越多的写作爱好者 撰稿者广泛使用 看到这里请不要被 标记 语言 所迷惑 Markdown 的语法十分简单 常用的标记符号也不超过十个 这种相对于更为复杂的HTML 标记语
  • Flutter开发之数据存储-2-文件存储(33)

    数据存储部分在移动开发中是非常重要的部分 无论是一些轻量级的数据 如用户信息 APP配置信息等 还是把需要长期存储的数据写入本地文件或者Sqlite3 都离不开数据存储 上一篇SharedPreferences的使用 今天就练习一下文件存储
  • python求平均数、方差、中位数

    CalStatistics py def getNum 获取用户不定长度的输入 nums iNumStr input 请输入数字 回车退出 while iNumStr nums append eval iNumStr iNumStr inp
  • java mysql差异导出_java 如何从零实现一个数据库差异对比工具?

    对比数据的痛苦 不知道你是否也像我一样 在快乐编写代码的时候 必须进行一些数据库的数据对比工作 诚然 一般的数据差异 比如是每一行的内容不同 市场上有比较成熟的 compare2 等对比工具 但是如果是对比数据的每一列是否相同 这个就会变得
  • 机器人教育和编程教育,家长纠结发问:该选哪一个?

    机器人教育和编程教育 家长纠结发问 该选哪一个 很多家长对于机器人教育和编程教育二者之间的关系都不太懂 究竟二者有何不同 学机器人和学编程有冲突吗 孩子要如何选择呢 我们来一一剖析 1机器人教育与编程教育的区别 涵盖范围不一 机器人教育 机
  • eclipse创建webapp 类型的maven项目

    Eclipse配置maven 配置maven的安装目录 打开Eclipse属性设置面板 Window gt Preferences gt Maven 展开Maven配置界面 选择Installations 如下图 add已经下载好的mave
  • 虚拟机配置之系统网络及防火墙配置

    1 查看网络IP和网关 一般不用修改 在此不作说明 2 配置网络IP地址 1 修改IP地址 root hadoop102 vim etc sysconfig network scripts ifcfg eth0 修改并添加为 3 配置主机名
  • C#中的数据库配置

    初用C 做项目的时候将数据库连接字符串放在注册表中 并且专门写一个窗体让用户能够修改 因为用户不可能自己到注册表中去设置 现在想来 其实没必要 在工程中添加新项 选择 应用程序配置文件 默认名是App config 里面的代码如下
  • PAT-1059 C语言竞赛

    1059 C语言竞赛 20 分 C 语言竞赛是浙江大学计算机学院主持的一个欢乐的竞赛 既然竞赛主旨是为了好玩 颁奖规则也就制定得很滑稽 0 冠军将赢得一份 神秘大奖 比如很巨大的一本学生研究论文集 1 排名为素数的学生将赢得最好的奖品 小黄
  • ECCV22 最新论文汇总(目标检测、图像分割、监督学习、GAN等)

    强烈感谢极市平台提供的论文资源 ECCV 2022 已经放榜 共有1629篇论文中选 录用率还不到20 为了让大家更快地获取和学习到计算机视觉前沿技术 作者对ECCV2022最新论文进行追踪 包括分研究方向的论文及代码汇总 本次更新的 EC