Detectron2入门教程

设定目标：
- 刚刚从TF转向PyTorch，所以希望进一步熟悉PyTorch。
- 进一步熟悉目标检测、实例分割、关键点检测等模型。
- 寻找/研究源码中存在的一些tricks。
- 后续需要通过detectron2来复现新论文。
总结自己之前的一些步骤
- 第一步：阅读所有官方文档。
- 第二步：尝试根据 Getting Started 文档内容，运行 demo 中的脚本。
- 第三步：从数据处理、模型构建、模型训练/预测/评估三个方面，分别浏览源码。
个人感受：
- PyTorch代码比TensorFlow代码容易多了。
- Detectron2源码比TensorFlow Object Detection API源码直观多了，上手容易多了。

1.2. 目录结构

configs：示例配置文件合集。
datasets：数据集准备工作，主要就是各个数据集的基本结构，以及需要如何预处理。
demo：快速体验Detectron2，与Getting Started文档对应。如果想要体验Model ZOO中结果的内容就可以用这个。
detectron2：项目主要代码都在这里了。
dev：一些开发者会用到的脚本。
docker：没啥好介绍的。
docs：一些官方文档。
projects：基于Detectron2的三个项目，DensePose/TensorMask/TridentNet。
- Detectron2的开发人员介绍，如果想要利用detectron2直接复现所有论文可能比较困难（我的理解就是直接修改detectron2中的代码），一种比较好的方式就是将detectron2作为一个包来调用来构建新的模型。
tests：单元测试类。
tools：常用脚本，如训练、benchmark、展示数据集等。

1.3. 搭积木过程

Detectron2 的基本思路就是利用配置文件搭积木。
- 第一步，将模型拆分为多个模块，每个模块可以叫做一个类型的积木。
- 第二步，构建配置文件。
- 第三步，通过配置文件，选择对应的积木。
配置文件概述
- 有一个默认配置文件，即 detectron2/config/default.py 文件。
- 示例配置文件放在 configs 文件夹中，且使用yaml形式。
- 所有示例配置文件都是建立在默认配置文件基础上的，即所有示例配置文件中的配置其实都是不全的，缺失的配置需要到默认配置文件中寻找。
  - detectron2 的配置文件比 mmdetection 看起来简洁很多。
  - 有得必有失，虽然简洁，但在看源码的时候经常需要查看默认配置文件，也不是特别方便。
- 示例配置文件中有一个_BASE_属性，可以将其他示例配置文件作为基础，如果有冲突则用当前配置文件的信息覆盖。
如何使用配置文件搭积木
- 模型搭建的Registry机制
  - 调用了 fvcore.common.registry.Registry，该对象的作用是保存一个字典，key为方法/类的名称，value为方法/类，利用 @registry_object.register 修饰目标方法/类，这样可以在导入detectron2的同时将 key/value 保存起来。
  - 对于每一个类型的积木（如backbone, anchor generator, proposal generator, roi head等）都对应一个Registry对象。更多类型可以看 detectron2/modeling/__init__.py 文件。
  - 一般，一个Registry对应一个build.py，主要就是从Registry中通过名称获取方法/类，然后将示例配置文件中参数导入目标方法/类中。
- 数据集的Registry机制
  - 主要使用了 detectron2/data/catalog.py 中的 MetadataCatalog 与 DatasetCatalog，前者保存了数据集的元数据，后者保留了一个方法，该方法用于获取数据集 list(dict)。
  - 使用了Registry机制，但不是通过注解实现的，而是在 detectron2/data/datasets/buildin.py 中调用了 register_all_coco() 等四个方法，这些方法调用了 MetadataCatalog 和 DatasetCatalog的注册方法。
  - 一般建数据集会调用 build_detection_train_loader 方法，该方法会调用DatasetCatalog中的方法，获取 list(dict)。
- 模型训练/预测/评估的的搭积木不复杂，就是根据配置文件，直接创建对应的对象（如lr, optimizer等）。

1.4. 官方文档阅读

官方文档地址，如果想了解Detectron2的源码，强烈建议先看看。
tutorials
- Installation：安装，没啥好说的。
- Getting Started with Detectron2：跑个Demo，没啥好说的。
- Extend Detectron2's Defaults
  - 谈了谈Detectron2的基本设计思路。一方面要有足够的灵活性（做研究总是要做新东西），一方面要有较好的高层抽象。
  - 基本设计思路：所有的方法和类都可以从一个配置文件中获取所需要的参数（配置文件中没有的，就使用默认参数）。
  - 介绍了扩展detectron2的一些相关文档。
- Use Custom Datasets
  - dataset只是解析数据集，而没有进行数据处理（数据处理在后面dataloader中进行）。
  - dataset的输出将会作为后续dataloader的输入。
  - 自定义数据集步骤：
    - 注册数据集，需要制定数据集名称以及一个 get_dict 方法，该方法用于获取一个 list[dict] 对象，每个字典就是一条输入数据，具体的key列表可以到文档中自己看。
    - 可以注册一些自定义 metadata。
  - 数据集的metadata介绍
    - 一个记录数据库相关信息的字典，比如primitive information that helps interpret what's in the dataset, e.g., names of classes, colors of classes, root of files, etc.
    - 可以通过 MetadataCatalog.get(dataset_name).set(name, value) 为新数据库添加元数据。
- Use Custom Dataloaders
  - 介绍数据处理模块，其实就是一系列数据增强等操作，以上述dataset的结果作为输入，并作为后续Model的输入。
  - 具体过程如下：
    - 首先，根据数据集名称获取一个已经注册的数据集（就是上面的dataset），获取 list[dict] 对象。
    - 其次，数据增强等其他数据处理流程都内置于 DatasetMapeer 中。
    - 最后，需要batch数据，batch后的数据一般就作为 model.forward() 的输入。
  - 介绍如何自定义Dataloader、使用自定义Dataloader可以参考DensePose的代码。
- Use Models
  - 主要介绍如何构建模型。
  - 构建模型方式：通过调用 build_model, build_backbone，build_roi_heads 等方法来构建。
  - 要导入权重可以使用 DetectionCheckpointer(model).load(file_path)。
  - 使用模型就是 outputs = model(inputs)
  - 模型输入使用的参数通过 list[dict] 来实现，即上面dataloader的输出，具体的key形式可以参考这个页面中的内容。
  - 模型输出也是一个 list[dict]，具体的形式可以参考这篇文章中的内容。
- Write Models
  - 自定义模型相关。
  - 举了个例子如果自定义backbone该怎么做。
- Training
  - 就提了下训练相关的代码。
  - 一般使用 tools/plain_train_net.py 来训练模型。
  - 最简单的训练结构是 SimpleTrainer().train()。
  - 一般使用的类是 DefaultTrainer().train()。
- Use Configs
  - 介绍了配置系统的基本结构，即使用yaml和yacs来配置。
  - 配置文件的使用，其实就是对 CfgNode 对象的使用。
  - 建议使用配置文件的方式，我比较在意的是使用_BASE_参数来重复配置定义到一个文件中。
notes
- Benchmarks
  - 记录一下训练时间，与其他库也比较比较。
- Compatibility with Other Libraries
  - 与其他目标检测库的Compatibility。
- Contributing to detectron2
- Change Log
API Documentation

2. 数据处理

2.1. 概述

实现的功能：
- 解析COCO、cityscapes等数据集。
- 提供数据预处理以及增强的接口。
- 通过配置文件即可实现数据集解析、预处理、增强等操作。
主要入口： detectron2/data/build.py 中的 build_detection_train_loader或build_detection_test_loader 方法。
相关代码：主要位于 detectron2/detectron2/data 目录下。
相关配置：detectron2/config/defaults.py 中 _C.INPUT _C.DATASETS _C.DATALOADER 开头的配置。

2.2. 基本流程

第一步：在导入 detectron2 模块时，通过Register机制注册一些常用的数据集。
- 注册机制可以参考 1.3. 中的内容。
- 注册代码在 detectron2/detectron2/data/datasets/builtin.py。
第二步：通过数据集名称以及完成注册的 DatasetCatalog 对象以及 MetadataCatalog 对象，解析数据集并获取数据集基本信息。
- 从源码角度看，就是调用了 DatasetCatalog 中的对应的方法，获取 list[dict] 对象。
第三步：通过mapper函数，对解析完的数据集进行进一步处理，包括数据增强，并将修改数据的结构，使之可以直接作为后续模型的输入。
- 从源码角度理解就是，从 DatasetCatalog 获取的是 list[dict]，mapper函数输出的也是 list[dict]，但前后两个字典的形式是不一样的，具体可以参考官方文档，里面都有具体的描述。

2.3. build_detection_train_loader 方法解析

源码位于 detectron2/detectron2/data/build.py 中。
流程：
- 第一步：获取 list[dict] 对象。先根据数据库名称调用 DatasetCatalog 中的方法，获取原始 list[dict] 对象，再通过一些条件进行筛选。
- 第二步：构建 DatasetFromList 对象，该类是 torch.utils.data.Dataset 的子类。
- 第三步：根据mapper对上面的dataset对象进行进一步处理。
  - 浏览了下 DatasetMapper的源码，主要工作包括读取图像、resize、crop、flip、转换数据与标签的形式等。
- 第四步：构建 torch.utils.data.sampler.Sampler 对象，实现的功能好像包括Repeat Sample、shuffle、batch功能。
- 第五步：根据上面的 dataset, sampler 等对象构建 torch.utils.data.DataLoader 对象。
感想：
- 好像也没有什么特别的数据增强工作。
- Detectron2实现的 DatasetFromList、MapDataset等，有点 tf.data 的感觉，挺有意思。

2.4. 其他

数据增强
- 方法主要都在 detectron2/detectron2/data/transforms/transform_gen.py 中定义。
- 调用的话主要是通过 from detectron2.data import transforms as T 以及 T.ResizeShortestEdge 来实现。
- 在默认实现中，就没用到什么特别的数据增强。具体的可以到 DatasetMapper 的源码中看。

3. 模型搭建

3.1. 概述

实现的功能：通过配置文件构建模型。
主要入口：detectron2/detectron2/modeling/meta_arch/build.py 中的 def build_model(cfg) 方法。
相关代码：detectron2/detectron2/modeling 目录下。
相关配置：detectron2/config/defaults.py中_C.MODEL 开头的配置。

3.2. 基本流程

第一步：根据注册机制，在导入 detectron2 时，将各个类型的积木通过注解的方式保存到 Registry 对象中。
第二步：根据配置文件中 META_ARCHITECTURE 参数，选择基本框架，也就是 meta arch。
- 基本框架(meta arch)的类型没集中，包括 rcnn, retinanet, semantic seg, panoptic 四种。
- 每个基本框架(meta arch)中都定义了一系列子部件，也都是用Register机制来管理（即通过配置文件与Register对象来构建）。
- 基本框架的定义中，就包含了模型如何构建、如何训练、如何预测等相关功能。
第三步：通过配置文件分别构建选中meta arch中各个部件。

3.3. 其他

Registry对象列表
- ANCHOR_GENERATOR_REGISTRY：如何生成anchors。
- BACKBONE_REGISTRY：主干网络，包括FPN。
- META_ARCH_REGISTRY：基本网络，总体结构。
- SEM_SEG_HEADS_REGISTRY：应该是用来做语义分隔的。
- PROPOSAL_GENERATOR_REGISTRY：Faster RCNN中的Region proposal Network，即如何生成proposals。
- RPN_HEAD_REGISTRY：第一阶段训练所需的输入。
- ROI_BOX_HEAD_REGISTRY：ROI Head中的bbox分支。
- ROI_HEADS_REGISTRY：通过特征图和第一阶段的proposals得到ROI。
- ROI_KEYPOINT_HEAD_REGISTRY：ROI Head中的keypoint分支。
- ROI_MASK_HEAD_REGISTRY：ROI Head中的mask分支。
除了通过注册机制管理的部件外，还有一系列模型所需的部件，具体的可以参考 meta_arch 中的相关源码。

4. 训练/评估/预测

4.1. 概述

实现的功能：通过配置文件构建模型。
主要入口：detectron2/detectron2/engine/defaults.py 中的 DefaultTrainer, DefaultPredictor。
相关代码：主要在 detectron2/detectron2/engine 和 detectron2/detectron2/solver 中
相关配置：detectron2/config/defaults.py中_C.SOLVER _C.TEST 开头的配置。

4.2. 训练代码结构

主要包括了：TrainerBase, SimpleTrainer, DefaultTrainer 三个类。
TrainerBase：
- 定义在 detectron2/detectron2/engine/train_loop.py 中。
- 主要功能：
  - 提供了 hooks 机制，可以通过导入 HookBase 对象，在训练过程的各个时间点进行自定义处理。
  - 定义了训练函数为 train(self, start_iter: int, max_iter: int)，且维训练提供了一个 EventStorage 对象。
- 这个与TF中的SessionRunHook类似，只不过TF已经实现在源码里，而Detectron2中是自己实现的。
SimpleTrainer：
- 定义在 detectron2/detectron2/engine/train_loop.py 中。
- 主要功能：在 TrainerBase 的基础上添加了训练所需的基本参数以及最基本的训练过程代码。
- 基本训练参数指的是 model/data_loader/optimizer
- 基本训练过程包括位于 run_step 函数中，主要包括的功能是：
  - 导入数据。
  - 计算损失函数（并确保损失函数是有效的）。
  - 记录一些性能指标（包括损失函数、时间点），保存到 EventStorage 对象中。
  - 进行梯度下降操作。
DefaultTrainer
- 定义在 detectron2/detectron2/engine/defaults.py 中。
- 主要功能：
  - 在 SimpleTrainer 的基础上，提供了通过配置文件创建模型、数据集、优化器、学习率等一系列操作。
  - 提供了 checkpoint 功能。
  - 使用了一系列常见的 hooks。
- hooks的定义都在 detectron2/detectron2/engine/hooks.py 中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

detectron2

计算机视觉

深度学习

机器学习

Detectron2入门教程的相关文章

ChatGPT 速通手册——GPT 训练数据集介绍

GPT 训练数据集介绍所有人工智能算法都会分为训练和推理两步算法的效果好坏很大程度上取决于训练数据本身的质量 ChatGPT 所用的训练数据 openai 公司没有单独公布过细节不过考虑到 ChatGPT 是在前序 GPT 算法基础
linux使用记录（一）

1 tar 解压tar xvf file tar 解压 tar包 tar xzvf file tar gz 解压tar gz tar xjvf file tar bz2 解压 tar bz2 tar xZvf file tar Z 解压ta
使用ADO.NET访问数据库

一 ADO NET 数据库访问的方法和技术二 ADO NEt的重要组件 1 DataSet 独立于数据源的数据访问 2 Net framework数据提供程序用于连接到数据库执行命令和检索结果三 NET数据提供程序的四个核心对象 1
无向图——邻接表和邻接矩阵的实现

邻接矩阵 include

随机推荐

封装七牛云存储工具类

文章目录封装七牛云存储工具类为啥选择七牛云当然是因为它能免费使用喽白嫖怪哈哈哈图片存储方案 Java SDK操作七牛云封装工具类封装七牛云存储工具类为啥选择七牛云当然是因为它能免费使用喽白嫖怪哈哈哈图片存储方案在实际
UnityShader——Compute Shader

Compute Shader是基于DX11 SM4 5 的在GPU上运行的程序通过Compute Shader我们可以将大量可以并行的计算放到GPU中计算从而节省CPU资源 Unity 5 6版本提供的 Graphics DrawMesh
U盘数据丢失是什么原因？轻松让U盘数据恢复的教程

在数字化时代我们不可避免地使用各种便携式存储设备如U盘来传输和存储重要数据然而有时我们可能不小心删除了U盘中的文件或者格式化了U盘等等而导致数据丢失这种情况下你可能会困惑地想知道是否有简单的方式可以快速而轻松地恢复U盘中丢
解决报错：You don‘t have enough free space in /var/cache/apt/archives/.

apt安装package时遇到问题 You don t have enough free space in var cache apt archives 问题 var 目录下空间不足 apt下载时没有地方存放缓存文件解决方法删除部分日志
Java中解决CAS机制出现的ABA问题

Java中解决CAS机制出现的ABA问题学习目标 Java中解决CAS机制出现的ABA问题 1 先了解一下什么是CAS 2 CAS的底层原理 3 CAS的问题 4 怎么解决ABA问题 1 先了解一下什么是CAS 一句话总结就是比较并交换
分库分表需要考虑的问题及方案

转自 http www jianshu com p 32b3e91aa22c from timeline 分库分表需要考虑的问题及方案作者 jackcooper 2017 02 08 16 08 字数 5042 阅读 5240 评论 3
【手写一个RPC框架】simpleRPC-06

目录前言实现 zookeeper安装与使用项目创建依赖配置 register client service server common codec 文件结构运行本项目所有代码可见 https github com weiyu z
Lock锁和Condition条件

Lock的特性 Lock不是Java语言内置的 synchronized是在JVM层面上实现的如果代码执行出现异常 JVM会自动释放锁但是Lock不行要保证锁一定会被释放就必须将unLock放到finally 中手动释放在资源竞
OSPF协议

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档 HCIA第四天前言一 OSPF协议二 LAS优化特殊区域 1 解决OSPF的不规则区域三扩展配置前言一 OSPF协议 OSPF 开放式最短路径优先协议无类别
spring boot 将对象转换为json返回

Spring Boot默认使用Jackson将对象转换为json 需要配置以下依赖 compile group com fasterxml jackson core name jackson core version 2 9 4 compi
matlab实现kmeans聚类算法

kmeans聚类算法是一种简单实用的聚类算法 matlab自带函数kmeans可直接对数据进行kmeans聚类为了方便更好地掌握kmeans聚类算法今天我们自己来实现一个弱化的版本mykmeans mykmeans输入包含三项分别为聚
【数据结构】图-图的遍历_广度优先遍历（动态图解、c++、java）

文章目录一概述二广度优先搜索图解 BFS树代码邻接矩阵实现邻接表实现链式前向星实现三完整代码邻接矩阵版邻接表版链式前向星版四总结算法复杂度分析基于邻接矩阵的 BFS 算法基于邻接表的 BFS 算法注意
【Mac】一些软件的图片和视频位置 QQ 微信

1 QQ 在finder的菜单项中前往文件夹输入 Library Containers com tencent qq Data Library Caches Videos QQ还是比较流氓的其中光images下的文件就有5G 他会把
【日常笔记】linux系统docker的操作安装启动卸载

安装linux系统阿里云镜像下载centos7 选择dvd iso镜像找到 docker ce 也就是社区免费版本下载以上都有官方文档说明就不再写出来了配置阿里云镜像加速器全部安装完毕后找到阿里云 gt 容器镜像服务 gt 镜像
使用nginx部署vue项目后,刷新会找不到页面解决解决方法

当使用Nginx部署Vue项目时刷新页面可能导致无法找到页面的问题这是由于Vue Router使用了前端路由的方式导致的要解决这个问题你可以进行以下配置 1 在Nginx配置文件中添加一个位置 Location 块来处理所有的URL
STL-常用算法(二.拷贝替换算术集合)

开篇先附上STL 常用算法一的链接 STL 常用算法一遍历查找排序小梁今天敲代码了吗的博客 CSDN博客目录常用拷贝和替换算法 copy函数示例将v1容器中的元素复制给v2 replace函数示例将容器中的20 替换成
[carla] carla-ros-bridge 修改信号灯行为。

本教程适用于采用编译下载安装方式安装carla ros bridge 的用户 1 修改信号灯 1 1 修改原理我们要通过API过滤出所有绿灯的actor信息然后修改他们的状态为常绿查阅API网站可知traffic light具有set
java获取两个字符串日期之间间隔的天数

java获取两个字符串日期之间间隔的天数 import java text ParseException import java text SimpleDateFormat import java util ArrayList
spyder 如何执行需要命令行参数的脚本

spyder 如何执行需要命令行参数的脚本 run CTA py splash image C Users XXX Desktop A3 jpg weights D KerasProject MaskRCNN mask rcnn ballo
Detectron2入门教程

参考 Detectron2入门教程云社区腾讯云目录 1 概述 1 1 自己的源码阅读流程 1 2 目录结构 1 3 搭积木过程 1 4 官方文档阅读 2 数据处理 2 1 概述 2 2 基本流程 2 3 build detectio

Detectron2入门教程

1. 概述

1.1. 自己的源码阅读流程

1.2. 目录结构

1.3. 搭积木过程

1.4. 官方文档阅读

2. 数据处理

2.1. 概述

2.2. 基本流程

2.3. build_detection_train_loader 方法解析

2.4. 其他

3. 模型搭建

3.1. 概述

3.2. 基本流程

3.3. 其他

4. 训练/评估/预测

4.1. 概述

4.2. 训练代码结构

Detectron2入门教程 的相关文章

随机推荐

热门标签

Detectron2入门教程的相关文章