如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用

2023-12-09

我已经在以 coco 格式标记和导出的自定义数据上训练了 detectorron2 模型，但现在我想应用增强并使用增强数据进行训练。如果我不使用自定义 DataLoader，而是使用 register_coco_instances 函数，我该如何做到这一点。

cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml"))
cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.5 
cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")
predictor = DefaultPredictor(cfg)
outputs = predictor(im)

train_annotations_path = "./data/cvat-corn-train-coco-1.0/annotations/instances_default.json"
train_images_path = "./data/cvat-corn-train-coco-1.0/images"
validation_annotations_path = "./data/cvat-corn-validation-coco-1.0/annotations/instances_default.json"
validation_images_path = "./data/cvat-corn-validation-coco-1.0/images"

register_coco_instances(
    "train-corn",
    {},
    train_annotations_path,
    train_images_path
)
register_coco_instances(
    "validation-corn",
    {},
    validation_annotations_path,
    validation_images_path
)
metadata_train = MetadataCatalog.get("train-corn")
dataset_dicts = DatasetCatalog.get("train-corn")

cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml"))
cfg.DATASETS.TRAIN = ("train-corn",)
cfg.DATASETS.TEST = ("validation-corn",)
cfg.DATALOADER.NUM_WORKERS = 2
cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")  # Let training initialize from model zoo
cfg.SOLVER.IMS_PER_BATCH = 2
cfg.SOLVER.BASE_LR = 0.00025
cfg.SOLVER.MAX_ITER = 10000
cfg.SOLVER.STEPS = []
cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 128 
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 4
os.makedirs(cfg.OUTPUT_DIR, exist_ok=True)
trainer = DefaultTrainer(cfg) 
trainer.resume_or_load(resume=False)
trainer.train()

我在文档中看到您可以加载数据集并应用增强，如下所示：

dataloader = build_detection_train_loader(cfg,
   mapper=DatasetMapper(cfg, is_train=True, augmentations=[
      T.Resize((800, 800))
   ]))

但我没有使用自定义数据加载器，执行此操作的最佳方法是什么？

根据我的经验，如何注册数据集（即告诉 Detectron2 如何获取名为"my_dataset"）与训练期间使用什么数据加载器（即如何从注册数据集中加载信息并将其处理为模型所需的格式）无关。

因此，您可以根据需要注册数据集 - 可以使用register_coco_instances函数或使用数据集 API (DatasetCatalog, MetadataCatalog）直接地;没关系。重要的是您想要在数据加载部分应用一些转换。

基本上，您想要自定义数据加载部分，这只能通过使用自定义数据加载器来实现（除非您执行离线增强，这可能不是您想要的）。

现在，您不需要直接在顶级代码中定义和使用自定义数据加载器。您可以创建自己的训练器，派生自DefaultTrainer，并覆盖它的build_train_loader方法。这很简单，如下所示。

class MyTrainer(DefaultTrainer):

    @classmethod
    def build_train_loader(cls, cfg):
        mapper = DatasetMapper(cfg, is_train=True, augmentations=[T.Resize((800, 800))])
        return build_detection_train_loader(cfg, mapper=mapper)

那么，在您的顶级代码中，唯一需要的更改就是使用MyTrainer代替DefaultTrainer.

trainer = MyTrainer(cfg) 
trainer.resume_or_load(resume=False)
trainer.train()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用的相关文章

翠儿。让流永远运行

我对 tweepy python 库比较陌生我想确保我的流 python 脚本始终在远程服务器上运行因此如果有人能够分享如何实现这一目标的最佳实践那就太好了现在我正在这样做 if name main while True try
从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

有时我想生成一个子进程其优化标志与启动父进程时使用的优化标志相同我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息经过一番深
为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
即使使用 .loc[row_indexer,col_indexer] = value 时也会设置 WithCopyWarning

这是我的代码中得到的行之一SettingWithCopyWarning value1 Total Population value1 Total Population replace to replace value 4 然后我将其更改为
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
Python BeautifulSoup XML 解析

我编写了一个简单的脚本来使用 BeautifulSoup 模块解析 XML 聊天日志标准 soup prettify 工作正常只是聊天日志中有很多绒毛您可以在下面看到我正在使用的脚本代码和一些 XML 输入文件 Code import
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
创建一个类似于 Tkinter 的表

我希望创建类似于 Tkinter 中的表格的东西但它不一定是这样的例如我想创建标题 Name1 Name2 Value 并在每个标题下面有几个空白行然后我希望稍后用我计算的值或名称的字符串值填充这些行因此是标签对于 Name2
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
Matplotlib Scatter - ValueError：RGBA 序列的长度应为 3 或 4

我正在尝试为我的功能绘制图表但不断收到此错误 ValueError RGBA sequence should have length 3 or 4 每当我只有 6 种形状时代码就可以完美运行但现在我将其增加到 10 种它就不起作用了
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

如何摆脱 pygame 表面？

在下面的代码中不仅有one在任何给定时间点屏幕上出现圆圈我想修复这个问题使其看起来只有一个圆圈而不是在鼠标光标所在的地方留下污迹 import pygame sys from pygame locals import pygame
HTML 数字输入最小值和最大值无法正常工作

I have type number输入字段和我已经设置min and max它的值
JSON 格式在附加文件时添加 \ 字符，但不添加到输出中的字符串

我正在使用以下函数来获取json来自 flickrAPI 它返回的字符串是格式正确的 JSON 块 def get photo data photo id para para photo id photo id para method fl
Tensorflow - 推理时间评估

我正在使用 Tensorflow 评估不同的图像分类模型特别是使用不同设备的推理时间我想知道是否必须使用预训练模型我使用一个脚本生成 1000 个随机输入图像将它们一一输入到网络并计算平均推理时间谢谢让我首先发出警告大多数人
在c#中一段时间内非阻塞等待/延迟的最佳实现是什么

目前我需要在Windows Store应用程序项目中实现一个简单的非阻塞延迟功能该函数不应该执行任何操作只是在特定时间段内空闲而不阻塞 UI 我的问题是如何正确实现这样的功能我知道这是一个老问题但在网上搜索后我真的没有任何线索最
Predict.svm 中的错误：测试数据与模型不匹配

我有一个大约 500 行和 170 列的数据框我正在尝试使用 e1071 包中的 svm 运行分类模型分类变量称为 SEGMENT 是一个有 6 个级别的因子变量数据框中还有其他三个因子变量其余都是数字 data lt my dat
从 Google 通讯录中删除重复或重复的联系人

我的目标是制作一个包含客户联系信息地址和注释的电子表格创建新的 Google 通讯录条目并将联系人 ID 和已添加标记到表格中该表格将已输入到 Google 通讯录的联系人标记为已添加这张表我成功地做到了一切正常问题只
即时搜索 PB 级数据

我需要在 CSV 格式文件中搜索 PB 级的数据使用LUCENE建立索引后索引文件的大小是原始文件的两倍是否可以减小索引文件的大小如何在HADOOP中分发LUCENE索引文件以及如何在搜索环境中使用或者是否有必要我应该使用s
如何在 pytorch 中更改输入图片的尺寸？

我制作了一个卷积神经网络我希望它获取输入图片和输出图片但是当我将图片转换为张量时它们的尺寸错误 RuntimeError Expected 4 dimensional input for 4 dimensional weight 20
Jenkins 无法识别生成的 allure 报告 xml 文件的正确目录

我已成功将 Allure 报告集成到我的基于 Maven 的 testNG 项目中并且能够使用 jetty 服务器查看该报告但现在我正在尝试按照此处建议的说明将魅力报告与詹金斯集成 http wiki qatools ru displa
如何处理不在 UINavigationController 堆栈顶部的 UIViewController 的旋转？

我在 UINavigationController 中有一个根 UIViewController VC1 它通过在 willRotateToInterfaceOrientation 方法中手动调整其视图子视图框架来处理旋转如果根 UIV
加密/解密字节数组 Crypto++

我正在尝试使用 AES 加密字节数组我已经能够毫无问题地加密字符串和文件但是字节数组似乎不适合我我传入一个要加密的字节数组为了便于测试我只传入由 crypto bArrayToEncrypt 生成的 AES 密钥加密似乎有效但
systemd 服务未使用 dbus 接口启动

我正在尝试启动 systemd 服务 usnig dbus 服务我正在关注下面提到的链接的示例 5 http www freedesktop org software systemd man systemd service html 我的
在 Lua 中按值对表进行关联排序

我有一个 key gt value 表我想在 Lua 中排序键都是整数但不连续并且有意义 Lua唯一的排序函数似乎是table sort 它将表视为简单数组丢弃原始键及其与特定项目的关联相反我本质上希望能够使用PHP s as
GCP Firestore Python 凭证

我在将数据从 Linux 虚拟机发送到 GCP 的 Firestore 时遇到问题我只是想更新数据库内的项目我遇到有关凭据的问题根据我使用的方法我会得到不同的错误但我相信它们都源于同一问题请注意我有一个带有 json 凭据的服
为什么 T* 可以在寄存器中传递，但 unique_ptr 却不能？

我正在观看 Chandler Carruth 在 CppCon 2019 上的演讲不存在零成本抽象在其中他举了一个例子说明他对使用std unique ptr
为此使用什么正则表达式

我正在编写一个正则表达式它将找到 1个或多个点后面跟一个空格或者后面根本不跟任何东西 1 个或多个问号再次后面跟一个空格或者后面根本不跟任何东西我该如何编写这个正则表达式以便让它执行此或操作你只需要逃避 or with a 从字
Rails 3 关联错误

我有一个表格页面和一个表格作者每一页都属于一位作者还为表和模型创建了迁移但在表单中使用它时出现此错误 NoMethodError in Pages new Showing C rorapp app views pages form h
不活动和活动、应用程序空闲、用户不活动自动注销

经过大量谷歌搜索并花费了 4 个小时后我想这是查找用户不活动和锁定屏幕的最佳方法 public MainWindow InitializeComponent var timer new DispatcherTimer Interval T
如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用

我已经在以 coco 格式标记和导出的自定义数据上训练了 detectorron2 模型但现在我想应用增强并使用增强数据进行训练如果我不使用自定义 DataLoader 而是使用 register coco instances 函数我

如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用

如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用 的相关文章

随机推荐

热门标签

如何将 detectorron2 的增强功能与使用 register_coco_instances 加载的数据集结合使用的相关文章