Albumentation

2023-05-16

文章目录

Albumentation
- Classification
- Segmentation
- Detection
- KeyPoints Augmentation

Albumentation

所有实现的变换。

变换以及支持的类型。此处

Classification

创建图片扩展流程

使用 Compose 类定义数据增强的流程。Compose 类接受一个包含所有图片变换的列表。

transform = A.Compose([
    A.RandomCrop(width=256, height=256),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
])

读取图片

Albumentation 采用 RGB 格式

传入图片，获取变换后图片

# 返回是字典
transformed_image = transform(image=image)["image"]

Segmentation

需要同时变换图片和 Mask 。1，2 两布同 Classification 相同，第三步

传入图片和 Mask

transformed = transform(image=image， mask=mask)
transformed_image = transformed['image']
transformed_mask = transformed['mask']

如果传入多个 Mask，采用 transform(image=image， masks=masks，masks 是 mask 组成的列表。

Detection

四种 bbox 格式：

pascal_voc：[x_min, y_min, x_max, y_max]
albumentations：Normalized [x_min, y_min, x_max, y_max]
coco：[x_min, y_min, width, height]
yolo ：Normalized [x_center, y_center, width, height]

具体流程：

Augmentaion Pipeline

transform = A.Compose([
    A.RandomCrop(width=450, height=450),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
], bbox_params=A.BboxParams(format='coco', min_area=1024, min_visibility=0.1, label_fields=['class_labels']))

min_area is a value in pixels. If the area of a bounding box after augmentation becomes smaller than min_area, Albumentations will drop that box.

min_visibility is a value between 0 and 1. If the ratio of the bounding box area after augmentation to the area of the bounding box before augmentation becomes smaller than min_visibility, Albumentations will drop that box.

在这里插入图片描述
label_fields 确定哪些传入参数作为 bbox 的类别。

Pass Image and labels

下面这个例子中，每个 bbox 有两个类（class_labels，class_categories）。

transform = A.Compose([
    A.RandomCrop(width=450, height=450),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
], bbox_params=A.BboxParams(format='coco', label_fields=['class_labels', 'class_categories'])))

class_labels = ['cat', 'dog', 'parrot']
class_categories = ['animal', 'animal', 'item']

transformed = transform(image=image, bboxes=bboxes, class_labels=class_labels, class_categories=class_categories) # 传入参数由 `Compose` 中 `label_fields` 决定
transformed_image = transformed['image']
transformed_bboxes = transformed['bboxes']
transformed_class_labels = transformed['class_labels']
transformed_class_categories = transformed['class_categories']

KeyPoints Augmentation

支持的关键点格式，此处

Augmentation Pipeline

transform = A.Compose([
    A.RandomCrop(width=330, height=330),
    A.RandomBrightnessContrast(p=0.2),
], keypoint_params=A.KeypointParams(format='xy', label_fields=['class_labels'], remove_invisible=True, angle_in_degrees=True))

label_fields：In some computer vision tasks, keypoints have not only coordinates but associated labels as well. (different kinds of keypoints)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Albumentation

Albumentation 的相关文章

Linux 网络编程——UDP编程

一概述 UDP 是 User Datagram Protocol 的简称 xff0c 中文名是用户数据报协议 xff0c 是一个简单的面向数据报的运输层协议 xff0c 在网络中用于处理数据包 xff0c 是一种无连接的协议 UDP 不提
给指定的寄存器地址：0x0001eea7 ,赋值

coretexM0平台上给指定的寄存器地址 xff1a 0x0001eea7 赋值100 怎么实现 xff1f xff08 volatile char xff09 0x0001eea7 61 100 xff1b 常见错误1 xff1a xf
常见cmake命令总结

常见cmake命令总结 cmake常见命令 cmake minimum required 指定CMake的最小版本要求 cmake minimum required VERSION 2 8 project 定义工程名称 project PR
利用Qt Phonon框架制作音视频播放器

Phonon严格来说其实非为Qt的library xff0c Phonon原本就是KDE 4的开放源代码多媒体API xff0c 後来与Qt合并与开发 xff0c 所以简单来说就是Qt使用Phonon这个多媒体框架来提供一般影音多媒体档案的
主设备号和次设备号

Linux的设备管理是和文件系统紧密结合的 xff0c 各种设备都以文件的形式存放在 dev目录下 xff0c 称为设备文件应用程序可以打开关闭和读写这些设备文件 xff0c 完成对设备的操作 xff0c 就像操作普通的数据文件一样为
Makefile中的wildcard用法

在Makefile规则中 xff0c 通配符会被自动展开但在变量的定义和函数引用时 xff0c 通配符将失效这种情况下如果需要通配符有效 xff0c 就需要使用函数 wildcard xff0c 它的用法是 xff1a wildcard
GPIO

一什么是GPIO xff1f 首先应该理解什么是GPIO GPIO xff0c 英文全称为General Purpose IO ports xff0c 也就是通用IO口在嵌入式系统中常常有数量众多 xff0c 但是结构却比较简单的外部设
UART

一 S3C2410内置的UART控制器 S3C2410内部具有3个独立的UART控制器 xff0c 每个控制器都可以工作在Interrupt xff08 中断 xff09 模式或DMA xff08 直接内存访问 xff09 模式 xff0c
vivi源代码最为详细分析(二)

现在进入bootloader之vivi分析的第二阶段 xff0c 这部分使用C语言实现 xff0c 部分代码采取内嵌汇编的方式这里需要用到GNU GCC内嵌汇编的知识 xff0c 这部分基础还没有具备 xff0c 需要学习下面先按照流
vivi源代码最为详细分析(三)

step 5 xff1a MTD设备初始化关于什么是MTD xff0c 为什么要使用MTD xff0c MTD技术的架构是什么 xff0c 等等 xff0c 可以参考 Linux MTD源代码分析 xff08 作者 xff1a Jim Z
【笔记】docker-compose.yml 文件更改后重新启动加载更改后的内容

docker compose yml 文件更改后想使之立刻生效 xff0c 但是不想手动删除已经建立的 container 等信息可以运行下面命令重新创建容器实现修改 docker compose up force recreate d
bootloader开发阶段总结以及可能会碰到的问题

到今天 xff0c vivi源代码基本分析完毕对bootloader有了更深层的认识在此期间 xff0c 仔细阅读了毛德操胡希明先生编著的嵌入式系统采用公开源代码和StrongARM XScale处理器第七章 xff1a 嵌入式
用模式一实现用户登录功能

login jsp为显示登录表单和处理登录请求的页面 xff0c 登录成功后跳转到logonSuccess jsp页面 xff0c 登录失败时重新显示登录表单和失败的帮助信息 xff0c 以便用户重新登录 xff1b 如果已登录用户再次访问
UDP通信（C语言实现）

直接看代码吧 v乛乛 udp server c 文件信息文件名 udp server c 创建人文件创建日期年月日描述 UDP 回射服务器程序
jni中使用extern "C"的原因

首先 cplusplus这个宏是微软自定义宏 xff0c 大小是个整数 xff1a cplusplus This macro is defined when the C 43 43 compiler is in use You can us
VmWare虚拟机设置ubuntu和windows之间的共享文件夹

一般在进行编程作业的时候 xff0c 我们会采用开发在Windows中编辑源代码 xff0c 在linux中编译执行源代码这往往需要需要将在Windows下编辑好的源代码上传到linux系统种进行编译怎么来进行上传呢 xff1f 其
C++的最后一道坎|百万年薪的程序员

导语 C 43 43 的起源可以追溯到 40 年前 xff0c 但它仍然是当今使用最广泛的编程语言之一 xff0c C 43 43 发明人Bjarne Stroustrup 一开始没想到 C 43 43 会获得如此大的成功 xff0c 他说
Modbus 协议

1 主站 xff1a 可以进行读写操作从站 xff1a 只能被动响应主站操作 2 一个 Modbus 网络只有一个主站 xff0c 可以多个从站 xff08 主站不用连在两端 xff09 485 通讯 1 接线最多 254 个站 xff
数据结构对齐

xfeff xfeff 对齐的算法 xff1a 由于各个平台和编译器的不同 xff0c 现以本人使用的gcc version 3 2 2编译器 xff08 32位x86平台 xff09 为例子 xff0c 来讨论编译器对struct数据结构

随机推荐

关于示波器测485串口波特率的使用方法总结

之前没有用过示波器 xff0c 更不知道怎么来测试串口的波特率 xff0c 结果遇到一客户说我们产品的波特率达不到9600 xff0c 只有9100 xff0c 为了验证这一说法 xff0c 我们只能自己测试一下说明 xff1a 产品通过
C语言对寄存器封装

一封装外设用C语言代码把外设地址映射用宏定义封装 span class hljs comment 外设基地址 span span class hljs preprocessor define PERIPH BASE unsigned i
JavaJDK下载安装与环境配置（Windows 10 超详细的图文版教程）

前言 xff1a 对于很多初学者来说 xff0c 我想可能很多人都会遇到JDK环境变量的配置问题明明就是按照度娘上的教程去一步步配置的 xff0c 但还是会有很多的人出现配置不成功的问题所以今天在这里分享一下windows 10 系统下
win32 获取窗口句柄的方法

第一种方法是根据窗口句柄值获取窗口句柄使用spy 43 43 获取指定窗口的窗口句柄值 xff0c 因为句柄值是16进制数 xff0c 所以前面加0x 然后进行强制转换为HWND类型 HWND hWnd 61 HWND 0x0028072
当设置display:inline;时li的宽度无效的解决方法

若制作导航栏时 xff0c 使用列表li 的定义时 xff0c 若想加上一个背景图 xff0c 这时候若定义li的一个属性为 li display inline width 83px height 30px xff0c 则浏览器会无视后面的
js文本框或者按钮鼠标悬停提示说明文字

html页面中很多元素会用到文本提示 xff0c 当鼠标悬停之后显示一段说明文字显示说明性文字 function tips id str t 61 getTop document getElementById id document ge
localstorage兼容ie8以下浏览器的问题

最近在做一个网站 xff0c 由于希望尽可能减小服务器的压力 xff0c 也想提高网站的运转速度 xff0c 就想尽可能少的在服务器上读写数据以及下载重复数据 xff0c 需要重复使用的数据 xff0c 就储存在本地 xff0c 能在本地进
HTTP请求返回状态码中301与302的状态码区别

一 xff0e 官方说法 301 xff0c 302 都是HTTP状态的编码 xff0c 都代表着某个URL发生了转移 xff0c 不同之处在于 xff1a 301 redirect 301 代表永久性转移 Permanently Move
java防止 csrf 攻击 --- 采用 spring .

CSRF xff08 Cross site request forgery xff09 xff0c 中文名称 xff1a 跨站请求伪造 xff0c 也被称为 xff1a one click attack session riding xff
Gson解析数组多类型元素

why used gson Gson is a Java library that can be used to convert Java Objects into their JSON representation It can also
js中获取时间new Date()详细介绍

1 var myDate 61 new Date Date 返回当日的日期和时间 getDate 从 Date 对象返回一个月中的某一天 1 31 getDay 从 Date 对象返回一周中的某一天 0 6 getMonth 从 Date
如何让一个行内元素（如一张图片）在div中居中

xff08 1 xff09 第一种 xff1a 用vertical align lt div class 61 34 method1 34 gt lt span class 61 34 tiptop 34 gt lt span gt lt
释放webpack tree-shaking潜力之webpack-deep-scope-analysis-plugin

在上周末广州举办的 feday 中 webpack 的核心开发者 Sean 在介绍 webpack 插件系统原理时隆重介绍了一个中国学生于 Google 夏令营在导师 Tobias 带领下写的一个 webpack 插件 https gi
iframe跨域通信的通用解决方案

此方案已有新版本请查看 iframe跨域通信的通用解决方案第二弹 xff08 终极解决方案 xff09 本文章可做技术学习供继续交流一背景在这个Web页面越来越丰富的时代 xff0c 页面通过iframe嵌入其他的页面也越来越常见
C++实现轻量级RPC分布式网络通信框架

前言 xff1a 2022 4 14更新 xff1a 在我重新回顾这篇文章的时候 xff0c 我觉得里面内容有点乱 xff0c 主要还是因为RPC里面涉及到很多概念和知识点本来代码内容就已经挺抽象了 xff0c 还要结合各种概念 xff0
浅谈JavaScript设计模式

创建型模式 xff1a 该模式处理的是用于创建对象的各种机制工厂方法抽象工厂建造者原型单例结构型模式 xff1a 考虑的是对象的组成以及对象彼此之间的关系适配器桥接组合装饰器外观享元代理行为型模式 xff1a 关注的是对象之间的依赖
Ardupilot-SITL仿真模拟调试

1 配置SITL仿真调试 span class token punctuation span span class token operator span waf configure span class token operator sp
PX4——Range Finder 篇

Range Finder 此处选用的是 Benewake 下的 Lidar 参数设置 General Configuration 除了官方的参数设置外 xff0c 我在 EKF2 中还找到了 EKF2 RNG AID 参数 xff0c 用来
STM32 时钟定时器基础

STM32 Clock Tree 时钟源 HSI xff1a xff08 High Speed Internal xff09 内部的 RC 震荡电路产生时钟信号 HSE xff1a xff08 High Speed External xff
Albumentation

文章目录 AlbumentationClassificationSegmentationDetectionKeyPoints Augmentation Albumentation 所有实现的变换变换以及支持的类型此处 Classific

Albumentation

文章目录

Albumentation

Classification

Segmentation

Detection

KeyPoints Augmentation

Albumentation 的相关文章

随机推荐

热门标签