如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？

2024-02-11

如何准备自定义关键点数据集黄建耀/yolov7 https://github.com/WongKinYiu/yolov7#pose-estimation?

关键点格式描述如下

https://cocodataset.org/#format-data https://cocodataset.org/#format-data

特别是这一行

annotation{
    "keypoints" : [x1,y1,v1,...],
    ...
}

说关键点是一个数组x1,y1,v1,....

yolov7-pose 官方githubhttps://github.com/WongKinYiu/yolov7/tree/pose https://github.com/WongKinYiu/yolov7/tree/pose有下载准备好的 COCO 数据集的链接【MS COCO 2017要点标签】 https://github.com/WongKinYiu/yolov7/releases/download/v0.1/coco2017labels-keypoints.zip下载它，打开并进入目录labels\train2017。您可以打开任意一个txt文件，你会看到类似这样的行

0 0.671279 0.617945 0.645759 0.726859 0.519751 0.381250 2.000000 0.550936 0.348438 2.000000 0.488565 0.367188 2.000000 0.642412 0.354687 2.000000 0.488565 0.395313 2.000000 0.738046 0.526563 2.000000 0.446985 0.534375 2.000000 0.846154 0.771875 2.000000 0.442827 0.812500 2.000000 0.925156 0.964063 2.000000 0.507277 0.698438 2.000000 0.702703 0.942187 2.000000 0.555094 0.950000 2.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000

该行具有以下格式

class top_left_x top_left_y bottom_right_x bottom_right_y kpt1_x kpt1_y kpt1_v kpt2_x kpt2_y kpt2_v ...

这是代码（来自general.py) 负责加载它


def xywhn2xyxy(x, w=640, h=640, padw=0, padh=0, kpt_label=False):
    # Convert nx4 boxes from [x, y, w, h] normalized to [x1, y1, x2, y2] where xy1=top-left, xy2=bottom-right
    # it does the same operation as above for the key-points
    y = x.clone() if isinstance(x, torch.Tensor) else np.copy(x)
    y[:, 0] = w * (x[:, 0] - x[:, 2] / 2) + padw  # top left x
    y[:, 1] = h * (x[:, 1] - x[:, 3] / 2) + padh  # top left y
    y[:, 2] = w * (x[:, 0] + x[:, 2] / 2) + padw  # bottom right x
    y[:, 3] = h * (x[:, 1] + x[:, 3] / 2) + padh  # bottom right y
    if kpt_label:
        num_kpts = (x.shape[1]-4)//2
        for kpt in range(num_kpts):
            for kpt_instance in range(y.shape[0]):
                if y[kpt_instance, 2 * kpt + 4]!=0:
                    y[kpt_instance, 2*kpt+4] = w * y[kpt_instance, 2*kpt+4] + padw
                if y[kpt_instance, 2 * kpt + 1 + 4] !=0:
                    y[kpt_instance, 2*kpt+1+4] = h * y[kpt_instance, 2*kpt+1+4] + padh
    return y

这是从调用的

labels[:, 1:] = xywhn2xyxy(labels[:, 1:], ratio[0] * w, ratio[1] * h, padw=pad[0], padh=pad[1], kpt_label=self.kpt_label)

请注意1偏移量labels[:, 1:]，它省略了类标签。标签坐标必须按照此处所述进行标准化

assert (l[:, 5::3] <= 1).all(), 'non-normalized or out of bounds coordinate labels'
assert (l[:, 6::3] <= 1).all(), 'non-normalized or out of bounds coordinate labels'

正确设置标签格式是唯一棘手的部分。剩下的就是将图像存储在正确的目录中。结构是

images/
    train/
        file_name1.jpg
        ...
    test/
    val/
labels/
    train/
        file_name1.txt
        ...
    test/
    val/
train.txt
test.txt
val.txt

where train.txt包含图像的路径。它的内容看起来像这样

./images/train/file_name1.jpg
...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

YOLO

poseestimation

Keypoint

如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？的相关文章

为什么评估集会耗尽 pytorch 拥抱中的内存？

我使用的是相当大的 GPU 大约 80 GB 训练纪元运行良好但由于某种原因在评估时训练集和验证集或多或少具有相同的长度我内存不足并收到此错误 File home transformers trainer pt utils py li
在 Pytorch 中获取负片（倒置）图像

我想直接从数据加载器获取图像的负片并将其作为张量提供有我可以使用的库吗我试过火炬transforms并没有找到任何不要费力只需使用255 image它会给你一个负面的形象试试吧
torch.unique() 中的参数“dim”如何工作？

我试图提取矩阵每一行中的唯一值并将它们返回到同一个矩阵中重复值设置为 0 例如我想转换 torch Tensor 1 2 3 4 3 3 4 1 6 3 5 3 5 4 to torch Tensor 1 2 3 4 0 0 0 1 6
PyTorch 中的截断反向传播（代码检查）

我正在尝试在 PyTorch 中实现随时间截断的反向传播对于以下简单情况K1 K2 我下面有一个实现可以产生合理的输出但我只是想确保它是正确的当我在网上查找 TBTT 的 PyTorch 示例时它们在分离隐藏状态将梯度归零以及这些
无法将 cuda:0 设备类型张量转换为 numpy。首先使用 Tensor.cpu() 将张量复制到主机内存

我试图展示 GAN 网络在某些指定时期的结果打印当前结果的功能之前是在 TF 中使用的我需要换成pytorch def show result G net z num epoch show False save False path r
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
我可以使用逻辑索引或索引列表对张量进行切片吗？

我正在尝试使用列上的逻辑索引对 PyTorch 张量进行切片我想要与索引向量中的 1 值相对应的列切片和逻辑索引都是可能的但是它们可以一起吗如果是这样怎么办我的尝试不断抛出无用的错误类型错误使用 ByteTensor 类型的
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
YOLO 目标检测：算法如何预测大于网格单元的边界框？

我试图更好地理解 YOLO2 和 3 算法的工作原理该算法处理一系列卷积直到达到13x13网格然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类如果您查看这张图片您会发现红色边框比任何单个网格单元都大边界框也以对象的
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出

随机推荐

套接字如何知道要使用哪个网络接口控制器？

如果一台计算机有多个网卡所有网卡都连接到不同的网络并且正常工作当我们打开一个套接字时操作系统如何确定该套接字使用哪个网卡套接字 API 是否允许我们显式指定要使用的 NIC 我是从 Linux 的角度写这篇文章的但我想它适用于任何
对列表视图进行分类

我在我的 Android 应用程序中使用列表视图并使用从数据库加载数据 setListAdapter adapter 现在我想根据数据给出列表中每个项目左侧的彩色条我该怎么做请帮我我的想法是创建一个如图所示的列表视图如果还没有你
检查字节序列是否是 Javascript 中有效的 UTF-8 序列

有没有一种简单的方法来检查 JavaScript 中的字符串是否是有效的 UTF 8 序列我真的不想以这样的正则表达式结束用于检测无效 UTF 8 字符串的正则表达式 https stackoverflow com questions
AWS Polly Java 客户端出现错误：无法从链中的任何提供商加载区域信息

我正在使用 AWS 的 JAVA SDK 创建 Polly 客户端像这样 BasicAWSCredentials awsCreds new BasicAWSCredentials
php列出upack字符串

这个链接 http php net manual en migration70 incompatible php migration70 incompatible variable handling list says list can n
Angular 5拦截器 - 在第一个拦截器重试失败后仅调用第二个拦截器

我正在构建一个 Angular 5 应用程序其中有 2 个拦截器重试失败的 504 请求之一另一个向用户显示有关失败请求的错误消息我希望第二个拦截器仅在错误不是 504 或错误为 504 并且已被第一个拦截器重试时被调用我创建了一
缩放高图后执行函数

Highcharts 中的图表缩放后是否可以执行功能 Use the 设置极端后 event xAxis categories Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec events a
子 shell 进程无法访问父 shell 中定义的变量和函数

我在同一目录中有3个脚本请找到以下x sh y sh和z sh的内容 x sh xData DataOfX function xInit echo xInit data of a gt xData lt y sh x sh xInit s
为什么 Chrome 会在空白字段上显示“请填写此字段”工具提示？

我的客户联系我说用户抱怨说某些字段现在显示带有消息请填写此字段的工具提示我简直不敢相信我所听到的但客户是对的使用最新的 Chrome 版本某些字段会显示带有此消息的浏览器工具提示甚至与我的验证器并排有什么问题我缺少什么
C#语言设计支柱

In the article http www artima com intv nonvirtualP html http www artima com intv nonvirtualP html http www artima com i
std::allocator 中“销毁”“析构函数”“解除分配”之间的区别？

In C std allocator 存在与共同概念相关的三种方法 deallocate destroy 析构函数我想知道从内存管理的角度来看它们有何不同我什么时候应该使用这个而不是那个谢谢你编辑更具体的疑问很抱歉一开始就笼
C# 中的复数和本地化字符串

我有一个 C WPF 应用程序我正在尝试使用 resx 文件进行全球化效果非常好然而我遇到了麻烦我有一个相对简单的复数解决方案其中我显示的字符串有单数和复数形式我根据我正在谈论的任何事物的数量选择一个然而我最近接受了这样一
当我回来或结束时如何重置我的控制器？

我有一个 QuestionController 类扩展GetxController 当我使用控件退出页面时我希望它停止工作因为它仍在后台运行并在我返回该页面时重新启动我试过了我在路线之后添加了这些ScoreScreen in ne
在管理中合并用户和用户配置文件

我一直在阅读 Django 对用户和配置文件的分离并且我决定使用一个名为 UserProfile 的模型该模型位于帐户应用程序中作为我的配置文件问题是现在我有两个独立的管理区域一个用于修改用户一个用于修改用户配置文件是否可以在
Word 插件获取完整的文档文本？

我正在使用以下命令编写一个 Office addinYeoman 办公室发电机 https github com OfficeDev generator office 基于这些说明 https dev office com getting
运行 SqlQuery EF 时 FieldNameLookup.GetOrdinal 中索引超出范围异常

我们最终得到一个索引超出范围运行这样的代码时出现异常 result Data dbOptima Database ExecuteStoredProcedure task StoredProcedureValues PROC GET TASK
Python中的时间序列分解函数

时间序列分解是一种将时间序列数据集分成三个或更多分量的方法例如 x t s t m t e t where t is the time coordinate x is the data s is the seasonal compon
firebase 函数 Puppeteer 找不到 Chromium GCP

我已经在谷歌云上使用GCP很长时间了我想运行一个使用Puppeteer的云函数但不幸的是我收到以下错误未处理的错误错误找不到 Chromium 修订版 1069273 如果出现以下任一情况就会发生这种情况您在运行脚本之前没有安
比较 JPA Criteria API 中的日期实体

使用 JPA 2 和 EclipseLink 实现我正在尝试构建一个动态查询它应该为我带来一些在给定日期之后保留的记录 CriteriaBuilder builder em getCriteriaBuilder CriteriaQuer
如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？

如何准备自定义关键点数据集黄建耀 yolov7 https github com WongKinYiu yolov7 pose estimation 关键点格式描述如下 https cocodataset org format data h

如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？

如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？ 的相关文章

随机推荐

热门标签

如何为 WongKinYiu/Yolov7 姿势估计准备自定义关键点数据集？的相关文章