如何通过 PyTorch 在计算机视觉中使用软标签?

2023-12-21

我有一个带有软标签的图像数据集(即图像不属于单个类别,但我有一个概率分布,表明该图像有 66% 的机会属于一个类别,33% 的机会属于其他类别)班级)。

我正在努力弄清楚如何设置我的 PyTorch 代码以使其能够由模型表示并正确输出。概率保存在 csv 文件中。我查看了 PyTorch 文档和其他资源,其中提到了交叉熵损失函数,但我仍然不清楚如何成功导入数据并使用软标签。


你想要解决的是多标签分类任务,i.e.一次可以使用多个标签对实例进行分类。你不能使用torch.CrossEntropyLoss https://pytorch.org/docs/stable/generated/torch.nn.CrossEntropyLoss.html因为它只允许单标签目标。所以你有两个选择:

  • 要么使用软版本nn.CrossEntropyLoss https://pytorch.org/docs/stable/generated/torch.nn.CrossEntropyLoss.html?highlight=cross%20entropy#torch.nn.CrossEntropyLoss函数,这可以通过手动实现损失来实现,允许软目标。您可以在以下位置找到这样的实现PyTorch 中的软交叉熵 https://stackoverflow.com/questions/68907809/soft-cross-entropy-in-pytorch/68914806#68914806.

  • 或者将该任务视为多个“独立”二元分类任务,在这种情况下,您将使用nn.BCEWithLogitsLoss https://pytorch.org/docs/stable/generated/torch.nn.BCEWithLogitsLoss.html?highlight=bce#torch.nn.BCEWithLogitsLoss(该层包含一个sigmoid功能)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何通过 PyTorch 在计算机视觉中使用软标签? 的相关文章

  • 如何检测图像中对象的实例?

    我有一张包含几个特定对象的图像 我想检测这些物体在该图像中的位置 为此 我有一些模型图像 其中包含我想要检测的对象 这些图像在我想要检测的对象实例周围得到了很好的裁剪 这是一个例子 在这张大图里 我想检测此模型图像中表示的对象 自从你最初发
  • Microsoft 认知服务 - 计算机视觉:订阅密钥无效

    我正在尝试使用计算机视觉API https azure microsoft com en us services cognitive services computer vision 来自微软的认知服务 但是 我的钥匙似乎不起作用 我使用该
  • Pytorch“展开”等价于 Tensorflow [重复]

    这个问题在这里已经有答案了 假设我有大小为 50 50 的灰度图像 在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数 如下所示 import numpy as np from torch import nn from
  • 在 RGB 图像上绘制多类语义分割透明叠加

    我有语义分割掩码的结果 值在 0 1 之间 需要大津阈值来确定什么是积极的 我想直接在 RGB 图像上绘制 在 RGB 图像上每个预测类具有不同的随机颜色 我使用以下内容绘制了具有单一颜色的单个蒙版 是否有一个包或简单的策略可以为多类别做到
  • 在 Pytorch 中估计高斯模型的混合

    我实际上想估计一个以高斯混合作为基本分布的归一化流 所以我有点被火炬困住了 但是 您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误 我的代码如下 import numpy as np import matplotlib p
  • 归一化互相关的基础知识

    我正在尝试使用范数校正2 归一化互相关 http en wikipedia org wiki Cross correlation Normalized cross correlation 来自 MATLAB 用于计算发育中胚胎中移动形状的速
  • 如何确定与视频中物体的距离?

    我有一个从行驶中的车辆前面录制的视频文件 我将使用 OpenCV 进行对象检测和识别 但我停留在一方面 如何确定距已识别物体的距离 我可以知道我当前的速度和现实世界的 GPS 位置 但仅此而已 我无法对我正在跟踪的对象做出任何假设 我计划用
  • 从点云检测平面集

    我有一组点云 我想测试3D房间中是否有角落 所以我想讨论一下我的方法 以及在速度方面是否有更好的方法 因为我想在手机上测试它 我将尝试使用霍夫变换来检测线 然后我将尝试查看是否有三条线相交 并且它们也形成了两个相交的平面 如果点云数据来自深
  • 深度估计的准确性 - 立体视觉

    我正在研究立体视觉 我对这个问题的深度估计的准确性感兴趣 这取决于几个因素 例如 适当的立体校准 旋转 平移和失真提取 图像分辨率 相机和镜头质量 失真越小 色彩捕捉正确 两个图像之间的匹配特征 假设我们没有低成本的相机和镜头 没有廉价的网
  • 对 FastAI 中的数据应用图像增强转换时出错

    我正在尝试复制这个 Kaggle 笔记本https www kaggle com tanlikesmath diabetic retinopathy with resnet50 oversampling https www kaggle c
  • 在requirements.txt中包含.whl安装

    如何将其包含在requirements txt 文件中 对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
  • HoughLinesP后如何合并线?

    My task is to find coordinates of lines startX startY endX endY and rectangles 4 lines Here is input file 我使用下一个代码 img c
  • Opencv 2.4.2 代码讲解-人脸识别

    我参考OpenCV提供的文档制作了一个人脸识别程序 可以识别多个人脸 并且工作正常 在文档中 他们制作了省略号来突出显示脸部 我不明白的是他们如何计算椭圆的中心 他们的计算如下 for int i 0 i lt faces size i P
  • Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

    我正在尝试做 pytorch 教程 当我尝试将他们的设备设置为 cuda 时 它不起作用并且我的代码运行被卡住 有关具体信息 我正在使用 conda 环境 蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
  • 在 opencv 中一次性将旋转和平移结合起来

    我有一段用于旋转和平移图像的代码 Point2f pt 0 in rows double angle atan trans c trans b 180 M PI Mat r getRotationMatrix2D pt angle 1 0
  • Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

    我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型 有时代码第一次运行良好 没有错误 其他时候 相同的代码使用相同的数据 会导致 CUDA 内存不足 错误 以前 重新启动运行时或退出笔记本 返回笔
  • OpenCV 地板分割检测

    我正在研究一种检测图像中地板的方法 我试图通过将图像缩小为颜色区域然后假设最大区域是地板来实现此目的 我们对机器人的运行环境做出一些相当广泛的假设 我正在寻找一些关于适合这个问题的算法的建议 任何帮助将不胜感激 编辑 具体来说 我正在寻找一
  • 透视变形矩形的比例

    给定一张被透视扭曲的矩形的二维图片 我知道这个形状原本是一个矩形 但我不知道它原来的大小 如果我知道这张图片中角点的像素坐标 我如何计算原始比例 即矩形的商 宽度 高度 背景 目标是自动使矩形文档的照片不失真 边缘检测可能会通过霍夫变换完成
  • 尝试将 cuda 与 pytorch 一起使用时出现运行时错误 999

    我为我的 Geforce 2080 ti 安装了 Cuda 10 1 和最新的 Nvidia 驱动程序 我尝试运行一个基本脚本来测试 pytorch 是否正常工作 但出现以下错误 RuntimeError cuda runtime erro
  • 无法在 Windows 10 上构建 Detectron2

    尽管 Windows 上的 Detectron2 没有官方支持 但有很多可用的说明 我尝试按照这些说明进行操作 但最终出现了相同的错误 这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD

随机推荐

  • 有水平的 UIRefreshControl 吗?

    你可以加UIRefreshControl to UICollectionView 或任何UIScrollView就此而言 将其添加到集合的子视图中 https stackoverflow com a 12502450 458193 UIRe
  • 为什么 Android 丢弃 TCP 数据包发生在 droid 5.x 中,而不是 4.x 中?

    我有一部 Android 智能手机 通过 WIFI 连接到嵌入式 AP 我正在使用 Linux 上运行 Tshark 的笔记本电脑嗅探 WIFI 流量 我每 100 毫秒传输小 234 字节 TCP 数据包 5 次 然后是 500 毫秒 没
  • 根据列中的条件将值分配给组

    我有一个如下所示的数据框 gt df data frame group c 1 1 1 2 2 2 3 3 3 date c 1 2 3 4 5 6 7 8 9 value c 3 4 3 4 5 6 6 4 9 gt df group d
  • 在 Windows 7 中找不到 IIS 服务

    当我进入 Windows 7 中的 Windows 服务窗口 开始 gt 管理工具 gt 服务 时 我找不到列出的 IIS 服务 我错过了什么吗 我只想重新启动服务 我有 IIS 管理器并且可以打开它 非常感谢任何帮助 谢谢 它被称为Wor
  • 如何在 Angular 的 HttpClient 中使用 reportProgress? [复制]

    这个问题在这里已经有答案了 我正在使用下载文件HTTP POST方法 我想调用另一种方法向最终用户显示下载进度 直到文件下载完成 如何使用reportProgress in HttpClient为了这 downfile file any O
  • WSL 下的 NFS 客户端 - mount.nfs:没有此类设备

    我在尝试挂 载 nfs 导出时收到以下错误 sudo mount 192 168 1 175 mnt nas mnt c nas mount nfs No such device 有想法该怎么解决这个吗 截至 2020 年 10 月 您可以
  • 如何将动画固定到位置?

    我尝试为 1 秒后修复的 DIV 制作动画 但我做不到 我希望一秒钟后名为 homepage hero module 的 div 从右向左滑动 正如您在 FIDDLE 中看到的那样 它在一秒钟后变为固定 那么如何制作动画呢 我尝试使用 cs
  • 如何在网格上添加自定义按钮并传递行值?

    我想向网格添加一个按钮 以便用户可以通过传入按钮行中的值来查看给定任务的时间表条目值 网格加载得很好 直到我将按钮添加到 columnCfgs 当按钮在那里时 我收到 Uncaught TypeError Object object Obj
  • JavaFX:如何刷新表?

    我在 JavaFX TableView 中刷新行样式时遇到问题 java版本 1 8 0 51 Java TM SE 运行时环境 版本 1 8 0 51 b16 Java HotSpot TM 服务器 VM 内部版本 25 51 b03 混
  • 如何使用 .NET Framework 3.5 中的数据注释对 C# 类进行属性验证?

    NET Framework 中是否有一种方法可以将某个方法或验证器传递给其类装饰的对象实例数据注释 http msdn microsoft com en us library system componentmodel dataannota
  • 如何提高 boost::spirit::x3 键值解析器的性能

    我正在使用以下方法解析键值对 类似于 HTTP 标头 boost spirit x3 当与我的手写解析器进行性能比较时 boost spirit x3比这慢大约 10 我正在使用 boost 1 61 和 GCC 6 1 g std c 1
  • Odata查询不会扩展

    我正在使用如下网址查询我的服务 http a com 3080 odata DiscussionVM 6 http a com 3080 odata DiscussionVM 6 expand 部分 用户 在控制器方法上 EnableQue
  • oracle中如何计算范围

    我有一个定义范围的表 例如 START END MAP 1 10 A 11 15 B 我如何查询该表 结果将是 ID MAP 1 A 2 A 3 A 4 A 5 A 6 A 7 A 8 A 9 A 10 A 11 B 12 B 13 B 1
  • Web 服务可以返回流吗?

    我一直在编写一个小应用程序 可以让人们向我上传和下载文件 我已经向此应用程序添加了一个 Web 服务 以这种方式提供上传 下载功能 但我不太确定我的实现将如何处理大文件 目前上传和下载方法的定义如下 使用 Apache CXF 编写 boo
  • Google Drive API (PHP):某些文件缺少父引用

    我仍在学习 Google Drive API 的细节 我正在尝试为其创建一个文件浏览器 以分层结构显示项目 而不是显示列出的所有文件 无论其父级如何 我遇到的问题是有些文件的父数组为空 最初的想法是 它应该显示根目录中存在的所有文件 并且仅
  • Tensorflow获取范围内的所有变量

    我在一定范围内创建了一些变量 如下所示 with tf variable scope my scope createSomeVariables 然后我想获取 my scope 中所有变量的列表 以便我可以将其传递给优化器 这样做的正确方法是
  • 需要帮助理解 SELECT ... FOR UPDATE 导致死锁的行为

    我有两个并发事务执行这段代码 为了说明目的而进行了简化 Transactional public void deleteAccounts List
  • Sqlalchemy 选择前事件

    我正在使用 SQL Alchemy 在 SQLA 执行 select 语句之前我需要做一些工作 所以我发现最好的方法是使用 SQLA Event 但我找不到合适的 before select 事件 它在那里吗 但我不善于找到 如果它不存在
  • 如何在reactjs中使用jest和enzyme来测试媒体查询CSS是否适用于屏幕调整大小时的元素

    我正在尝试使用笑话和酶来测试我在reactjs中构建的应用程序的响应能力 我怎样才能做到这一点 我有一个侧边栏 当屏幕尺寸小于或等于 1024px 时 侧边栏会向左过渡并消失 我经历过这个 弄清楚如何模拟反应组件测试的窗口大小变化 http
  • 如何通过 PyTorch 在计算机视觉中使用软标签?

    我有一个带有软标签的图像数据集 即图像不属于单个类别 但我有一个概率分布 表明该图像有 66 的机会属于一个类别 33 的机会属于其他类别 班级 我正在努力弄清楚如何设置我的 PyTorch 代码以使其能够由模型表示并正确输出 概率保存在