pytorch 中图像分割的通道明智 CrossEntropyLoss

2024-02-01

我正在做图像分割任务。总共有 7 个类，所以最终的输出是像 [batch, 7, height, width] 这样的张量，它是一个 softmax 输出。现在直觉上我想使用 CrossEntropy 损失，但 pytorch 实现不适用于通道明智的单热编码向量

所以我打算自己做一个功能。在一些 stackoverflow 的帮助下，我的代码到目前为止看起来像这样

from torch.autograd import Variable
import torch
import torch.nn.functional as F


def cross_entropy2d(input, target, weight=None, size_average=True):
    # input: (n, c, w, z), target: (n, w, z)
    n, c, w, z = input.size()
    # log_p: (n, c, w, z)
    log_p = F.log_softmax(input, dim=1)
    # log_p: (n*w*z, c)
    log_p = log_p.permute(0, 3, 2, 1).contiguous().view(-1, c)  # make class dimension last dimension
    log_p = log_p[
       target.view(n, w, z, 1).repeat(0, 0, 0, c) >= 0]  # this looks wrong -> Should rather be a one-hot vector
    log_p = log_p.view(-1, c)
    # target: (n*w*z,)
    mask = target >= 0
    target = target[mask]
    loss = F.nll_loss(log_p, target.view(-1), weight=weight, size_average=False)
    if size_average:
        loss /= mask.data.sum()
    return loss


images = Variable(torch.randn(5, 3, 4, 4))
labels = Variable(torch.LongTensor(5, 3, 4, 4).random_(3))
cross_entropy2d(images, labels)

我收到两个错误。代码本身提到了一个，它需要 one-hot 向量。第2个说的是以下内容

RuntimeError: invalid argument 2: size '[5 x 4 x 4 x 1]' is invalid for input with 3840 elements at ..\src\TH\THStorage.c:41

例如，我试图让它解决 3 类问题。所以目标和标签是（为了简化不包括批处理参数！）

Target:

 Channel 1     Channel 2  Channel 3

[[0 1 1 0 ] [0 0 0 1 ] [1 0 0 0 ] [0 0 1 1 ] [0 0 0 0 ] [1 1 0 0 ] [0 0 0 1 ] [0 0 0 0 ] [1 1 1 0 ] [0 0 0 0 ] [0 0 0 1 ] [1 1 1 0 ]

Labels:

 Channel 1     Channel 2  Channel 3

[[0 1 1 0 ] [0 0 0 1 ] [1 0 0 0 ] [0 0 1 1 ] [.2 0 0 0] [.8 1 0 0 ] [0 0 0 1 ] [0 0 0 0 ] [1 1 1 0 ] [0 0 0 0 ] [0 0 0 1 ] [1 1 1 0 ]

那么我如何修复我的代码来计算通道明智的 CrossEntropy 损失？

正如 Shai 的回答已经指出的那样，关于torch.nn.CrossEntropy()可以找到函数here https://pytorch.org/docs/stable/nn.html#torch.nn.CrossEntropyLoss并且可以找到代码here https://pytorch.org/docs/stable/_modules/torch/nn/modules/loss.html。内置函数确实已经支持 KD 交叉熵损失。

在 3D 情况下，torch.nn.CrossEntropy()函数需要两个参数：4D 输入矩阵和 3D 目标矩阵。输入矩阵的形状为：(Minibatch, Classes, H, W)。目标矩阵的形状为 (Minibatch, H, W)，数字范围为 0 到 (Classes-1)。如果您从 one-hot 编码矩阵开始，则必须将其转换为np.argmax().

具有三个类别且小批量大小为 1 的示例：

import pytorch
import numpy as np

input_torch = torch.randn(1, 3, 2, 5, requires_grad=True)

one_hot = np.array([[[1, 1, 1, 0, 0], [0, 0, 0, 0, 0]],    
                    [[0, 0, 0, 0, 0], [1, 1, 1, 0, 0]],
                    [[0, 0, 0, 1, 1], [0, 0, 0, 1, 1]]])

target = np.array([np.argmax(a, axis = 0) for a in target])
target_torch = torch.tensor(target_argmax)

loss = torch.nn.CrossEntropyLoss()
output = loss(input_torch, target_torch)
output.backward()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pytorch 中图像分割的通道明智 CrossEntropyLoss 的相关文章

在浏览器刷新中刷新检票面板

我正在开发一个付费角色系统一旦用户刷新浏览器我就需要刷新该页面中可用的统计信息统计信息应该从数据库中获取并显示但现在它不能正常工作因为在页面刷新中 java代码不会被调用而是使用以前的数据加载缓存的页面我尝试添加以下代码来修复
Internet Explorer 9 是否会因数组和对象文字末尾的额外逗号而卡住？

现代浏览器和 Node js 等环境允许您说 a 1 b 2 或 1 2 3 这在历史上一直是 Internet Explorer 的问题 Internet Explorer 9 中修复了此问题吗对此有两种不同的答案一种是对象初始值设定
洪水填充优化：尝试使用队列

我正在尝试创建一种填充方法该方法采用用户指定的初始坐标检查字符然后根据需要更改它这样做之后它会检查相邻的方块并重复该过程经过一番研究我遇到了洪水填充算法并尝试了该算法它可以工作但无法满足我对 250 x 250 个字符的数
如何执行“sudo nvm”？

在我的 Mac 上我想将一些需要 su 权限的包迁移到另一个节点版本我使用 homebrew 安装 nvm 现在我需要执行 sudo nvm 或 reinstall packages将失败 me MacBook sudo nvm sud
iOS 电池监控 Swift

我已将监控设置为启用但模拟器和设备中的电池电量仍然为 1 UIDevice currentDevice batteryMonitoringEnabled true var level UIDevice currentDevice batt
Angular Libraries Monorepo：是否可以为每个库使用不同的版本？

只是一个简单的问题我似乎找不到答案我正在尝试构建一个应该能够使用 angular cli v8 的 monorepo 但仍然能够编译和构建为 v2 v3 v4 等制作的库主要是组件和服务版本之间发生了很多变化所以让我们举个例子 V
在 PHP 中模拟 jQuery.ajax 请求

我必须在 PHP 中模拟 AJAX 请求就像在 jQuery 中一样我当前的代码在这里原始 AJAX 调用不得修改 ajax type POST url someFile php data data success function
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这
Azure函数版本2.0-应用程序blobTrigger不工作

我有一个工作功能应用程序它有一个 blob 输入和一个事件中心输出在测试版中工作随着最新的更改我的功能不再起作用我尝试根据发行说明更新 host json 文件但它没有引用 blob 触发器 version 2 0 extens
从输入类型编号获取无效值

我正在使用输入类型数字当它无效时我如何从中获取值例如使用类型编号并仅打印 e 这本身是无效的我正在使用 React 但我认为这个问题非常普遍 onChange event console log event target valu
从类模板参数为 asm 生成唯一的字符串文字

我有一个非常特殊的情况我需要为类模板中声明的变量生成唯一的汇编程序名称我需要该名称对于类模板的每个实例都是唯一的并且我需要将其传递给asm关键字 see here https gcc gnu org onlinedocs gcc 12
无法使用 HTML 设置未定义 jQuery UI 自动完成的属性“_renderItem”

我使用以下代码将 jQuery UI 自动完成项呈现为 HTML 这些项目在自动完成控件中正确呈现但我不断收到此 JavaScript 错误并且无法移动过去 Firefox 无法转换 JavaScript 参数 Chrome 无法设置未定
如何从 bootstrap-markdown.js 调用 .getContent 和 .parseContent

我是使用 Bootstrap 插件的新手刚刚通过代码学院 http www codecademy com en skills make an interactive website 我真的很想用这个很棒的引导 Markdown 插件 ht
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
在java中使用多个bufferedImage

我正在 java 小程序中制作游戏并且正在尝试优化我的代码以减少闪烁我已经实现了双缓冲因此我尝试使用另一个 BufferedImage 来存储不改变的游戏背景元素的图片这是我的代码的相关部分 public class QuizApp
如何使用 std::array 模拟 C 数组初始化“int arr[] = { e1, e2, e3, ... }”行为？

注意这个问题是关于不必指定元素数量并且仍然允许直接初始化嵌套类型这个问题 https stackoverflow com questions 6111565 now that we have stdarray what uses are
设置/覆盖 UICollectionView 中单元格之间的填充

我有一个 UICollectionView 但在获取单元格之间的填充时遇到了问题理论上我应该能够将屏幕除以 4 并且我可以获得包含 4 个图像的单元格大小完美地占据屏幕宽度但是它选择不这样做相反它会创建 3 个具有巨大填充的图
Prolog：子句在源文件中不在一起

我有这段代码 Family tree female pen male tom male bob female liz female pat female ann male jim parent pam bob parent tom bob
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple
如何创建向后兼容 Windows 7 的缩放和尺寸更改每显示器 DPI 感知应用程序？

我是 WPF 和 DPI 感知 API 的新手正在编写一个在 Windows 7 8 1 和 10 中运行的应用程序我使用具有不同每个显示器 DPI 设置的多个显示器并且有兴趣将我的应用程序制作为跨桌面配置尽可能兼容我已经知道可以将

随机推荐

if-let 语句不会解开可选内容

我在我的代码中遇到了一些看起来很好奇的东西并且想知道这种行为是否有一个简单的解释鉴于以下声明 if let tabBarController topViewController as UITabBarController for sub
如何推迟shared_ptr的删除操作？

我创建了一个指针sample主要类我正在将此指针传递给函数function1 该函数必须使用指针作为共享指针并使用该指针执行一些操作退出期间function1 的析构函数sample由于调用shared ptr 当我将相同的指针传递给不
实现自定义 LINQ-to-X 提供程序

我有一个搜索工具它接受复杂的搜索字符串实际上是 JSON 中的 n 级对象图并返回一些结果我想通过类似 LINQ 的机制向其他内部开发人员公开该功能假设每个结果都是由一个类定义的Result 我可以创建类似以下的方法 Func
Google+ 的共享意图无法访问图像

我正在调用共享图像的意图这适用于大多数提供商但适用于 Google Google 打开不带图片的帖子活动并显示 Toast 您只能发布存储在设备上的照片同时 File f storeImage image f data data c
在头文件与 .cpp 文件中编码 C++（主要）

多年来我一直以标准方式编写 C 代码在头文件 hpp 中使用类声明在源 cpp 文件中使用函数定义最近我搬到了一家新公司其中的代码似乎受到 boost 编码风格的影响完全用 hpp 文件进行编码并用一个短的 cpp 文件来
Visual Studio Extensions - 支持多个版本的VS

我一直在编写一个扩展编辑器分类器项目带有一些其他功能它在 VS2013 上运行良好但我需要支持其他版本 VS2012 和 VS2015 当它超出预览时当我刚刚添加支持的版本时vsixmanifest 我面临的问题是出口ITest
js函数不调用自动填充函数

我有一个输入字段其中包含州名称并在其他字段上显示相应的区域当我更改状态字段的值时区域的值也应该更改它不适用于我的代码这有什么问题 div class col md 4 form group style padding right
MongoDb 使用位置运算符拉取

我的文档结构如下 id 12342342 items ownerId 123 dates 2014 10 01 2014 10 02 ownerId 234 dates 2014 10 01 2014 10 02 我想从父对象的ownerI
低延迟、大规模消息队列

我正在重新思考 Facebook 应用程序和云计算时代的大型多人游戏假设我要在现有开放协议之上构建一些东西并且我想为 1 000 000 个同时玩家提供服务只是为了解决问题假设每个玩家都有一个传入消息队列用于聊天等平均还有一个传
查找带有 USB 设备 VID/PID 的 /dev 条目

我想制作一个程序来检测哪些 dev sd 条目链接到已知的 USB VID PID 对你知道我如何获得 USB 记忆棒的 VID PID 吗 dev sd 您可以使用udevadm为了这在输出中udevadm info q proper
通过 UIBezierPath 移动 CALayer

我有一个图层将从 UIBezierPath 上的 A 点移动到 B 点我发现了很多涉及 CAAnimation 和 UIBezierPath 的示例但我只需将图层从指定点移动到贝塞尔曲线路径上的另一个点任何建议将不胜感激 Thank
裁剪图像时添加细白线 (Objective-C OSX)

我正在剪切一张大图像并将其保存为许多不同的图像我首先在iOS它工作正常但是当我尝试将代码移植到OSX 一条细白线 1 像素出现在图像的顶部和右侧该线不是纯白色或实线参见下面的示例这里是iOS制作一个子图像的代码就像冠军一样 v
如何从 HIVE 中的日期减去月份

我正在寻找一种方法来帮助我从 HIVE 中的日期中减去月份我有个约会2015 02 01 现在我需要从这个日期减去 2 个月这样结果应该是2014 12 01 你们能帮我一下吗 select add months 2015 02 01
BigQuery 选择 * 两列除外

我想从公共 BigQuery github repos 数据集中选择除以下两条记录之外的所有内容 author nameAND差异 old mode 根据我问的类似问题我想我想运行类似于 standardSQL SELECT REPLAC
如何仅在functions.auth.user().onCreate完成后完成登录

我正在使用 firebase 函数并且有一个在用户创建时添加新集合的函数问题是有时用户在功能完成之前登录因此用户已登录但尚未创建新集合然后我收到错误消息缺少或权限不足因为规则找不到该集合我该如何处理仅当所有内容都来自时是否
在表格单元格内垂直拉伸 div - IE8

如何在表格单元格内垂直拉伸 DIV 我想height 100 就可以了但在某些情况下事实并非如此至少在 IE8 中这是一个简单的例子一个 3 行表格包含页眉内容和页脚我希望内容单元格内的内容 DIV 垂直拉伸 100 在
如何组合 kotlin 委托属性：可观察、可否决和“按映射”？

我正在尝试结合代表可观察的 https kotlinlang org api latest jvm stdlib kotlin properties delegates observable html with vetoable http
.NET Framework 4.0 安装程序是否也安装了 .NET 3.5？

NET 4 0 旨在与 3 5 并行运行并且不会运行 3 5 应用程序这让我担心必须指示我的用户下载 NET 3 5 而不仅仅是最新版本我在一篇博客中读到如果尚未安装 4 0 安装程序也会安装 3 5 但我现在无法测试它有人尝试
如何使用 XPath 和 Java 更新 XML

我有一个 XML 文档以及该文档的 XPath 表达式我必须在运行时使用 XPath 更新文档我如何使用 Java 来做到这一点下面是我的xml
pytorch 中图像分割的通道明智 CrossEntropyLoss

我正在做图像分割任务总共有 7 个类所以最终的输出是像 batch 7 height width 这样的张量它是一个 softmax 输出现在直觉上我想使用 CrossEntropy 损失但 pytorch 实现不适用于通道明智的

pytorch 中图像分割的通道明智 CrossEntropyLoss

pytorch 中图像分割的通道明智 CrossEntropyLoss 的相关文章

随机推荐

热门标签