在 PyTorch 中使用焦点损失处理不平衡数据集

2024-01-08

我发现这个实现focal loss在 GitHub 中，我使用它来解决不平衡数据集二元分类问题。

# IMPLEMENTATION CREDIT: https://github.com/clcarwin/focal_loss_pytorch
    class FocalLoss(nn.Module):
    def __init__(self, gamma=0.5, alpha=None, size_average=True):
        super(FocalLoss, self).__init__()
        self.gamma = gamma
        self.alpha = alpha
        if isinstance(alpha,(float,int)): self.alpha = torch.Tensor([alpha,1-alpha])
        if isinstance(alpha,list): self.alpha = torch.Tensor(alpha)
        self.size_average = size_average

    def forward(self, input, target):
        if input.dim()>2:
            input = input.view(input.size(0),input.size(1),-1)  # N,C,H,W => N,C,H*W
            input = input.transpose(1,2)    # N,C,H*W => N,H*W,C
            input = input.contiguous().view(-1,input.size(2))   # N,H*W,C => N*H*W,C
        target = target.view(-1,1)

        logpt = F.log_softmax(input)
        logpt = logpt.gather(1,target)
        logpt = logpt.view(-1)
        pt = Variable(logpt.data.exp())

        if self.alpha is not None:
            if self.alpha.type()!=input.data.type():
                self.alpha = self.alpha.type_as(input.data)
            at = self.alpha.gather(0,target.data.view(-1))
            logpt = logpt * Variable(at)

        loss = -1 * (1-pt)**self.gamma * logpt
        if self.size_average: return loss.mean()
        else: return loss.sum()

also

gamma=args.gamma
alpha=args.alpha

criterion = FocalLoss(gamma, alpha)
m = nn.Sigmoid()

我在训练阶段使用如下标准：

for i_batch, sample_batched in enumerate(dataloader_train):  
            #pdb.set_trace()        
            feats = torch.stack(sample_batched['image']) 
            labels = torch.as_tensor(sample_batched['label']).cuda() 
            print('feats shape: ', feats.shape)
            print('labels shape: ', labels.shape)
            output = model(feats)
            loss = criterion(m(output[:,1]-output[:,0]), labels.float())

错误是：

train: True test: False
preparing datasets and dataloaders......
creating models......

=>Epoches 1, learning rate = 0.0010000, previous best = 0.0000
training...
feats shape:  torch.Size([64, 419, 512])
labels shape:  torch.Size([64])
main_classifier.py:86: UserWarning: Implicit dimension choice for log_softmax has been deprecated. Change the call to include dim=X as an argument.
  logpt = F.log_softmax(input)
Traceback (most recent call last):
  File "main_classifier.py", line 346, in <module>
    loss = criterion(m(output[:,1]-output[:,0]), labels.float())
  File "/home/jalal/research/venv/dpcc/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl
    return forward_call(*input, **kwargs)
  File "main_classifier.py", line 87, in forward
    logpt = logpt.gather(1,target)
IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)

我应该如何修复这个错误？

FocalLoss 的这种实现正确吗？

Unlike BCEWithLogitLoss，输入与您使用的相同的参数CrossEntropyLoss解决了问题：

#loss = criterion(m(output[:,1]-output[:,0]), labels.float())
loss = criterion(output, labels)

来自 NVidia 的 Piotr 的功劳 https://discuss.pytorch.org/t/logpt-logpt-gather-1-target-indexerror-dimension-out-of-range-expected-to-be-in-range-of-1-0-but-got-1/145225/6?u=mona_jalal

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

deeplearning

Pytorch

ComputerVision

imbalanceddata

在 PyTorch 中使用焦点损失处理不平衡数据集的相关文章

从数据框中按索引删除行

我有一个数组wrong indexes train其中包含我想从数据框中删除的索引列表 0 63 151 469 1008 要删除这些索引我正在尝试这样做 df train drop wrong indexes train 但是代码失败
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

Netlogo HPC CPU 使用百分比增加

我通过以下方式使用无头 NetLogo 将作业提交到 HPC 服务器code bin bash N r20p q all q pe mpi 24 home abhishekb netlogo netlogo 5 1 0 netlogo he
RuntimeException 未安装 Zip PHP 扩展

我是 Linux 新手我刚刚安装了 Composer 和 Laravel 但是当我运行laravel new project我收到以下错误 RuntimeException The Zip PHP extension is not ins
如何将 Jupyter 中的数据框导出为 csv 文件

我有一个数据框另存为df在 jupyter 笔记本中我想将其导出到桌面上的 csv 文件中对于 pandas 数据框您可以使用df to csv data csv https pandas pydata org pandas docs
已发布并等待 RabbitMQ / EasyNetQ 主题的回复 - 如何仅获取您的主题？

当发布者期望得到消息的答案时如何确保在扩展时它只能得到与其自己的消息相关的答案我们有一个客户端进程它发布一条消息以供服务器进程应答此外我们有一个监听器进程只需要消耗问题和答案而不需要发布任何内容此外服务器进程将来可
如何在量角器中等待元素启用

尝试单击按钮时量角器失败最初该按钮将处于禁用状态稍后它将被启用量角器认为该按钮已准备好并单击该按钮并失败所以我希望量角器脚本等到按钮启用我在下面尝试过但没有成功有人可以发布完整的代码来等待该元素被启用吗 expect bro
Apple 是否提供其使用的本地化术语索引？

Apple 是否为开发者提供了一套不同语言的标准术语我之所以问这个问题是因为我正在对应用程序的部分内容进行本地化并且希望在整个应用程序中一致应用标准术语我采用了一些策略通过更改设备上的语言并观察 Apple 如何用其他语言解释这些
从 R 读取 .npz 文件

I save npz来自 Python 的文件并想在 R 中读取它我尝试使用npyLoad功能但我收到此错误 library RcppCNPy Data lt npyLoad xx npz Error in npyLoad xx npz
在 Objective-C 中封装 C 库的技巧

我有一个用 C 编写的库我想在 Mac 或 iPhone 上的 Objective C 应用程序中使用它不幸的是由于该库是由开源领域的个人编写的因此文档非常稀疏且不完整虽然我可以弄清楚如何使用库中的内容但我并没有真正了解整个代码
使用常量内存在 O(n) 内对 BST 进行排序

这不是作业只是一个有趣的任务给定一个由数组表示的完全二叉搜索树使用常量内存在 O n 内对数组进行排序 Example Tree 8 4 12 2 6 10 14 1 3 5 7 9 11 13 15 阵列 8 4 12 2 6 10
ASP.NET MVC - 如何从不同的控制器维护 ModelState？

我有一个带有 Index 操作的 HomeController 该操作显示 Index aspx 视图它有一个用户名密码登录部分当用户单击提交按钮时它会 POST 到 AccountController 中的登录操作在此操作中它
如何处理 Rails 应用程序的长请求，以便其他用户不会延迟太多？

我在 Heroku 上有一个免费的 Rails 应用程序它最近开始吸引一些用户我的应用程序中的一个事件涉及查询另一个 API 最多可能需要 10 秒才能完成如何确保同时访问简单页面的其他用户作为另一个用户的 API 事件不需要等待
通过点击另一个标签来更改 html 标签的样式

我有以下代码 parentAppliance 是主左侧导航表的一部分将鼠标悬停在 Appliance 上时我会看到一个包含 health 的子表现在我希望当我点击健康时子表消失有什么想法吗 CSS childAppliance di
如何从源树中删除所有存储的密码

我想从 SourceTree 中删除所有存储的密码有什么办法可以删除所有的用户名和密码吗 None
正则表达式随后捕获字符之前的第一个单词 - Postgresql

参考这个问题 https stackoverflow com questions 66153909 regex capture first words before character subsequently 66154015但现在在 p
如何创建在测试 Web 应用程序时使用的自签名 SSL 证书

如何创建自签名 SSL 证书供 Apache 服务器在测试 Web 应用程序时使用如何创建自签名 SSL 用于测试目的的证书 from http httpd apache org docs 2 0 ssl ssl faq html sel
Serilog 记录器接收器的最小和最大级别

我们发现restrictedToMinimumLevel属性存在于 Serilog 中但它是否也支持最大级别属性之前我们已经使用过NLog其具有最小和最大日志记录级别 https github com NLog NLog wiki Co
在编译时将 std::array 转换为另一种数据类型？

C 11 中是否有一种方法可以在编译时将一种类型的数组转换为另一种数据类型 include
CSS 指针事件 – 接受拖动，拒绝点击

太棒了我需要一个元素来注册拖放指针事件但将单击和其他指针事件传递给其后面的元素我正在使用 React 构建拖放照片上传功能react dropzone https react dropzone netlify com 我想要dropz
无法在 View SQL Server 2005 上执行删除

我无法对视图执行删除各个桌子上的一切都运行良好 EDIT1 添加触发器 CREATE TRIGGER myTrigger ON ViewName INSTEAD OF DELETE AS DELETE FROM ViewName WHER
在 PyTorch 中使用焦点损失处理不平衡数据集

我发现这个实现focal loss在 GitHub 中我使用它来解决不平衡数据集二元分类问题 IMPLEMENTATION CREDIT https github com clcarwin focal loss pytorch class

在 PyTorch 中使用焦点损失处理不平衡数据集

在 PyTorch 中使用焦点损失处理不平衡数据集 的相关文章

随机推荐

热门标签

在 PyTorch 中使用焦点损失处理不平衡数据集的相关文章