真正的非零预测的损失惩罚更高

2023-11-22

我正在构建一个深度回归网络（CNN）来从图像（7,11）预测（1000,1）目标向量。目标通常由大约90% 为零并且只有10 %非零值。目标中（非）零值的分布因样本而异（即不存在全局类别不平衡）。

使用均方误差损失，这导致网络仅预测零，我对此并不感到惊讶。

我最好的猜测是编写一个自定义损失函数，它对非零值的错误的惩罚比对零值的预测的惩罚更多。

我尝试了这个损失函数，目的是实现我猜想的可以在上面工作的功能。它是一种均方误差损失，其中非零目标的预测受到的惩罚较小（w=0.1）。

def my_loss(y_true, y_pred):
    # weights true zero predictions less than true nonzero predictions
    w = 0.1
    y_pred_of_nonzeros = tf.where(tf.equal(y_true, 0), y_pred-y_pred, y_pred)
    return K.mean(K.square(y_true-y_pred_of_nonzeros)) + K.mean(K.square(y_true-y_pred))*w

网络能够学习而不会陷入只有零的预测。然而，这个解决方案似乎相当unclean。有没有更好的方法来处理此类问题？关于改进自定义损失函数有什么建议吗？欢迎任何建议，先谢谢您！

最好的，卢卡斯

不确定有什么比像你一样的自定义损失更好，但有一个更干净的方法：

def weightedLoss(w):

    def loss(true, pred):

        error = K.square(true - pred)
        error = K.switch(K.equal(true, 0), w * error , error)

        return error 

    return loss

您还可以return K.mean(error)，但没有mean您仍然可以从其他 Keras 选项中受益，例如添加样本权重和其他内容。

编译时选择权重：

model.compile(loss = weightedLoss(0.1), ...)

如果数组中有全部数据，您可以执行以下操作：

w = K.mean(y_train)
w = w / (1 - w) #this line compesates the lack of the 90% weights for class 1

另一种可以避免使用自定义损失但需要更改数据和模型的解决方案是：

改变你的y每个输出都转化为一个二类问题。形状=(batch, originalClasses, 2).

对于零值，使两个类中的第一个 = 1
对于 one 值，使两个类中的第二个 = 1

newY = np.stack([1-oldY, oldY], axis=-1)

调整模型以输出这个新形状。

...
model.add(Dense(2*classes))
model.add(Reshape((classes,2)))
model.add(Activation('softmax'))

确保您使用的是softmax and a categorical_crossentropy作为损失。

然后使用参数class_weight={0: w, 1: 1} in fit.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

deeplearning

lossfunction

loss

真正的非零预测的损失惩罚更高的相关文章

TensorFlow：有没有办法将冻结图转换为检查点模型？

可以将检查点模型转换为冻结图 ckpt 文件转换为 pb 文件但是是否有反向方法将 pb 文件再次转换为检查点文件我想它需要将常量转换回变量有没有办法将正确的常量识别为变量并将它们恢复回检查点模型目前支持将变量转换为常量 http
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
错误 - AttributeError：“DirectoryIterator”对象在 keras 的自动编码器设计中没有属性“ndim”

我是 Python 3 5 的新手我正在尝试编写一个简单的自动编码器它将在 60 张苹果图像的数据集上进行训练并尝试重建根中给出的图像我使用了以下代码 from keras layers import Input Dense fro
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m

随机推荐

具有字节数组键和字符串值的 HashMap - containsKey() 函数不起作用

我正在使用 HashMap byte 键和字符串值但我意识到即使我使用相同的对象相同的字节数组和相同的字符串值 myList put TheSameByteArray TheSameStringValue 到 HashMap 中表仍然
带计时器的 JPanel 动画（滑入）

我正在尝试使用我制作的此类从侧面滑入 JPanel public class AnimationClass private int i private int y private JPanel panel private int xTo p
OpenXml：将 XElement 转换为 OpenXmlElement

我将如何去转换XElement to an OpenXmlElement 要么我的 google fu 失败要么这个问题还没有得到解决您可以转换给定的OpenXmlElement to a XElement使用以下代码 OpenXmlE
ASPNET 用户没有临时 ASP.NET 文件的写入权限

在我的 XP Professional 机器上运行 Visual Studio 2008 ASP NET 项目启动时不进行调试时出现以下错误 System Web HttpException The current identity m
”错误' aria-label='在 Windows 上使用多重处理时出现“无法 pickle ”错误'> 在 Windows 上使用多重处理时出现“无法 pickle ”错误

我正在编写一个多处理程序来使用 Windows 并行处理大型 CSV 文件 I found 这个很好的例子对于类似的问题在 Windows 下运行它时我收到一条错误指出 csv reader 不可 Picklable 我想我可以在阅读
使用 Quartz Cron Trigger 处理夏令时的方法

我有一个石英 cron 触发器如下所示
设置 imeActionLabel 时 EditText 输入法操作不起作用

我有一个编辑文本imeoptions asactiongo 当按下软键盘输入按钮时我触发了我的事件 mModelId setOnEditorActionListener new OnEditorActionListener Overrid
重复键在 SQLite 中不起作用

在我的桌子上 id是主键但此代码在 sqlite3 中不起作用 insert into text id text VALUES 150574 Hello ON DUPLICATE KEY UPDATE text good 请帮我 INSE
将外部 CSS 文件添加到博客模板

在我的博客模板的 HTML 代码中我尝试添加指向 Google 云端硬盘中托管的 CSS 文件的外部链接我已公开 CSS 文件并创建了直接下载链接 https drive google com uc export download id
什么是僵尸交易？

我无意中发现zombie transaction中提到SqlTransaction代码那么什么是僵尸交易呢僵尸事务是无法提交由于不可恢复的错误但仍处于打开状态的事务 CREATE TABLE mytable id INT NOT
Nginx try_files（文件夹+文件）后备

鉴于此文件夹结构 root folder default settings1 txt settings2 txt settingsN txt user00001 settings1 txt userN settings1 txt 这个示例网
如何在Mysql数据库中使用Asp Net.Identity核心

我正在开发一个应用程序asp点网核心2 using MySql数据库请帮助我我该如何使用Asp 网络身份 in MySql数据库我必须为客户做这件事我在 ASP NET Core 1 0 的应用程序中进行了尝试但出于好奇我还尝试了
从 Ant 运行 .cmd 文件

是否可以从 Ant 运行命令 cmd 文件我需要为此编写 Java 代码吗
通过 AppWidgetManager 更新我自己的小部件时，电源控制小部件会短暂显示，有什么问题吗？

我通过 AppWidgetManager updateAppWidget 手动更新小部件时遇到问题平台是Android 2 2 这是代码我在清单中将小部件附加到现有活动中声明
如何让 RecyclerView 对齐到中心，同时能够滚动到所有项目，同时中心被“选中”？

背景我尝试实现与相机应用程序的模式类似的功能我可能不需要 ViewPager 因为它似乎在水平列表上方使用但将它作为一个选项可能会很好问题虽然从技术上讲我成功地让 RecyclerView 将其项目居中但它并不让您实际上拥有能
为什么我们应该在 C# 中使用文字？

在一些 C 代码中我看到过这样的语句 float someFloat 57f 我想知道为什么我们应该使用像这样的文字f在上述情况下主要是为了让编译器确切地知道我们的意思特别是重载解析 Foo 57f 应该叫Foo int Foo flo
如何在闪亮中创建加载事件或默认事件？

我对shiny和stackoverflow都很陌生正在寻求一些帮助来解决我目前遇到的问题我正在尝试构建一个闪亮的应用程序它收集用户的一些输入并根据单击按钮的输入创建可视化目前这工作正常但主要要求之一是当应用程序第一次加载时
如何在 jBoss AS 7 中配置静态资源

我想将图像上传到服务器将它们存储在文件系统服务器外部中然后将它们显示在我的 JSF 页面上我想找到这样的东西
如何在seaborn中设置日期时间xlim

我有一个数据框 df pd DataFrame max cr date 0 1569115380000 1 1569115500000 2 1569115560000 3 1569115620000 4 1569115680000 5 15
真正的非零预测的损失惩罚更高

我正在构建一个深度回归网络 CNN 来从图像 7 11 预测 1000 1 目标向量目标通常由大约90 为零并且只有10 非零值目标中非零值的分布因样本而异即不存在全局类别不平衡使用均方误差损失这导致网络仅预测零我对此并不感

真正的非零预测的损失惩罚更高

真正的非零预测的损失惩罚更高 的相关文章

随机推荐

热门标签

真正的非零预测的损失惩罚更高的相关文章