如果可以激活多个输出，那么 softmax 层的替代是什么？

2023-12-19

例如，我有 CNN，它尝试从 MNIST 数据集（使用 Keras 编写的代码）中预测数字。它有 10 个输出，形成 softmax 层。只有一个输出可以为真（对于从 0 到 9 的每一位数字都是独立的）：

Real: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
Predicted: [0.02, 0.9, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01]

由于 softmax 的定义，预测的总和等于 1.0。

假设我有一个任务，需要对一些可以分为几个类别的对象进行分类：

Real: [0, 1, 0, 1, 0, 1, 0, 0, 0, 1]

所以我需要以其他方式正常化。我需要一个在 [0, 1] 范围内给出值并且总和可以大于 1 的函数。

我需要这样的东西：

Predicted: [0.1, 0.9, 0.05, 0.9, 0.01, 0.8, 0.1, 0.01, 0.2, 0.9]

每个数字都是对象属于给定类别的概率。之后，我可以使用像 0.5 这样的阈值来区分给定对象所属的类别。

出现以下问题：

那么哪个激活函数可以用于此目的呢？
这个函数可能已经存在于 Keras 中了吗？
也许您可以提出其他方法来预测这种情况？

您的问题是多标签分类之一，在 Keras 的上下文中对此进行了讨论，例如，此处：https://github.com/fchollet/keras/issues/741 https://github.com/fchollet/keras/issues/741

简而言之，keras 中建议的解决方案是将 softmax 层替换为 sigmoid 层，并使用 binary_crossentropy 作为成本函数。

该线程的一个例子：

# Build a classifier optimized for maximizing f1_score (uses class_weights)

clf = Sequential()

clf.add(Dropout(0.3))
clf.add(Dense(xt.shape[1], 1600, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1600, 1200, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1200, 800, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(800, yt.shape[1], activation='sigmoid'))

clf.compile(optimizer=Adam(), loss='binary_crossentropy')

clf.fit(xt, yt, batch_size=64, nb_epoch=300, validation_data=(xs, ys), class_weight=W, verbose=0)

preds = clf.predict(xs)

preds[preds>=0.5] = 1
preds[preds<0.5] = 0

print f1_score(ys, preds, average='macro')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras

convneuralnetwork

MNIST

Softmax

如果可以激活多个输出，那么 softmax 层的替代是什么？的相关文章

加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
如何使用功能 API 训练 Keras 模型，该模型具有两个输入和两个输出，并使用两个 ImageDataGenerator 方法 (flow_from_directory)

我想使用 Function Keras API 创建一个模型该模型将有两个输入和两个输出该模型将使用两个实例ImageDataGenerator flow from directory 方法从两个不同的目录分别是inputs1和inp
使用 Keras、Tensorflow 进行多时间序列维度的 RNN 时间序列预测

我正在尝试在某些时间序列集上运行 RNN LSTM 网络值得一提的是时间序列正在分类我有大约 600 个不同的时间序列每个序列都有 930 个带有特征的时间步长我已将数据结构化为 numpy 3D 数组其结构如下 X 666 o
将数值和分类数据混合到具有密集层的 keras 序列模型中

我在 Pandas 数据框中有一个训练集我将此数据框传递到model fit with df values 以下是有关 df 的一些信息 df values shape 981 5 df values 0 array 163 0 6 83
从 keras 模型中将特征提取到数据集中

我使用以下代码由here https github com keras team keras blob master examples mnist cnn py 运行 CNN 来训练 MNIST 图像 from future import
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
sklearn pipeline + keras顺序模型-如何获取历史记录？

Keras https keras io模型当 fit被调用时返回一个历史对象如果我将此模型用作 sklearn 管道的一步是否可以检索它顺便说一句我正在使用 python 3 6 提前致谢 History 回调记录每个时期的训
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在 keras 中集成采样的 softmax 失败

基于如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数 https stackoverflow com questions 47892380 how can i use tensorflows sampl
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get

随机推荐

如何在 C++ CLR 中将 array 转换为 char*？

在我的项目中我将一个 byte 从 C 传递到 C CLR 函数 C CLR 代码 void TestByteArray array
从元胞数组中获取字符串作为 matlab 工作区中变量的名称

我的实验中有大量 csv 文件 200 多个之前我一直在单独读取它们对于数据处理的后续步骤来说这是一项乏味的工作 co 15 csvread CO 15K csv 5 0 co 25 csvread CO 25K csv 5 0 co
如何将 Node.js 模块与 Next.js 一起使用？

我需要将express与next js一起使用吗我尝试将此代码添加到 next js 应用程序中来自 npm 模块示例代码 pdf2json let fs require fs var PDFParser require pdf2jso
必须打开哪些端口才能与 Firebase 数据库通信（而不是 FCM 消息传递）？

我用 C 编写了一个 Windows 服务它连接到 Firebase 数据库并存储数据对于连接和数据库通信我使用名为 FirebaseAuthentification net 和 FirebaseDatabase net 的 NuGe
ant fileset dir 排除某些目录

关于这个主题有很多问题但没有一个答案能解决我的问题再次启动该线程以获得新的输入我尝试了两种不同的方法来排除 B dir 及其在 A dir subdir 下的所有内容但没有一个有效仅供参考 a dir 位于 dir src 下 1
将垂直滚动破解为水平滚动[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我知道这违反了书中的每条可用性规则
寻找一种从辅助函数调用 Perl XS C API 函数/宏的方法

我一直在尝试 Perl XS C API 但遇到了障碍我在下面简化了我的示例假设现有结构 MyObject 然后访问属性 a 或 b 并为其中之一创建哈希我可以使用以下代码 typedef struct const char prop
如何向 UITableViewCell 分隔线添加阴影？

我有一个像这样的 UITableView 我想为每个单元格的分隔线添加阴影结果应如下所示我试过这个 In cellForRowAtIndexPath 方法我添加了这段代码 cell layer shadowOpacity 1 0 ce
如何在 Ruby 脚本中运行 Rake 任务？

我有一个Rakefile我通常会从命令行调用 Rake 任务 rake blog post Title 我想编写一个 Ruby 脚本来多次调用该 Rake 任务但我看到的唯一解决方案是使用反引号或system 这样做的正确方法是什么
如何使用numpy在python中计算RMSPE

我正在使用以下方法进行多元预测罗斯曼数据集 https www kaggle com c rossmann store sales description我现在需要使用 RMSPE 指标来评估我的模型我看到了相关的公式here https
我们如何对数据框进行排名？

我有示例数据框如下 i p accountNumber assetValue A100 1000 A100 500 B100 600 B100 200 o p AccountNumber assetValue Rank A100 1000
Divs 与 Tables 的另一个问题：表单

元注我正在浏览问题页面真的厌倦了 DIVS vs Tables 何时使用表 vs DIVS Divs 比 Tables 更好 Tables vs CSS 以及所有提出的问题同样的事情天哪人们但我想看看人们处理为什么你应该放弃并使用
如何更改Python中现有第三方库中的函数

这是向我提出的面试问题如果没有意义请不要惩罚我她问我在 python 中有一个现有的第 3 方库其中有一个函数 foo 在导入现有模块后如何修改该函数这称为猴子修补简而言之您可以直接分配给保存该函数的变量 import ex
Windows 7 PowerShell 在每个字符之间插入 ^@ - 如何防止？

希望对您来说回答这个问题很简单我在Win7上有gvim和vim 任何时候我将命令结果重定向到文件并使用 Vim 或 Gvim 相同效果打开它我都会在每个字符之间插入二进制 0 符号所以而不是 r96130 I have r 9
`add_route'：无效的路由名称，已在使用中：'root'（ArgumentError）

我使用 Rails 4 1 1 和 ruby 2 1 1 并且我遇到了设计问题即我的路线我之前已经使用过很多次了 devise for users get pages index Route to Devise Login Page d
防止服务器端脚本、XSS

是否有任何预制脚本可用于 PHP MySQL 来防止服务器端脚本和 JS 注入我知道一些典型的函数例如 htmlentities 特殊字符字符串替换等但是是否有一些简单的代码或函数可以万无一失任何想法都会很棒非常感谢 EDIT
将单个数字转换为单个数字Python [重复]

这个问题在这里已经有答案了我想将一个数字例如 43365644 转换为单个数字 4 3 3 4 4 并将其附加到列表中如果您满足以下条件这可以很容易地完成 Use str http docs python org 2 7 libra
itext 5 是否有可能在段落末尾证明剩余空间被脚本填充？

我正在 android studio 上制作一个应用程序并使用 itext pdf 5 我希望每次完成一个段落时缺少的空间都会填充脚本即第1段 text text text text end 第2段 text text text te
Bootstrap 4使用行和列类的正确方法[重复]

这个问题在这里已经有答案了 In my div我想要放置的元素two rows The 第一排包含两个input出于这个原因我可以将这两个输入元素放入两个单独的列中但在我的第二排只有一个按钮元素我不能放置两个单独的列这是我现在的代码
如果可以激活多个输出，那么 softmax 层的替代是什么？

例如我有 CNN 它尝试从 MNIST 数据集使用 Keras 编写的代码中预测数字它有 10 个输出形成 softmax 层只有一个输出可以为真对于从 0 到 9 的每一位数字都是独立的 Real 0 1 0 0 0 0 0

如果可以激活多个输出，那么 softmax 层的替代是什么？

如果可以激活多个输出，那么 softmax 层的替代是什么？ 的相关文章

随机推荐

热门标签

如果可以激活多个输出，那么 softmax 层的替代是什么？的相关文章