多个神经网络各有一个输出还是一个有多个输出？

2024-02-17

我想将输入分类为三种可能性之一。使用 3 个网络（每个网络有一个输出）还是 1 个网络（每个网络有 3 个输出）更好？（即 3 个网络输出0 or 1或 1 个输出长度为 3 的单热向量的网络[1,0,0]

答案是否会根据输入数据分类的复杂程度而变化？

在多少输出量下才有意义对网络进行划分（如果有的话）？比如我想分成20组，有什么区别吗？

我想说使用具有多个输出的单个网络更有意义。

主要原因是隐藏层（我假设您至少有一个隐藏层）可以解释为将数据从原始空间（特征空间）转换为更适合任务（分类）的不同空间在你的情况下）。例如，当训练网络从原始像素识别人脸时，它可能会使用一个隐藏层首先根据像素检测简单的形状，例如小线条，然后使用另一个隐藏层根据像素检测简单的形状，例如眼睛/鼻子。来自第一层的线条等（它可能并不完全像这样“干净”，但这是一个易于理解的示例）。

网络可以学习的这种转换通常对于分类任务很有用，无论特定示例属于什么类别。例如，无论实际图像是否包含面部，都能够检测图像中的眼睛是有用的；如果你确实检测到两只眼睛，你可以将其分类为人脸，否则你将其分类为不是人脸。在这两种情况下，你都在寻找眼睛。

因此，通过分成多个网络，您最终可能会在所有网络中学习非常相似的模式。那么你不妨节省自己的计算量，只学一次。

分成多个网络的另一个缺点是，您可能会导致数据集变得不平衡（或者如果已经不平衡则更加不平衡）。假设您有三个类，每个类正好有 1/3 的数据集。如果您使用三个网络来执行三个二元分类任务，那么您突然总是有 1/3 个“1”类和 2/3 个“0”类。然后，网络可能会偏向于预测各处的 0，因为这些是三个独立问题中每个问题中的大多数类别。

请注意，这都是基于我的直觉；如果您有时间，最好的解决方案就是简单地尝试这两种方法并进行测试！不过，我认为我在实践中从未见过有人使用多个网络来执行单个分类任务，因此，如果您只有时间采用一种方法，我建议您使用单个网络。

我认为使用多个网络真正有意义的唯一情况是，如果您实际上想要预测多个不相关的值（或者至少是不强相关的值）。例如，如果给定图像，您想要 1) 预测图像上是否有狗，2) 它是照片还是绘画。那么最好使用两个各有两个输出的网络，而不是一个有四个输出的网络。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多个神经网络各有一个输出还是一个有多个输出？的相关文章

支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
神经网络不能立即重现？

通过使用反向传播导数弹性的前馈神经网络中的随机权重初始化误差图上的初始位置位于某个随机谷的顶部该随机谷可能是也可能不是局部最小值可以使用方法来克服局部最小值但假设这些方法没有被使用或者在给定的地形上不能很好地工作那么神经网络
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
Python sklearn 多标签分类：用户警告：所有训练示例中都存在标签不是 226

我正在尝试多标签分类问题我的数据看起来像这样 DocID Content Tags 1 some text here 70 2 some text here 59 3 some text here 183 4 some text here
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
rpart 决策树中的 rel 误差和 x 误差有什么区别？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个来自 UCI 机器学习数据库的纯分类数据框https archive ics uci edu ml datasets Diabet
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
使用反向传播算法实现感知器

我正在尝试实现一个具有反向传播的两层感知器来解决奇偶校验问题该网络有 4 个二进制输入第一层有 4 个隐藏单元第二层有 1 个输出我在用this http page mi fu berlin de rojas neural chap
通过 Caffe 中的层提供数据的多种路径

我想在 Caffe 中构建一个网络其中传入的数据最初被分割分别通过同一组层最后使用 eltwise 层重新组合此后所有部件将作为一个斑点移动除了学习的参数之外数据并行移动的网络部分的层配置将是相同的有没有一种方法可以在 Ca
如何创建增量NER训练模型（追加到现有模型中）？

我正在训练定制命名实体识别 NER 模型使用斯坦福自然语言处理但问题是我想要重新训练模型 Example 假设我训练过xyz模型然后我将在一些文本上测试它如果模型检测到错误那么我最终用户将更正它并希望在更正的文本上重新训练追加模
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
机器人探索算法

我正在尝试为机器人设计一种算法试图找到位于未知位置的旗帜该旗帜位于一个包含障碍物的世界中机器人的任务是夺取旗帜并将其带到他的基地代表他的起始位置机器人在每一步只能看到有限的邻域他事先不知道世界是什么样子但他有无限的内存来存储已
为什么我们应该在 Keras 中对深度学习数据进行标准化？

我正在 Keras 中测试一些网络架构以对 MNIST 数据集进行分类我已经实现了一个类似于 LeNet 的方法我看到在网上找到的例子中有一个数据标准化的步骤例如 X train 255 我在没有这种标准化的情况下进行了测试我发
为什么分割任务使用 Dice Coefficient 而不是 IOU？

我见过人们使用IOU作为衡量标准detection任务和Dice Coeff for segmentation任务这两个指标在方程方面看起来非常相似只是骰子给予相交部分的权重是两倍如果我是对的那么 Dice 2 x A B A B

随机推荐

Monotouch：了解基础属性

您能给我解释一下以下属性吗 1 MonoTouch Foundation Register SomeClass 该属性仅用于 IB 的寄存器类吗当我以编程方式扩展 iOS 类时是否必须使用此类 2 Export initSomethin
如何在 Android Studio 首次运行时禁用下载组件

我提取Android Studio IDE 135 1740770 还为 SDK 安装了这些软件包 Tools Android SDK工具24 1 2 Android SDK平台工具22 Android SDK构建工具22 0 1 Ext
使用 STAX 解析器将 XML 解组为三个不同对象的列表

有没有一种方法可以使用 STAX 解析器来有效地解析具有不同类 POJO 的多个对象列表的 XML 文档我的 XML 的确切结构如下类名不是真实的
在Scheme 中是否有相当于Lisp 的“运行时”原语？

根据SICP 第 1 2 6 节 http mitpress mit edu sicp full text book book Z H 11 html sec 1 2 6 练习 1 22 大多数 Lisp 实现都包含一个称为运行时的原语它
IDIV 汇编语言的问题

CX 等于 14 AX 等于 16 IDIV CX 但 ALL 中的某个地方有 37 个该行之前没有任何错误或错误我哪里做错了谢谢你附注在Emu8086上写 IDIV CX除 32 位值DX AX by CX 并将商存储在AX和剩余
如何在本机 C++ 项目中使用 tlb 文件

我有一个 tlb 文件其中包含一些我需要使用的函数声明 If I use import type library tlb 我可以从我的代码中正确引用该函数 tlb namespace required function 但是当我编译项目时
AVfoundation 反向视频

我尝试制作反向视频在 AVPlayer 中播放资源时我将速率设置为 1 以使其以反向格式工作但如何导出该视频呢我查看了文档阅读有关 avassetwrite sambuffers compositions 的内容但没有找到任何方
Python Pygame 无法正确显示图像

我是 Python 新手我开始学习 Eric Matthes 的 Python 速成课程我在 Pygame 章节的开头遵循代码但我加载的图像总是看起来损坏我不知道为什么代码来自书本第一个文件 import pygame cla
Kivy RecycleView 作为 ListView 的替代品？它是如何工作的？

我应该先说一下我仍然是 Kivy 的新手我尝试寻找类似的问题但它们要么过时要么不清楚我正在寻找一些东西来显示元素列表用户可以在其中选择一个元素来与其他小部件按钮等进行交互我偶然发现了ListView 上的文档页面 http
帮助理解 PHP5 错误

简而言之问题是说什么扩展我没有收到错误严格标准非静态方法 Pyro Template preLoad 不应静态调用假设 this 来自 opt lampp htdocs dc pyro app controllers admi
选择 Xamarin Forms 中存储文件的路径

我有一个 Xamarin 表单应用程序我想保存文件当用户在手机中打开文件管理器或手机连接到计算机时应该显示该文件我读了这个article https developer xamarin com guides xamarin form
Openblas 没有链接到 Scipy

我目前在 Debian Jessie 上运行 scipy 我已经从 apt get 安装了 scipy 我还从 apt 安装了 blas 和 lapack sudo apt get install python scipy libblas
MySQL-SUM 日期时间？

我需要总和日期时间值但我不知道如何做到这一点我有桌子我的查询 SELECT SUM h dtplay AS Time FROM tblhistory AS h tblgame AS g WHERE h idgame g id AND
允许在 asp.net 文本框中使用 html

我将 ValidateRequest false 添加到页面指令中但页面的行为就像没有回发一样如果我删除 html 那么它会正常回发使用更新面板内的文本框应该不会产生影响对吗我正在尝试使用 html 格式将文本存储在我的数据库中
Qt 全局样式表加载？

如何使用 Qt 全局加载样式表 qss 样式资源我正在努力让事情变得比以下更有效率 middleIntText gt setStyleSheet QLineEdit border 1px solid gray border radius
是否可以将 LIMIT 与子查询结果一起使用？

当需要有序集的最后几行时通常会创建派生表并重新排序例如返回自动递增表的最后 3 个元素id SELECT FROM SELECT FROM table ORDER BY id DESC LIMIT 3 t ORDER BY t id
\n 在 Sklabel SpriteKit 中不起作用

我在我的游戏中使用了以下代码问题是我无法像使用 CCLabelTTF 那样在 spritekit 中制作多行标签有人可以帮助我吗另外我无法在我的代码中使用 t 或 n 感谢您的提前回复 SKLabelNode winner SKLab
C++11 std::threads 并等待线程完成

我有一个计时器对象向量每个计时器对象都会启动一个模拟生长期的 std thread 我正在使用命令模式发生的情况是每个计时器都被一个接一个地执行但我真正想要的是一个被执行然后一旦完成下一个一旦完成下一个同时不干扰主程序的执行
工具提示内的图像tiptip

我需要在具有悬停效果的工具提示中插入图像 tel view tipTip defaultPosition top delay 400 fadeIn 400 keepAlive true activation click HTML img s
多个神经网络各有一个输出还是一个有多个输出？

我想将输入分类为三种可能性之一使用 3 个网络每个网络有一个输出还是 1 个网络每个网络有 3 个输出更好即 3 个网络输出0 or 1或 1 个输出长度为 3 的单热向量的网络 1 0 0 答案是否会根据输入数据分类的复杂程度

多个神经网络各有一个输出还是一个有多个输出？

多个神经网络各有一个输出还是一个有多个输出？ 的相关文章

随机推荐

热门标签

多个神经网络各有一个输出还是一个有多个输出？的相关文章