多个神经网络各有一个输出还是一个有多个输出?

2024-02-17

我想将输入分类为三种可能性之一。使用 3 个网络(每个网络有一个输出)还是 1 个网络(每个网络有 3 个输出)更好? (即 3 个网络输出0 or 1或 1 个输出长度为 3 的单热向量的网络[1,0,0]

答案是否会根据输入数据分类的复杂程度而变化?

在多少输出量下才有意义对网络进行划分(如果有的话)?比如我想分成20组,有什么区别吗?


我想说使用具有多个输出的单个网络更有意义。

主要原因是隐藏层(我假设您至少有一个隐藏层)可以解释为将数据从原始空间(特征空间)转换为更适合任务(分类)的不同空间在你的情况下)。例如,当训练网络从原始像素识别人脸时,它可能会使用一个隐藏层首先根据像素检测简单的形状,例如小线条,然后使用另一个隐藏层根据像素检测简单的形状,例如眼睛/鼻子。来自第一层的线条等(它可能并不完全像这样“干净”,但这是一个易于理解的示例)。

网络可以学习的这种转换通常对于分类任务很有用,无论特定示例属于什么类别。例如,无论实际图像是否包含面部,都能够检测图像中的眼睛是有用的;如果你确实检测到两只眼睛,你可以将其分类为人脸,否则你将其分类为不是人脸。在这两种情况下,你都在寻找眼睛。

因此,通过分成多个网络,您最终可能会在所有网络中学习非常相似的模式。那么你不妨节省自己的计算量,只学一次。

分成多个网络的另一个缺点是,您可能会导致数据集变得不平衡(或者如果已经不平衡则更加不平衡)。假设您有三个类,每个类正好有 1/3 的数据集。如果您使用三个网络来执行三个二元分类任务,那么您突然总是有 1/3 个“1”类和 2/3 个“0”类。然后,网络可能会偏向于预测各处的 0,因为这些是三个独立问题中每个问题中的大多数类别。

请注意,这都是基于我的直觉;如果您有时间,最好的解决方案就是简单地尝试这两种方法并进行测试!不过,我认为我在实践中从未见过有人使用多个网络来执行单个分类任务,因此,如果您只有时间采用一种方法,我建议您使用单个网络。

我认为使用多个网络真正有意义的唯一情况是,如果您实际上想要预测多个不相关的值(或者至少是不强相关的值)。例如,如果给定图像,您想要 1) 预测图像上是否有狗,2) 它是照片还是绘画。那么最好使用两个各有两个输出的网络,而不是一个有四个输出的网络。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

多个神经网络各有一个输出还是一个有多个输出? 的相关文章

  • 支持向量机或人工神经网络进行文本处理? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 对于某些文本处理项目 我们需要在支持向量机和快速人工神经网络之间做出选择 它包括上下文拼写纠正 然后将文本标记为某些短语及其同义词 哪种方
  • LSTM 批次与时间步

    我按照 TensorFlow RNN 教程创建了 LSTM 模型 然而 在这个过程中 我对 批次 和 时间步长 之间的差异 如果有的话 感到困惑 并且我希望得到帮助来澄清这个问题 教程代码 见下文 本质上是根据指定数量的步骤创建 批次 wi
  • mlflow 如何使用自定义转换器保存 sklearn 管道?

    我正在尝试使用 mlflow 保存 sklearn 机器学习模型 这是一个包含我定义的自定义转换器的管道 并将其加载到另一个项目中 我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
  • 选择 c 和 gamma 值

    您好 我正在使用 SMO 执行 SVM 分类 其中我的内核是 RBF 现在我想选择c and sigma值 使用网格搜索和交叉验证 我是内核函数的新手 请帮助 一步一步的过程 选择一些您认为有趣的 C 和 sigma 值 例如 C 1 10
  • 为神经网络打乱两个 numpy 数组

    我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
  • 神经网络不能立即重现?

    通过使用反向传播导数 弹性 的前馈神经网络中的随机权重初始化 误差图上的初始位置位于某个随机谷的顶部 该随机谷可能是也可能不是局部最小值 可以使用方法来克服局部最小值 但假设这些方法没有被使用 或者在给定的地形上不能很好地工作 那么神经网络
  • 使用 NLTK 在 Python 中获取大量名词(或形容词);或 Python Mad Libs

    Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
  • 如何将神经网络的输出限制在特定范围内?

    我正在使用 Keras 进行回归任务 并希望将输出限制在一个范围内 例如 1 到 10 之间 有没有办法保证这一点 像这样编写自定义激活函数 a simple custom activation from keras import back
  • Keras model.predict 函数给出输入形状错误

    我已经在 Tensorflow 中实现了通用句子编码器 现在我正在尝试预测句子的类概率 我也将字符串转换为数组 Code if model model type universal classifier basic class probs
  • Python sklearn 多标签分类:用户警告:所有训练示例中都存在标签不是 226

    我正在尝试多标签分类问题 我的数据看起来像这样 DocID Content Tags 1 some text here 70 2 some text here 59 3 some text here 183 4 some text here
  • 具有定制损失函数的随机森林

    我是机器学习领域的初学者 对于一个项目 我必须在随机森林分类中使用自定义损失函数 到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助 损失函数 分类树中的基尼杂质和熵 在 scikit 的 tree pyx
  • rpart 决策树中的 rel 误差和 x 误差有什么区别? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我有一个来自 UCI 机器学习数据库的纯分类数据框https archive ics uci edu ml datasets Diabet
  • 多个对象以某种方式相互干扰[原始版本]

    我有一个神经网络 NN 当应用于单个数据集时 它可以完美地工作 但是 如果我想在一组数据上运行神经网络 然后创建一个新的神经网络实例以在不同的数据集 甚至再次同一组数据 上运行 那么新实例将产生完全错误的预测 例如 对 XOR 模式进行训练
  • 使用反向传播算法实现感知器

    我正在尝试实现一个具有反向传播的两层感知器来解决奇偶校验问题 该网络有 4 个二进制输入 第一层有 4 个隐藏单元 第二层有 1 个输出 我在用this http page mi fu berlin de rojas neural chap
  • 通过 Caffe 中的层提供数据的多种路径

    我想在 Caffe 中构建一个网络 其中传入的数据最初被分割 分别通过同一组层 最后使用 eltwise 层重新组合 此后 所有部件将作为一个斑点移动 除了学习的参数之外 数据并行移动的网络部分的层配置将是相同的 有没有一种方法可以在 Ca
  • 如何创建增量NER训练模型(追加到现有模型中)?

    我正在训练定制命名实体识别 NER 模型使用斯坦福自然语言处理但问题是我想要重新训练模型 Example 假设我训练过xyz模型 然后我将在一些文本上测试它 如果模型检测到错误 那么我 最终用户 将更正它并希望在更正的文本上重新训练 追加模
  • MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

    我正在努力掩盖 MultiHeadAttention 层的输入 我正在使用 Keras 文档中的 Transformer Block 进行自我关注 到目前为止 我在网上找不到任何示例代码 如果有人能给我一个代码片段 我将不胜感激 变压器块来
  • 机器人探索算法

    我正在尝试为机器人设计一种算法 试图找到位于未知位置的旗帜 该旗帜位于一个包含障碍物的世界中 机器人的任务是夺取旗帜并将其带到他的基地 代表他的起始位置 机器人在每一步只能看到有限的邻域 他事先不知道世界是什么样子 但他有无限的内存来存储已
  • 为什么我们应该在 Keras 中对深度学习数据进行标准化?

    我正在 Keras 中测试一些网络架构 以对 MNIST 数据集进行分类 我已经实现了一个类似于 LeNet 的方法 我看到在网上找到的例子中 有一个数据标准化的步骤 例如 X train 255 我在没有这种标准化的情况下进行了测试 我发
  • 为什么分割任务使用 Dice Coefficient 而不是 IOU?

    我见过人们使用IOU作为衡量标准detection任务和Dice Coeff for segmentation任务 这两个指标在方程方面看起来非常相似 只是骰子给予相交部分的权重是两倍 如果我是对的 那么 Dice 2 x A B A B

随机推荐

  • Monotouch:了解基础属性

    您能给我解释一下以下属性吗 1 MonoTouch Foundation Register SomeClass 该属性仅用于 IB 的寄存器类吗 当我以编程方式扩展 iOS 类时 是否必须使用此类 2 Export initSomethin
  • 如何在 Android Studio 首次运行时禁用下载组件

    我提取Android Studio IDE 135 1740770 还为 SDK 安装了这些软件包 Tools Android SDK工具24 1 2 Android SDK平台 工具22 Android SDK构建工具22 0 1 Ext
  • 使用 STAX 解析器将 XML 解组为三个不同对象的列表

    有没有一种方法可以使用 STAX 解析器来有效地解析具有不同类 POJO 的多个对象列表的 XML 文档 我的 XML 的确切结构如下 类名不是真实的
  • 在Scheme 中是否有相当于Lisp 的“运行时”原语?

    根据SICP 第 1 2 6 节 http mitpress mit edu sicp full text book book Z H 11 html sec 1 2 6 练习 1 22 大多数 Lisp 实现都包含一个称为运行时的原语 它
  • IDIV 汇编语言的问题

    CX 等于 14 AX 等于 16 IDIV CX 但 ALL 中的某个地方有 37 个 该行之前没有任何错误或错误 我哪里做错了 谢谢你 附注在Emu8086上写 IDIV CX除 32 位值DX AX by CX 并将商存储在AX和剩余
  • 如何在本机 C++ 项目中使用 tlb 文件

    我有一个 tlb 文件 其中包含一些我需要使用的函数声明 If I use import type library tlb 我可以从我的代码中正确引用该函数 tlb namespace required function 但是当我编译项目时
  • AVfoundation 反向视频

    我尝试制作反向视频 在 AVPlayer 中播放资源时 我将速率设置为 1 以使其以反向格式工作 但如何导出该视频呢 我查看了文档 阅读有关 avassetwrite sambuffers compositions 的内容 但没有找到任何方
  • Python Pygame 无法正确显示图像

    我是 Python 新手 我开始学习 Eric Matthes 的 Python 速成课程 我在 Pygame 章节的开头 遵循代码 但我加载的图像总是看起来损坏 我不知道为什么 代码来自书本 第一个文件 import pygame cla
  • Kivy RecycleView 作为 ListView 的替代品?它是如何工作的?

    我应该先说一下 我仍然是 Kivy 的新手 我尝试寻找类似的问题 但它们要么过时 要么不清楚 我正在寻找一些东西来显示元素列表 用户可以在其中选择一个元素来与其他小部件 按钮等 进行交互 我偶然发现了ListView 上的文档页面 http
  • 帮助理解 PHP5 错误

    简而言之 问题是 说什么 扩展 我没有收到错误 严格标准 非静态方法 Pyro Template preLoad 不应静态调用 假设 this 来自 opt lampp htdocs dc pyro app controllers admi
  • 选择 Xamarin Forms 中存储文件的路径

    我有一个 Xamarin 表单应用程序 我想保存文件 当用户在手机中打开文件管理器或手机连接到计算机时 应该显示该文件 我读了这个article https developer xamarin com guides xamarin form
  • Openblas 没有链接到 Scipy

    我目前在 Debian Jessie 上运行 scipy 我已经从 apt get 安装了 scipy 我还从 apt 安装了 blas 和 lapack sudo apt get install python scipy libblas
  • MySQL-SUM 日期时间?

    我需要总和日期时间值 但我不知道如何做到这一点 我有桌子 我的查询 SELECT SUM h dtplay AS Time FROM tblhistory AS h tblgame AS g WHERE h idgame g id AND
  • 允许在 asp.net 文本框中使用 html

    我将 ValidateRequest false 添加到页面指令中 但页面的行为就像没有回发一样 如果我删除 html 那么它会正常回发 使用更新面板内的文本框应该不会产生影响 对吗 我正在尝试使用 html 格式将文本存储在我的数据库中
  • Qt 全局样式表加载?

    如何使用 Qt 全局加载样式表 qss 样式资源 我正在努力让事情变得比以下更有效率 middleIntText gt setStyleSheet QLineEdit border 1px solid gray border radius
  • 是否可以将 LIMIT 与子查询结果一起使用?

    当需要有序集的最后几行时 通常会创建派生表并重新排序 例如 返回自动递增表的最后 3 个元素id SELECT FROM SELECT FROM table ORDER BY id DESC LIMIT 3 t ORDER BY t id
  • \n 在 Sklabel SpriteKit 中不起作用

    我在我的游戏中使用了以下代码 问题是我无法像使用 CCLabelTTF 那样在 spritekit 中制作多行标签 有人可以帮助我吗 另外我无法在我的代码中使用 t 或 n 感谢您的提前回复 SKLabelNode winner SKLab
  • C++11 std::threads 并等待线程完成

    我有一个计时器对象向量 每个计时器对象都会启动一个模拟生长期的 std thread 我正在使用命令模式 发生的情况是每个计时器都被一个接一个地执行 但我真正想要的是一个被执行 然后一旦完成 下一个 一旦完成下一个 同时不干扰主程序的执行
  • 工具提示内的图像tiptip

    我需要在具有悬停效果的工具提示中插入图像 tel view tipTip defaultPosition top delay 400 fadeIn 400 keepAlive true activation click HTML img s
  • 多个神经网络各有一个输出还是一个有多个输出?

    我想将输入分类为三种可能性之一 使用 3 个网络 每个网络有一个输出 还是 1 个网络 每个网络有 3 个输出 更好 即 3 个网络输出0 or 1或 1 个输出长度为 3 的单热向量的网络 1 0 0 答案是否会根据输入数据分类的复杂程度