输入数据集如何输入神经网络?

2024-04-16

如果我的数据集中有 1000 个观测值,其中包含 15 个特征和 1 个标签,那么输入神经元中的数据如何用于前向传播和反向传播?是逐行馈送 1000 个观测值(一次一个),并根据每个观测值馈送更新权重,还是以输入矩阵形式给出完整数据,然后根据历元数,网络学习相应的权重值?另外,如果一次喂一个,那么 epoch 是多少? 谢谢


假设数据被格式化为行(1000 个实例,每个实例有 16 个特征,最后一个是标签),您将逐行输入前 15 个特征,并使用最后一个“特征”/标签作为目标。这就是所谓的online学习。在线学习要求您一次输入一个示例的数据,并对每个示例进行反向传播和权重更新。正如您可以想象的那样,由于每个数据实例的反向传播和更新,这可能会变得相当密集。

您提到的另一个选项是将整个数据输入网络。这在实践中表现不佳,因为收敛速度非常慢。

在实践中,小批量被使用。这涉及发送数据集的一小部分,然后进行反向传播和权重更新。这提供了相对频繁的权重更新以加速学习的好处,但强度不如在线学习。有关小批量的更多信息,请参阅此多伦多大学杰弗里·辛顿 (Geoffrey Hinton) 讲座 http://www.cs.toronto.edu/~tijmen/csc321/slides/lecture_slides_lec6.pdf

最后,一个纪元始终是对所有数据运行 1 次。一次喂一个或一次全部喂都没关系。

我希望这能澄清你的问题。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

输入数据集如何输入神经网络? 的相关文章

  • 如何在 R 中使用神经网络包时实现自己的误差函数?

    我正在尝试在 R 中的神经网络包中实现自定义错误函数 通常使用代表误差平方和和交叉熵的 sse 和 ce 来计算误差 任何人都可以向我提供有关如何实现自己的误差函数的详细信息 虽然软件包说我们可以使用自定义的错误函数 但用户手册中没有对此提
  • Keras model.evaluate() 和 model.predict() 有什么区别?

    我使用 Keras 生物医学图像分割来分割大脑神经元 我用了model evaluate 它给了我骰子系数 0 916 然而 当我使用model predict 然后通过计算Dice系数来循环预测图像 Dice系数为0 82 为什么这两个值
  • 在 Tensorflow 模型中添加低层

    尝试开发一些转移学习算法 我使用一些经过训练的神经网络并添加层 我正在使用 Tensorflow 和 python 在 Tensorflow 中使用现有图似乎很常见 导入图 例如使用元图 然后通过添加节点来设置新的高层 例如 我找到了这段代
  • ScikitLearn 的 MLPClasssifier 在输出层使用什么样的激活?

    我目前正在处理给定类标签 0 和 1 的分类任务 为此 我使用 ScikitLearnMLPClassifier为每个训练示例提供 0 或 1 的输出 但是 我找不到任何文档 说明 MLPClassifier 的输出层到底在做什么 哪个激活
  • 如何为 TensorFlow 分类器创建特征列

    我有一个非常简单的 csv 文件中的二进制分类数据集 如下所示 feature1 feature2 label 1 0 1 0 1 0 哪里的 label 列表示类别 1 为正 0 为负 功能的数量实际上相当大 但这对于这个问题来说并不重要
  • 将有状态 LSTM 称为功能模型?

    我有一个状态 LSTM 定义为顺序模型 model Sequential model add LSTM stateful True 后来 我将其用作功能模型 input 1 input 2 Input Input output 1 mode
  • 如何解释和转换 Keras 分类器的预测值?

    我正在训练我的 Keras 模型来预测 使用提供的数据参数 它是否会射击 并且它将以 0 表示否 1 表示是的方式表示 然而 当我尝试预测它时 我得到的是浮点值 我尝试使用与训练数据完全相同的数据来获取 1 但它不起作用 我使用下面的数据尝
  • word2vec中单词的向量代表什么?

    word2vec https code google com p word2vec 是 Google 的开源工具 它为每个单词提供一个浮点值向量 它们到底代表什么 还有一篇论文关于段落向量 http cs stanford edu quoc
  • 现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗?

    众所周知 用于目标检测的 nVidia DetectNet CNN 卷积神经网络 基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
  • R 神经网络在时间序列的最大步长内不收敛

    我正在编写一个神经网络来预测时间序列中的元素x sin x 2 在 R 中 使用neuralnet包裹 这就是训练数据的生成方式 假设窗口有 4 个元素 最后一个元素是必须预测的元素 nntr0 lt 1 25 sin 1 25 2 nnt
  • 如何在快速人工智能中获得给定测试集的预测并计算准确性?

    我正在尝试加载由导出的学习者learn export 我想针对测试集运行它 我希望我的测试集有标签 以便我可以测量其准确性 这是我的代码 test src TextList from df df path cols texts split
  • 实例标准化与批量标准化

    据我所知 批量归一化通过将激活转向单位高斯分布来帮助加快训练速度 从而解决梯度消失问题 批量归一化行为在训练 使用每个批次的平均值 var 和测试时间 使用训练阶段的最终运行平均值 var 时应用不同 另一方面 实例归一化充当本文提到的对比
  • 如何以 HDF5 格式提供 caffe 多标签数据?

    我想将 caffe 与矢量标签一起使用 而不是整数 我检查了一些答案 似乎 HDF5 是更好的方法 但后来我陷入了这样的错误 precision layer cpp 34 检查失败 outer num inner num bottom 1
  • Keras 获取中间层的输出

    what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
  • Keras 中的损失函数和度量有什么区别? [复制]

    这个问题在这里已经有答案了 我不清楚 Keras 中损失函数和指标之间的区别 该文档对我没有帮助 损失函数用于优化您的模型 这是优化器将最小化的函数 指标用于判断模型的性能 这仅供您查看 与优化过程无关
  • 用于神经网络模型预测的数据的缺失值

    我目前有大量数据将用于训练预测神经网络 美国主要机场的千兆字节天气数据 我几乎每天都有数据 但有些机场的数据中存在缺失值 例如 机场在 1995 年之前可能不存在 因此在此之前我没有该特定位置的数据 此外 有些还缺少整年 可能跨度为 199
  • 批量归一化,是还是否?

    我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
  • 为神经网络打乱两个 numpy 数组

    我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
  • 在监督分类中,使用partial_fit() 的MLP 比使用fit() 的表现更差

    我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本 第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器 我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
  • 神经网络不能立即重现?

    通过使用反向传播导数 弹性 的前馈神经网络中的随机权重初始化 误差图上的初始位置位于某个随机谷的顶部 该随机谷可能是也可能不是局部最小值 可以使用方法来克服局部最小值 但假设这些方法没有被使用 或者在给定的地形上不能很好地工作 那么神经网络

随机推荐