gradientdescent

为什么epoch太多会导致过拟合？

我正在阅读 Python 深度学习一书读完第 4 章对抗过度拟合后我有两个问题为什么增加纪元数可能会导致过度拟合我知道增加纪元数将涉及更多的梯度下降尝试这会导致过度拟合吗在对抗过拟合的过程中准确率会降低吗我不确定您正在

machinelearning gradientdescent

在线性回归空间中使用梯度下降有什么好处看起来我们可以用分析方法解决这个问题找到最小成本函数的theta0 n 那么为什么我们仍然想使用梯度下降来做同样的事情呢谢谢当您使用正规方程为了分析求解成本函数您必须计算其中 X 是输入观测

machinelearning linearregression gradientdescent

我想用 python 编写一个 TensorFlow 操作但我希望它是可微的能够计算梯度这个问题询问如何在 python 中编写操作答案建议使用 py func 没有梯度 Tensorflow 用 Python 编写操作 TF 文档

python tensorflow neuralnetwork gradientdescent

我一直在尝试在Caffe中实现softmax版本的三元组损失描述于霍弗和艾隆使用三元组网络进行深度度量学习 ICLR 2015 我已经尝试过这个但我发现很难计算梯度因为指数中的 L2 不是平方的有人可以帮我吗使用现有的 caf

neuralnetwork deeplearning caffe gradientdescent Softmax

因此我对 Python 中的 ML AI 游戏相对较新目前正在研究围绕 XGBoost 自定义目标函数实现的问题我的微分方程知识相当生疏所以我创建了一个带有梯度和 hessian 的自定义 obj 函数该函数对均方误差函数进行建模

python machinelearning xgboost gradientdescent hessianmatrix

我想知道如果我有一个层生成一个底部斑点该斑点进一步被两个后续层消耗这两个层都会生成一些梯度来填充反向传播阶段的 Bottom diff 将两个梯度相加形成最终梯度吗或者说只有他们一个人能够活下去根据我的理解 Caffe 层需要在用

machinelearning neuralnetwork deeplearning caffe gradientdescent

有时我会遇到一个问题 OOM when allocating tensor with shape e g OOM when allocating tensor with shape 1024 100 160 其中 1024 是我的批量大小

machinelearning neuralnetwork deeplearning Keras gradientdescent

我的实现见下文给出的标量值为 3 18 这不是正确的答案该值应为 0 693 我的代码在哪里偏离了等式以下是在 Octave 中运行成本函数方法求解数据的说明 data load ex2data1 txt X data 1 2 y

machinelearning Octave LogisticRegression gradientdescent

抱歉如果这听起来有点天真我想看看里面的肉TensorFlowGradientDescent 的实现亲自看看它们如何处理终止条件步长自适应性等我追踪了代码training ops apply gradient descent但我找不

tensorflow gradientdescent

我正在 Matlab 上实现批量梯度下降我的更新步骤有问题theta theta是两个分量两行的向量 X是一个矩阵包含m行训练样本数和n 2列特征数量 Y 是一个m行向量在更新步骤中我需要设置每个theta i to th

MATLAB gradientdescent

我有一个逻辑回归具有一组定义的参数的模型 warm start True 一如既往我打电话LogisticRegression fit X train y train 并使用之后的模型来预测新的结果假设我改变一些参数比如说 C 100

scikitlearn LogisticRegression gradientdescent hyperparameters

Closed 这个问题不符合堆栈溢出指南目前不接受答案我正在尝试从头开始构建一个神经网络所有人工智能文献都一致认为权重应该初始化为随机数以便网络更快地收敛但为什么神经网络初始权重被初始化为随机数呢我在某处读到这样做是为了打破

我正在尝试为 my op 编写一个自定义梯度函数为了示例的目的该函数仅包含对 tf identity 的调用理想情况下它可以是任何图形 import tensorflow as tf from tensorflow python f

python tensorflow gradientdescent

我正在尝试开发随机梯度下降但我不知道它是否100 正确我的随机梯度下降算法生成的成本有时与 FMINUC 或批量梯度下降生成的成本相差甚远虽然当我将学习率 alpha 设置为 0 2 时批量梯度下降成本会收敛但我被迫将学习率 al

MATLAB machinelearning LogisticRegression gradientdescent