有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？

2024-03-27

我正在学习 Coursera 上关于逻辑回归的 ML 课程，以及 Manning 的《机器学习实践》一书。我正在尝试通过用 Python 实现所有内容来学习。

我无法理解成本函数和梯度之间的区别。网上有一些例子，人们计算成本函数，但有些地方他们不计算成本函数，而只是使用梯度下降函数w :=w - (alpha) * (delta)w * f(w).

如果有的话，两者有什么区别？

每当您使用数据训练模型时，您实际上都会为特定功能生成一些新值（预测）。但是，该特定特征已经具有一些值，这些值是数据集中的真实值。我们知道预测值越接近相应的实际值，模型就越好。

现在，我们使用成本函数来衡量预测值与其相应的实际值的接近程度。

我们还应该考虑到训练模型的权重负责准确预测新值。想象一下，我们的模型是 y = 0.9*X + 0.1，对于不同的 X，预测值只不过是 (0.9*X+0.1)。 [等式中的 0.9 和 0.1 只是需要理解的随机值。]

因此，通过将 Y 视为与该 x 对应的实际值，成本公式来衡量 (0.9*X+0.1) 与 Y 的接近程度。

我们负责为我们的模型找到更好的权重（0.9 和 0.1），以得出最低的成本（或更接近真实值的预测值）。

梯度下降是一种优化算法（我们还有一些其他优化算法），它的职责是在尝试具有不同权重的模型或更新权重的过程中找到最小成本值。

我们首先使用一些初始权重运行我们的模型，然后梯度下降更新我们的权重，并在数千次迭代中使用这些权重找到我们的模型的成本，以找到最小成本。

一点是梯度下降并没有最小化权重，它只是更新它们。该算法正在寻找最小成本。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？的相关文章

如何使用SVM求精确率、召回率、准确率？

重复计算 Precision Recall 和 F Score https stackoverflow com questions 16927964 how to calculate precision recall and f score
Tensorflow 中的平衡准确度分数

我正在为高度不平衡的分类问题实现 CNN 并且我想在张量流中实现自定义指标以使用选择最佳模型回调具体来说我想实现平衡的准确度分数这是每个类别的召回率的平均值请参阅 sklearn 实现here https scikit lear
Keras：模型准确率在达到 99% 准确率后下降，损失为 0.01

我正在 keras 中使用改编的 LeNet 模型来进行二元分类我有大约 250 000 个训练样本比率为 60 40 我的模型训练得很好第一个 epoch 的准确率达到 97 损失为 0 07 10 个 epoch 后准确率超过
哪些分类器提供权重向量？

存在哪些机器学习分类器可以在学习阶段后提供权重向量我了解 SVM 逻辑回归感知器和 LDA 还有更多吗我的目标是使用这些权重向量绘制重要性图其实任何线性分类器 https en wikipedia org title Linear
Python Sci-Kit 学习：多标签分类 ValueError：无法将字符串转换为浮点数：

我正在尝试使用 scikit learn 0 17 进行多标签分类我的数据看起来像 training Col1 Col2 asd dfgfg 1 2 3 poioi oiopiop 4 test Col1 asdas gwergwger
Python 中的归一化互相关

最近几天我一直在努力计算两对向量 x和y 的自由度参考Chelton 1983 它是根据 Chelton 1983 的自由度 https i stack imgur com O0DqE png 我找不到使用 np correlate 计
R 错误：“check.data 中的错误：参数应该是数字”

我正在学习 R 编程语言的 kohonen 库我创建了一些人工数据来尝试一些功能我尝试仅对连续即 type as numeric 数据使用 supersom 函数一切正常然而当我尝试在连续和分类 type as factor 上
用于多输入图像的 VGG16 网络

我正在尝试将 VGG16 网络用于多个输入图像使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc 大约 50 这就是为什么我想使用 VGG16 这样的既定模型进行尝试这是我尝试过的 imports from keras a
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
在 Databricks 中的 pyspark 数据帧上下载 punkt 时出现 NLTK 查找错误

我试图通过对 Databricks 中的 pyspark 数据框应用余弦相似度来查找文本列标题标题的相似性我的函数称为 cosine sim udf 为了能够使用它我必须进行第一次 udf 转换将函数应用于 df 后出现查找错误
Keras 自定义损失函数：访问当前输入模式

在 Keras 带有 Tensorflow 后端中当前输入模式可用于我的自定义损失函数吗当前输入模式被定义为用于产生预测的输入向量例如请考虑以下情况 X train X test y train y test train test
朴素分类器 matlab

在 matlab 中测试朴素分类器时即使我在相同的样本数据上进行训练和测试我也会得到不同的结果我想知道我的代码是否正确是否有人可以帮助解释这是为什么 dimensionality reduction columns 6 U S V
使用 Keras、Tensorflow 进行多时间序列维度的 RNN 时间序列预测

我正在尝试在某些时间序列集上运行 RNN LSTM 网络值得一提的是时间序列正在分类我有大约 600 个不同的时间序列每个序列都有 930 个带有特征的时间步长我已将数据结构化为 numpy 3D 数组其结构如下 X 666 o
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
如何计算两个字符串向量之间的余弦相似度

我有 2 个维度为 6 的向量我想要一个介于 0 和 1 之间的数字 a c HDa 2Pb 2 BxU BuQ Bve b c HCK 2Pb 2 09 F G 谁能解释我应该做什么使用lsa包和该包的手册 create some f
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr

随机推荐

我如何知道创建项目时使用的是哪个版本的 Delphi

如果我有 Delphi 项目的完整源代码我如何知道使用哪个版本即 Delphi 5 Delphi 7 Delphi 2010 等来创建它而无需在 Delphi 中打开它我有许多可以追溯到 Delphi 6 时代的项目我想对它们进
OpenId Connect 与 wso2 仅返回子声明

当我询问用户 WSO2 的信息时响应仅包含他的子信息 Request GET https srv wso2 domain com 9443 oauth2 userinfo schema openid Request headers Acc
AngularJS - 涉及异步数据的依赖注入

我想让当前登录的用户 ID 和用户名可供我的 Angular 指令使用我创建了一个 API 端点来检索此信息以及一些其他信息问题是 API 调用是异步的 var url baseUrl api sessions http get ur
没有指定 dataType 的自定义 ajaxTransport 函数不会触发（根本！）

我一直在尝试设置jQuery 的自定义 ajaxTransports http api jquery com extending ajax Transports在我们的产品的某些场景下缩短某些工作流程然而我在让这些运输受到尊重方面取得了
将 CSV 文件转换为 Java - 向后复制

我之前问过一个关于在java中将CSV文件转换为二维数组的问题我完全重写了我的代码几乎要重新编写了我现在遇到的唯一问题是它正在向后打印换句话说列打印在行应该打印的位置反之亦然这是我的代码 int board new int 2
D 中是否有相当于 C++ 的 Future/Promise ？

D 世界中是否存在 C 世界中的未来承诺等价物当然有标准并行度 http dlang org phobos std parallelism html但它并不完全具有承诺未来组合的功能没有相当于获取未来或设置结果或异常的功能您也不能
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
如何使用 jQuery 从 iframe 调用父页面上的函数？

我有一个上传表单可以发布到隐藏的 iframe 我试图从 iframe 调用父页面上的函数但收到错误 top stopUpload 不是函数这样做的正确方法是什么父页面 document ready function documen
检测两个图像之间的像素碰撞/重叠

我有两个 UIImageView 其中包含具有某些透明区域的图像有什么方法可以检查两个图像之间的非透明区域是否发生碰撞 Thanks 更新这就是我到目前为止所拥有的不幸的是它仍然不起作用但我不明白为什么 if CGRectInter
在什么情况下会调用类型到自身的转换运算符？

考虑一个类型bar其中具有用户定义的类型引用转换运算符bar struct bar operator bar operator const bar const 何时应用这些转换此外如果这些运算符是deleted 这两个功能有什么有趣的用
释放宝石时 rake 释放挂起

我正在尝试将我的第一个宝石发布到 Ruby Gems 该宝石在本地运行良好我使用以下方式释放它 rake release 这在控制台中给了我这个 example gem 0 0 3 built to pkg example gem 0 0
命名空间、argparse 和用法

这确实是几个问题 argparse 使用名称空间而不是字典有原因吗假设我有一个班级 init self init method args The init method参数告诉 init function 我想用哪种方式初始化类而arg
用 java 中的 Apache Tar 保存结构的目录

我怎么能够tar一个目录并使用以下命令保留目录结构org apache commons compress图书馆通过我在下面所做的事情我只是得到一个所有东西都被压平的包裹 Thanks 这是我一直在尝试的方法但它不起作用 public
为什么 macOS 会杀死由 clang 创建的静态可执行文件？

我有一个用于 m1 arm cpu 的最小 c 程序返回 42 void start asm mov x0 42 asm mov x16 1 asm svc 0x80 此代码在告诉 clang 使用 start 符号后进行编译并返回正确的
如何使用带有面部特征的 openCV 训练支持向量机（svm）分类器？

我想使用svm分类器进行面部表情检测我知道 opencv 有一个 svm api 但我不知道训练分类器的输入应该是什么到目前为止我读了很多论文他们都说在面部特征检测之后训练分类器到目前为止我所做的人脸检测每帧计算16个面部点下
在 d3 中堆叠矩阵而不重新映射到 json

The docs https github com d3 d3 shape blob master README md stacks对于d3的堆叠功能d3 stack显示一个包含对象数组的示例每个 json 对象代表 x 轴测量的点的集合
FOPEN_MAX 和 _SC_OPEN_MAX

在我的系统 Ubuntu 13 10 上值为FOPEN MAX为 16 值为 POSIX OPEN MAX是 20 其值为 SC OPEN MAX 我已经通过了sysconf 是 4096 我知道 POSIX OPEN MAX是最小值OP
如何将减少实现的序列转回惰性向量序列

当我将 221 行 csv 文件使用 clojure csv 解析运行到此函数中时 defn test key inclusion Accepts csv data param and an index a second csv dat
iOS 上的 Cordova 状态栏黑底黑字

我有一个 Cordova iPhone 应用程序它使用状态栏插件状态栏的背景设置为黑色文本为白色但自从将插件从版本 0 1 3 升级到 0 1 8 后文本现在是黑色的是否可以恢复旧的行为或者指定文本颜色调试信息使用 Cor
有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？

我正在学习 Coursera 上关于逻辑回归的 ML 课程以及 Manning 的机器学习实践一书我正在尝试通过用 Python 实现所有内容来学习我无法理解成本函数和梯度之间的区别网上有一些例子人们计算成本函数但有些地方他

有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？

有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？ 的相关文章

随机推荐

热门标签

有人可以向我解释逻辑回归中成本函数和梯度下降方程之间的区别吗？的相关文章