使用梯度下降（最速下降）估计线性回归

2024-06-26

示例数据

X<-matrix(c(rep(1,97),runif(97)) , nrow=97, ncol=2)
y<-matrix(runif(97), nrow= 97 , ncol =1)

我已经成功创建了成本函数

COST<-function(theta,X,y){
### Calculate half MSE 
    sum((X %*% theta - y)^2)/(2*length(y))
}

然而，当我运行这个函数时，它似乎无法收敛超过 100 次迭代。

theta <- matrix (0, nrow=2,ncol=1)
num.iters <- 1500
delta = 0 

GD<-function(X,y,theta,alpha,num.iters){
    for (i in num.iters){

        while (max(abs(delta)) < tolerance){

            error <- X %*% theta - y
            delta <- (t(X) %*% error) / length(y)
            theta <- theta - alpha * delta
            cost_histo[i] <- COST(theta,X,y)
            theta_histo[[i]] <- theta

  }
  }
        return (list(cost_histo, theta_histo))
  }

有人能帮我吗？

Cheers

您的实现的算法部分是正确的。问题出在

循环结构在GD是不正确的;这for循环是多余的，变量缺乏正确的初始化。
使用固定的梯度下降的简单实现alpha很危险。通常建议这样alpha应该选择足够小的值，以希望我们总是向下搜索目标函数。然而，这种情况在实践中很少见。例如，多小才足够？如果它很小，那么收敛速度就是一个问题；如果它很小，那么收敛速度就是一个问题。但如果它很大，我们可能会陷入“之字形”搜索路径甚至发散！

Here is 梯度下降的稳健版本，用于估计线性回归。改进来自于步长减半策略，以避免“之字形”或背离。请参阅代码中的注释。在这种策略下，使用大的alpha. 保证了收敛性。

# theta: initial guess on regression coef
# alpha: initial step scaling factor
GD <- function(X, y, theta, alpha) {
  cost_histo <- numeric(0)
  theta_histo <- numeric(0)
  # an arbitrary initial gradient, to pass the initial while() check
  delta <- rep(1, ncol(X))
  # MSE at initial theta
  old.cost <- COST(theta, X, y)
  # main iteration loop
  while (max(abs(delta)) > 1e-7) {
    # gradient 
    error <- X %*% theta - y
    delta <- crossprod(X, error) / length(y)
    # proposal step
    trial.theta <- theta - alpha * c(delta)
    trial.cost <- COST(trial.theta, X, y)
    # step halving to avoid divergence
    while (trial.cost >= old.cost) {
      trial.theta <- (theta + trial.theta) / 2
      trial.cost <- COST(trial.theta, X, y)
      }
    # accept proposal
    cost_histo <- c(cost_histo, trial.cost)
    theta_histo <- c(theta_histo, trial.theta)
    # update old.cost and theta
    old.cost <- trial.cost
    theta <- trial.theta
    }
  list(cost_histo, theta_histo = matrix(theta_histo, nrow = ncol(X)))
  }

返回时，

的长度cost_histo告诉您已经进行了多少次迭代（不包括步骤减半）；
的每一列theta_histo gives theta每次迭代。

事实上，步长减半大大加快了收敛速度。如果您使用更快的计算方法，您可以获得更高的效率COST。（对于大型数据集最有用。请参阅https://stackoverflow.com/a/40228894/4891738 https://stackoverflow.com/a/40228894/4891738)

COST<-function(theta,X, y) {
  c(crossprod(X %*% theta - y)) /(2*length(y))
  }

现在，让我们考虑一下它在您的示例中的实现X, y.

oo <- GD(X, y, c(0,0), 5)

经过 107 次迭代后收敛。我们可以查看MSE的踪迹：

plot(oo[[1]])

请注意，在前几步，MSE 下降得非常快，但随后几乎持平。这揭示了梯度下降算法的根本缺点：随着我们越来越接近最小值，收敛速度越来越慢。

现在，我们提取最终的估计系数：

oo[[2]][, 107]

我们还可以将其与 QR 分解的直接估计进行比较：

.lm.fit(X, y)$coef

他们非常接近。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用梯度下降（最速下降）估计线性回归的相关文章

使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
在 dfm 中查找非英语标记并将其删除

在 dfm 中如何检测非英语单词并将其删除 dftest lt data frame id 1 3 text c Holla this is a spanish word English online here Bonjour commen
双精度数据类型和数值数据类型之间的区别

R编程中双精度数据类型和数值数据类型有什么区别 From stat ethz ch https stat ethz ch R manual R devel library base html double htm R 的浮点向量有两个名称
随着数据帧变大，如何防止 rbind() 变得非常慢？

我有一个只有 1 行的数据框为此我开始使用 rbind 添加行 df mydataframe with only one row for i in 1 20000 df lt rbind df newrow 随着我的成长这变得非常缓慢
将outer() 与多变量函数一起使用

假设你有一个函数f lt function x y z 您将如何向一个参数传递一个常量但让其他参数发生变化换句话说我想做这样的事情 output lt outer x y f x y z 2 这段代码不会评估但是有没有办法做到这一点
在 heatmap.2 中将行标签设置为斜体

我正在尝试使用 R 函数将行标签设置为斜体heatmap 2 没有默认选项我无法通过设置找到解决方法par font 3 例如如何将行标签设置为斜体heatmap 2 set seed 123 data matrix sample 10
如何使用R在csv文件中按列添加数据？

我有向量中包含的信息例如 sequence1 lt seq 1 20 sequence2 lt seq 21 40 我想将该数据附加到文件中所以我使用 write table sequence1 file test csv sep ap
在 R Markdown 中，无论输出类型如何（pdf、html、docx），都在每个页面上创建页眉/页脚

我想补充一下问题当我编织为 pdf 时那里的代码也在下面对我来说工作得非常好但我不会获得 html 或 docx 输出的页眉页脚在 R Markdown 中无论输出文档的类型如何我可以做什么来为输出文档的每个页面生成页眉
从 r 中的数据帧中删除每第 n 列

我试图通过删除每第三列来减小数据框的大小这是我的示例数据框 example data frame x c 1 2 3 4 y c 1 2 3 4 z c 1 2 3 4 w c 1 2 3 4 p c 1 2 3 4 q c 1 2 3
如何在 dbplyr 中使用自定义 SQL 函数？

我想计算数据库中的 Jaro Winkler 字符串距离如果我将数据带入 R 使用collect 我可以轻松地使用stringdist函数从stringdist包裹但我的数据非常大我想过滤 Jaro Winkler 距离before将
当 R 中出现“warnings()”时中断循环

我有一个问题我正在运行一个循环来处理多个文件我的矩阵非常巨大因此如果我不小心我经常会耗尽内存如果创建任何警告是否有办法打破循环它只是继续运行循环并报告它在很久以后失败烦人聪明的 stackoverflow ers 有什么想
将数据帧的每一列乘以向量的相应值[重复]

这个问题在这里已经有答案了我有以下数据框和向量 dframe lt as data frame matrix 1 9 3 vector lt c 2 3 4 我想将每一列相乘dframe通过相应的值vector 这不会做 gt vecto
使用 cmd 和 R 配置 databricks

我正在尝试使用 databricks cli 并调用 databricks 配置这就是我从 cmd 执行此操作的方法 somepath gt databricks configure token Databricks Host shoul
knitr pandoc：“无法使用 pdf writer 生成 pdf 输出”

Up front using pandoc 在knitr中当尝试将 md或 Rmd编译为PDF时它会抱怨我正在简化流程可重复的研究正如许多地方所记录的那样我在用着pandoc and knitr并制作出色的文档我还试图为一些不太
求R中3列中每一行的最大值

我需要计算 3 列中每行的最大值一个表可以是 x c 1 2 3 4 5 y c 2 3 3 1 1 z c 4 3 2 1 1 df lt data frame x y z 我需要得到 x y z max 1 1 2 4 4 2 2 3
带有 selectInputs 的 DT 数据表在选择后重置回左侧

我在 Shiny 应用程序的 DT 数据表的列中使用 selectInputs 感谢一些帮助here https stackoverflow com questions 74620665 vertically center selectin
我们可以有更多错误（消息）吗？

在 R 中如果函数使用变量有没有办法弹出错误消息未在函数体内声明即我希望有人标记这种类型的函数 aha lt function p return p n 看如果某个地方碰巧有一个 n 变量 aha p 2 会给我一个答案因为
如何在R中绘制堆积柱形图？

有谁知道如何使用 R 绘制由超过 1 个变量堆叠的列的直方图就像excel中的堆积柱形图一样谢谢你我假设您确实想要一个条形图而不是直方图在这种情况下 barplot从标准图形或barchart格子包中的两者都可以做到或者使用
如何改变R中数据框的形状？（将具有相同名称的列堆叠在一起）

我正在尝试重塑 R 中的数据框 Gene ID Value Gene ID 1 Value 1 Gene ID 2 Value 2 1 A 0 A 3 A 1 2 B 5 B 6 B 5 3 C 7 C 2 C 7 4 D 8 D 9 D
使用 R 中的剪切函数对缺失值进行 NA 级别[重复]

这个问题在这里已经有答案了 R 中的 cut 函数省略了 NA 但我想要一个缺失值的级别这是我的 MWE set seed 12345 Y lt c rnorm n 50 mean 500 sd 1 NA Y1 lt cut log Y

随机推荐

使用 gtk+ 播放视频

您对使用 GTK 播放视频有什么建议吗对于在 GTK 和其他 GTK 绑定上播放视频您有很多选择选项使用第三方库 1 尝试使用ogmrip gtk http ogmrip sourceforge net en manual html
React-Three/Fiber 创建 3D 文本

我正在尝试使用 Threejs React Three Fiber 创建 3D 文本我使用字体加载器加载字体如下所示 const font new FontLoader parse Microsoft Tai Le Regular js
使用 fn:random-number-generator 多次生成随机数

我尝试编写一个简单的函数以便每次调用它时都为我提供一个随机字母但我很难将我的想法与函数式编程方法的概念结合起来一路上的一些帮助将不胜感激我的代码如下所示
带图标的 Android ContextMenu 选项

Hi All 我有一个简单的问题是否可以将带有图标的菜单项添加到上下文菜单中我搜索过这个问题发现这是不可能的但是在 Android 设备的主屏幕中当我长按时会显示添加到主屏幕上下文菜单其中包含带有文本的菜单项和图标所以我
没有jquery的动画，左右滑动

我试图在显示 div 时将其向左滑动在隐藏它时将其向右滑动但我不想使用 jQuery 有没有一种方法可以在不使用javascript库的情况下制作简单的动画并支持IE7和IE8 这是我的显示隐藏js function showHide
检测 html 元素内的用户选择

如何检测用户选择用鼠标突出显示是否在某个元素内某个元素的子元素 Example div sdfsdf div some span content span div sdfsd div 伪代码 if window getSelectio
如何在 Windows 7 - 64 位中安装 IBM db2 ODBC 驱动程序？

我需要从本地 SQL Server 2008 R2 连接到远程 DB2 我不想使用链接服务器因此我正在搜索下载并尝试安装 IBM DB2 驱动程序因为主机集成服务器附带的用于 DB2 的 Microsoft ODBC 驱动程序非常昂贵
Git core.safecrlf 对具有相同行结尾的文件有不同的行为

我有带有 VS 项目的 Windows 计算机并且使用 Visual Studio 和 Cygwin 环境中的工具包括 Git 有时编辑后我会在文件中得到不同的行结尾我想要简单的解决方案来检查文件的行尾一致性然后再将其发送到存储库
在添加 ApiController 属性之前，ASP.NET Core 3.1 无法处理 Axios 请求

我有以下问题每当我向 Api 端点发送内容时 ASP NET Core 3 1 就无法处理该请求但是当我添加ApiController属性它工作得很好我的代码是正确的但只有当我添加此属性时才有效怎么会这样呢作为参考这是我的代
如何使用Javascript统计通过ajax返回的
的数量？

我有一个 ajax 代码它将列表项返回为 li one li li Two li 每次都会返回不同数量的 li 的我想查一下数量 li li 它返回如何使用 JavaScript 检查它给你 returnedHTML find li
一次设置多个字段/向单元结构添加新字段

我有一个 1xn 结构该结构包含一些带有数字单元格的字段并非每个结构都具有相同的字段所以我想将缺少的字段添加到结构中但我没明白 Mimimal example I have same cells imported from csv
如何确定 n 高数字金字塔中的最大路线成本

我有一个像这样的数字金字塔 7 4 8 1 8 9 2 4 6 7 4 6 7 4 9 4 9 7 3 8 8 routes 32 每个数字都按其系列中的强大程度进行索引 0 9 gt 1 1 8 gt 5 2 8 gt 4 3 7 gt
COM Interop 挂起会冻结整个 COM 系统。如何取消COM调用

我正在使用通过 COM Interop 包装器公开的第三方 dll 然而其中一个 COM 调用经常冻结至少不会返回为了至少让我的代码更加健壮我异步包装了调用 getDeviceInfoWaiter is a ManualResetE
在 IOS 设备上制作动画时，2 个相互堆叠的动画元素会发生变化（z 索引位置）吗？

JSFIDDLE http fiddle jshell net 6gdrQ 18 我有 2 个动画元素一种是简单的旋转脚本它像硬币一样旋转徽标的中间部分另一个动画是中间部分翻转时您看到的徽标后面的粒子画布烟雾动画我遇到的问题是画布烟
boost::bind 会导致开销吗？

我目前正在从事网络软件方面的工作它有一个主要类 server这显然代表一个服务器实例 A server实例可以发送请求并通过回调通知用户响应代码如下 class server public typedef boost function
在带有 OR 条件的 LEFT JOIN 中使用索引

考虑以下查询 SELECT FROM table1 LEFT JOIN table2 ON table2 some primary key table1 some primary key LEFT JOIN table3 ON table3
Haskell 程序查找列表中元素的位置

我需要编写一个函数来查找列表中一个特定元素的位置我是这样写的 findPos list elt list 1 head list elt 0 otherwise 1 findPos tail list elt 但是如果列表中元素重复怎么办
FileManager 说文件不存在

我有一个用例需要UIImage保存到文档目录然后UIImage需要转换为PDF并保存到文档目录转换为 PDF 的代码 var filePath NSString string self selectedMedia imagePath i
作为服务运行时，URLDownloadToFile() 将对象写入缓存中

我有一个软件可以将图像下载到工作目录中然后对其进行处理以创建视频之后这些文件将被独立脚本删除问题是它还将文件写入以下目录该软件作为系统服务运行 C Windows SysWOW64 config systemprofile Ap
使用梯度下降（最速下降）估计线性回归

示例数据 X lt matrix c rep 1 97 runif 97 nrow 97 ncol 2 y lt matrix runif 97 nrow 97 ncol 1 我已经成功创建了成本函数 COST lt function th

使用梯度下降（最速下降）估计线性回归

使用梯度下降（最速下降）估计线性回归 的相关文章

随机推荐

热门标签

使用梯度下降（最速下降）估计线性回归的相关文章