在线性回归空间中使用梯度下降有什么好处?看起来我们可以用分析方法解决这个问题(找到最小成本函数的theta0-n),那么为什么我们仍然想使用梯度下降来做同样的事情呢?谢谢
当您使用正规方程为了分析求解成本函数,您必须计算:
其中 X 是输入观测值矩阵,y 是输出向量。此操作的问题是计算 nxn 矩阵的逆的时间复杂度为 O(n^3),并且随着 n 的增加,可能需要很长时间才能完成。
当 n 较低时(n 梯度下降速度更快,所以唯一的原因是时间:)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)