梯度下降算法不会收敛

2023-12-26

我正在尝试为斯坦福机器学习讲座中解释的梯度下降算法编写一些代码（第二讲 25:00左右 http://www.youtube.com/watch?v=5u4G23_OohI#t=25m）。下面是我最初使用的实现，我认为它是从讲座中正确复制的，但是当我添加大量数字时它不会收敛（>8) 到训练集。

我正在输入一个数字X，以及point (X,X)被添加到训练集中，所以目前，我只是想让它收敛到y=ax+b where a=1=theta\[1\] and b=0=theta\[0\]。训练集是数组x and y, where (x[i],y[i])是一个点。

void train()
{
    double delta;
    for (int i = 0; i < x.size(); i++)
    {
        delta = y[i]-hypothesis(x[i]);
        theta[1] += alpha*delta*x[i];
        theta[0] += alpha*delta*1;
    }
}

void C_Approx::display()
{
    std::cout<<theta[1]<<"x + "<<theta[0]<<" \t "<<"f(x)="<<hypothesis(1)<<std::endl;
}

我得到的一些结果：我输入一个数字，它运行train()几次，然后display()

1
0.33616x + 0.33616   f(x)=0.67232
1
0.482408x + 0.482408     f(x)=0.964816
1
0.499381x + 0.499381     f(x)=0.998762
1
0.499993x + 0.499993     f(x)=0.999986
1
0.5x + 0.5   f(x)=1

通过后发生分歧的一个例子8:

1
0.33616x + 0.33616   f(x)=0.67232
2
0.705508x + 0.509914     f(x)=1.21542
3
0.850024x + 0.449928     f(x)=1.29995
4
0.936062x + 0.330346     f(x)=1.26641
5
0.951346x + 0.231295     f(x)=1.18264
6
0.992876x + 0.137739     f(x)=1.13062
7
0.932206x + 0.127372     f(x)=1.05958
8
1.00077x + 0.000493063   f(x)=1.00126
9
-0.689325x + -0.0714712      f(x)=-0.760797
10
4.10321e+08x + 4.365e+07     f(x)=4.53971e+08
11
1.79968e+22x + 1.61125e+21   f(x)=1.9608e+22
12
-3.9452e+41x + -3.26957e+40      f(x)=-4.27216e+41

我尝试了建议的解决方案here https://stackoverflow.com/questions/3837692/how-to-create-a-simple-gradient-descent-algorithm缩放步骤并最终得到类似的结果。我究竟做错了什么？

你的实施很好。一般来说，当 α 太大时，随机梯度下降可能会发散。对于大型数据集，您要做的就是采取合理大小的随机样本，找到为您提供最佳结果的 α，然后将其用于其余部分。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

梯度下降算法不会收敛的相关文章

CMake 找不到请求的 Boost 库

既然我已经浏览了其他人的解决方案几个小时但找不到适合我的问题的正确答案我想将我的具体问题带给您我正在尝试使用 CMake 构建 vsomeip 为此我之前构建了 boost 1 55 但是我在 CMake 中收到以下错误 The
在路由mvc 4中添加公司名称

我一直在尝试为 Facebook 等用户提供在 URL 中添加公司名称的选项 http localhost 50753 MyCompany Login 我尝试过不同的网址但没有成功 routes MapRoute name Default
如何在另一个应用程序中挂钩 api 调用

我正在尝试挂钩另一个应用程序的 ExtTextOut 和 DrawTextExt GDI 方法调用我知道我需要使用 GetProcAddress 来查找 gdi32 dll 中那些方法的地址并用我的函数的地址覆盖我想要挂钩的进程中的地址
检测wlan是否关闭

任何人都可以给我一个提示如何在 Windows Phone 上以编程方式检测 C 8 1 应用程序不是 8 0 是否启用禁用 WLAN 我不想更改这些设置只是需要知道该解决方案是一个 Windows 8 1 通用应用程序 Wind
解析 JWT 令牌以仅获取有效负载内容，无需 C# 或 Blazor 中的外部库

我正在使用 Blazor 编写可以访问 JWT 的客户端应用程序我想知道一种简单的方法来读取令牌有效负载内容而不添加额外的依赖项因为我不需要其他信息也不需要验证令牌我认为解析有效负载内容应该足够简单只需将其写入方法即可 JwtTo
是否存在指向不同类型的指针具有不同大小的平台？

C 标准允许指向不同类型的指针具有不同的大小例如sizeof char sizeof int 是允许的但是它确实要求如果将指针转换为void 然后转换回其原始类型它必须与其原始值进行比较因此从逻辑上来说 sizeof void
Gwan C#，如何获取HTTP标头？

我需要它来重写 url 以了解我正在处理哪个友好的 url 用于用户代理和其他东西 EDIT public class Gwan MethodImplAttribute MethodImplOptions InternalCall exte
如何制作可启动程序？

所以这个问题可能看起来很奇怪但假设我编译了 int main void int x 3 int y 4 int z x y 是否可以让CPU这样运行如何例如这允许我写入监视器吗如果我没记错的话内存中有些地方可以写入要显示的内容
C# 5 async/await 线程机制感觉不对？

为什么让调用线程进入异步方法直到内部等待一旦调用异步方法就生成一个线程这不是更干净吗这样您就可以确定异步方法会立即返回您不必担心在异步方法的早期阶段没有做任何昂贵的事情我倾向于知道某个方法是否要在我的线程上执行代码不管是堵
C# 开源 NMEA 解析器 [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找 C 开源 NMEA 解析器嗯我自己也不熟悉但是一些快速搜索显示了一个代码项目 htt
C# 编译器不会优化不必要的强制转换

前几天在写答案的时候这个问题 https stackoverflow com questions 2208315 why is any slower than contains在这里关于溢出我对 C 编译器感到有点惊讶它没有按照我的
将接口转换为其具体实现对象，反之亦然？

在 C 中当我有一个接口和几个具体实现时我可以将接口强制转换为具体类型还是将具体类型强制转换为接口这种情况下的规则是什么 Java 和 C 中都允许这两个方向向下转型需要显式转型如果对象类型不正确可能会抛出异常然而向上转换
如何在三个 IEnumerable 上使用 Zip [重复]

这个问题在这里已经有答案了可能的重复使用 Linq 从 3 个集合创建项目 https stackoverflow com questions 5284315 create items from 3 collections using
析构函数中的异步操作

尝试在类析构函数中运行异步操作失败这是代码 public class Executor public static void Main var c1 new Class1 c1 DoSomething public class Class
Linux mremap 不释放旧映射？

我需要一种方法将页面从一个虚拟地址范围复制到另一个虚拟地址范围而无需实际复制数据范围很大延迟很重要 mremap 可以做到这一点但问题是它也会删除旧的映射由于我需要在多线程环境中执行此操作因此我需要旧映射能够同时使用因此稍后当
ASP.NET MVC 路由：如何从 URL 中省略“索引”

我有一个名为 StuffController 的控制器具有无参数索引操作我希望从表单中的 URL 调用此操作mysite com stuff 我的控制器定义为 public class StuffController BaseContr
CUDA 8 编译错误 -std=gnu++11

我正在尝试转换一些代码以使用 CUDA 并且我认为我遇到了兼容性问题我们使用CMake 这些是我使用的 gcc 和 CUDA 版本 gcc version gcc Ubuntu 5 4 0 6ubuntu1 16 04 5 5 4 0 2
在 C#.NET 中安全删除文件

在我正在做的一个项目中我想为用户提供安全删除文件的选项例如用随机位或 0 覆盖它在 C NET 中是否有一种简单的方法可以做到这一点效果如何你可以调用系统内部删除 http technet microsoft com en
将 Scikit-Learn OneHotEncoder 与 Pandas DataFrame 结合使用

我正在尝试使用 Scikit Learn 的 OneHotEncoder 将 Pandas DataFrame 中包含字符串的列替换为 one hot 编码的等效项我的下面的代码不起作用 from sklearn preprocessin
如何得知客户端从服务器的下载速度？

根据客户的下载速度我想以低质量或高质量显示视频任何 Javascript 或 C 解决方案都是可以接受的 Thanks 没有任何办法可以确定您只能测量向客户端发送数据的速度如果没有来自客户端的任何类型的输入来表明其获取信息的速度您

随机推荐

在 NHibernate 中使用 Enterprise Library 日志记录应用程序块

我们正在尝试将 NHibernate 集成为我们的 OR M 但是我们目前正在使用 Enterprise Library 的日志记录应用程序块我知道NHibernate使用log4net来记录日志有谁有关于如何使用 Enterpris
ASMX Web 服务 - “此 Web 服务使用 http://tempuri.org/ 作为其默认命名空间。”消息 - 但不应该是这样

我已经使用 Visual Studio 创建了一个 Web 服务 2005 年我知道我很守旧一切都编译得很好但当它打开时我收到警告此 Web 服务不符合 WS I Basic Profile v1 1 而且该网络服务正在使用ht
在 Java 中运行 Bash 命令

我有以下课程它允许我通过java执行命令 public class ExecuteShellCommand public String executeCommand String command StringBuffer output n
使用 Azure DevOps REST API 创建管道失败，并出现错误“未指定池”

使用 Azure DevOps REST API 创建管道时不会创建管道我用过创建 Rest API https learn microsoft com en us rest api azure devops pipelines pi
我需要将 SQL 本机放入查询生成器 Doctrine2 中

我需要在查询生成器学说 2 中使用 SQL NATIVE 来使用 SQL 函数 CONCAT REPLACE LDAP 请帮我您可以尝试 connection this gt get doctrine gt getConnection t
OpenCV 代码在 C++ 中使用的 CPU 比 Python 多

我正在研究 python 和C 但我还是缺乏经验我捕获两种语言的窗口图像并将其转换为hsv format 结果如下 Python 5 9 CPU 67 72 FPS C 45 50 CPU 28 35 FPS 我在某个地方犯了错误这是肯
具有关联类型的多态结构向量

我想了解如何多态性使用时有效具有相关类型的特征考虑以下特征 trait Animal fn talk self 此特征由以下结构使用 struct Dog struct Cow impl Animal for Dog fn talk se
如何从另一个类访问Java数组列表数据

我正在尝试用 Java 进行测验但我无法从测试器类访问数组列表数据因此我的问题文本没有显示我有三门课测试仪测验界面和测验设置我已经玩了一段时间了我很确定我开始让事情变得更糟所以我想我应该在这里发帖这些问题已添加到测试程序文
如何使用 jest 测试 redux-saga 所有效果

function mySaga const customers products yield all call fetchCustomers call fetchProducts 我想开玩笑地测试所有效果但我得到 Invalid atte
boto3 从客户端获取资源

适用于 python 的 AWS 库 boto 有两种不同类型的接口用于与 AWS 配合使用一种是低级接口client更高层次的Pythonicresource 我的代码的一部分使用其中之一而其他部分则使用另一个得到一个client
C 和 C++：数组元素访问指针与 int

如果您这样做会有性能差异吗myarray i 或存储地址myarray i 在指针中 Edit 这些指针都是在我的程序中的一个不重要的步骤中计算的其中性能不是标准在关键部分指针保持静态并且不被修改现在的问题是这些静态指针是否比使用
为什么切片线程对使用 ffmpeg x264 的实时编码影响如此之大？

我正在使用 ffmpeg libx264 对从 x11 实时捕获的 720p 屏幕进行编码帧速率为 30 当我使用调整零延迟参数下每帧的平均编码时间可高达 12ms 使用配置文件基线经过研究ffmpeg x264源代码我发现导致这
在 D2 中将 std.algorithm.map 与成员函数结合使用

I have Foo foo new Foo foreach i 0 10 Bar bar foo getBar i 我希望能够等效地说 foreach bar foo getAllBars 我该如何实施getAllBars 我想了这样
Google Cloud 服务是否支持嵌套虚拟机？

我正在尝试配置一个应用程序以在 Google Cloud 上运行我能够启动运行 Windows 2008 Server 64 位的 VM 并在其中安装 VMWare Player 然后我尝试在 VMWare Player 中安装并启动第
如果 pandas 数据框超过 10 行，则将其分成两部分

我有一个巨大的 CSV 文件其中有很多表和很多行如果每个数据帧包含超过 10 行我想简单地将其分成 2 个如果为 true 我希望第一个数据帧包含前 10 个数据帧其余数据帧包含在第二个数据帧中有没有一个方便的功能我环顾四周
如何在导航架构组件中实现条件导航

在新的Navigation架构组件中如何实现条件导航目前我有一个包含 LoginFragment 和 HomeFragment 的活动基于某个 login flag 我曾经从 MainActivity 中调用任一片段由于 Login
升级到Spring Security 4.0.0后出现403错误

我一直在尝试将我的项目更新到 Spring Security 4 0 0 我想我已经读过迁移指南 http docs spring io spring security site migrate current 3 to 4 html5 m
卡在从非托管 C++ 调用托管 CLI 方法的调用约定上

我正在尝试从非托管代码调用托管方法但是托管代码要求我使用 clrcall 调用约定而我的非托管 C 代码拒绝让我在不使用 clr 选项的情况下使用 clrcall 调用约定我不认为我想这样做因为非托管项目不是我可以更改为托管的正
如何在 git rebase 期间通过哈希识别冲突的提交？

当我遇到合并冲突时使用git rebase 如何确定冲突的根源就提交而言而不仅仅是文件差异我已经知道如何基本使用git mergetool or git add before git rebase continue 但有时文件之间的
梯度下降算法不会收敛

我正在尝试为斯坦福机器学习讲座中解释的梯度下降算法编写一些代码第二讲 25 00左右 http www youtube com watch v 5u4G23 OohI t 25m 下面是我最初使用的实现我认为它是从讲座中正确复制的但是

梯度下降算法不会收敛

梯度下降算法不会收敛 的相关文章

随机推荐

热门标签

梯度下降算法不会收敛的相关文章