FastAI lrfind()方法无法正常工作

2024-01-08

Update 1

我根据“无论坡度如何,你都希望从该点返回 10 倍”更新了我的 lr。并将其设置为 max_lr=-切片(1e-3, 1e-2)

这就是我得到的

和情节

这是什么意思?

正如您在第二张图中看到的那样

  1. 从 1e-08 开始损失就非常好,但我从未将 lr 设置为 1e-08,为什么我会看到这个?

  2. 损失在 1e-07 和 1e-04 之间上下波动,最终当 lr 在 4e-05 左右恢复时,损失飙升至近 0.05。这是什么意思?过度拟合?为什么最初当学习率约为相同值(4e-05)时,损失看起来还不错?

  3. 从批次处理/损失中,我可以看到 train_loss 和 valid_loss 结合在一起并且看起来非常好。这意味着模型训练得很好?如果训练有素,为什么会出现图 2 结尾处的突然上升?

  4. 我已经遵循了挑选正确lr的规则,为什么它不起作用?我可以断定 lr_find() 无法正常工作吗?


这是我的 lr_find() 图

然后根据它的图表,我选择了最陡的坡度部分:1e-2到1e-1作为我的lr。

这是代码:

learn.fit_one_cycle(20, max_lr=slice(1e-2,1e-1))

但这是我在训练期间得到的

这是 learn.recorder 的绘图

learn.recorder.plot_lr()
learn.recorder.plot()
learn.recorder.plot_losses()

正如您所看到的,valid_loss 周期性地变得更糟。所以我的结论是lr_find()方法不能正常工作。

我怎样才能验证它?

如果你想查看完整的代码,这里是;唯一的区别是我使用to_fp16():

learn = cnn_learner(data, models.resnet50, metrics=error_rate).to_fp16()

https://forums.fast.ai/t/train-loss-and-valid-loss-look-very-good-but-predicting-really-bad/60925 https://forums.fast.ai/t/train-loss-and-valid-loss-look-very-good-but-predicting-really-bad/60925


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

FastAI lrfind()方法无法正常工作 的相关文章

随机推荐

  • 使用睡眠并选择信号

    我想使用select 函数等待 1 秒 因为我的程序使用信号来控制东西 所以sleep 会提前返回 奇怪的是 当使用select 它也会提前返回 我这样调用 select struct timeval timeout timeout tv
  • 无法在 asp.net mvc 中使用资源文件进行本地化

    我正在开发一个 ASP NET MVC 应用程序 在我的应用程序中 我想添加一个下拉选项 供用户选择语言 我找到了使用 ASP NET MVC 的本地化文章 http www c sharpcorner com UploadFile b8e
  • 两个字符串日期与简单日期格式(如 EEE、MMM dd yyyy)进行比较

    我需要使用 SimpleDateformat 比较两个字符串日期 例如 EE MMM dd yyyy 但是当我比较它时 它只会验证第一个值 EE 仅验证其他月份 日期和年份 不会验证如果有人知道这个问题解决方案 请帮助我解决 并提前感谢所有
  • 为 python 安装 GDAL 时遇到问题

    首先我要说的是 我已经寻找了这个问题的帮助 并浏览了我发现的大量线索 但没有一个有效 或者我无法理解他们所说的要做的事情 一旦这样的线程在这里 通过 pip 安装时 Python GDAL 包缺少头文件 https stackoverflo
  • 如何将范围分配给 ssrs 2012 中的报表变量

    我是 SSRS 2012 的新手 有着使用 BusinessObjects 的悠久背景 因此有时我很难知道如何搜索正确的术语 我有一个这样的报告 其中各部分位于 tablix 中 而总计位于另一个中 这个布局是必需的 或者这会更简单一点 S
  • Swift 的 hash 和 hashValue 之间的区别

    The HashableSwift 中的协议要求您实现一个名为的属性hashValue protocol Hashable Equatable Returns the hash value The hash value is not gua
  • C语言的回文程序

    我的 C 程序是回文 其功能有错误 我的函数不是比较字符串中的 2 个字符 当我输入单个字符时 它会回答回文 但如果是两个或更多字符 则始终不是回文 Code int IntStrlength strlen StrWord int IntC
  • SQL Server TRY...CATCH 与 XACT_STATE

    我对 MSDN 文档有疑问TRY CATCH块 查看这篇文章并向下滚动到示例 C 使用 TRY CATCH 和 XACT STATE http msdn microsoft com en us library ms175976 aspx h
  • 熊猫:删除连续的重复项

    在 pandas 中仅删除连续重复项的最有效方法是什么 drop duplicates 给出 In 3 a pandas Series 1 2 2 3 2 index 1 2 3 4 5 In 4 a drop duplicates Out
  • IE8 中的 CSS 最大宽度

    对于我的输入 可以有classname half or half not placeholder value Firebug 显示两个输入都有一个固定的宽度25em input half input half not placeholder
  • 将 CSS“#”(ID)替换为 .(类)

    我有一个像这样的CSS字符串 xyz color ee2ee2 abc background color FFFFFF border color 1px solid eee def xyz border color 1px solid dd
  • 解决灾难性回溯的工具[重复]

    这个问题在这里已经有答案了 我一般要求提供一种工具或方法来查找正则表达式中导致不受控制的回溯的 热点 我对所有格匹配 否定前瞻断言 原子组等有相当好的掌握 但我面临着一种情况 不清楚我的正则表达式到底错在哪里 有问题的正则表达式是 PCRE
  • 文件搜索索引的算法问题

    有一个问题 我也有解决方案 但我无法理解解决方案 请提供一些示例并提供一些经验 Question 给定一个包含大约 3 亿个社会安全号码 9 位数字 的文件 查找文件中没有的 9 位数字 您拥有无限的驱动器空间 但只有 2MB 的 RAM
  • 如何将 Google One Tap 登录与 django-allauth 集成?

    如何将 Google One Tap 登录体验与 django allauth 集成 django allauth 是集成的 非常适合简单的用户名 密码登录 我拥有 Google OneTap 更好的用户体验 可以识别用户经过身份验证的 G
  • 从 Leaps regsubsets 获取所有模型

    我使用 regsubsets 来搜索模型 是否可以自动创建所有lm从参数选择列表中 library leaps leaps lt regsubsets y x1 x2 x3 data nbest 1 method exhaustive su
  • 如何将 json 编码的 PHP 数组转换为 Javascript 中的数组? [复制]

    这个问题在这里已经有答案了 我正在使用 AJAX 从 PHP 文件中获取 JSON 编码的数组 但在 JavaScript 中我需要将其用作数组 如何在 Javascript 中创建数组 我对 PHP 文件的 AJAX 调用 ajax ty
  • 如何在 Spinner 中选择项目并将其用作字符串?

    只是想看看我是否可以找出如何在微调器中选择项目并将其存储在字符串中 我已经看到了有关此问题的其他帖子 人们说将此行放入代码中 在我在下面发布的代码的最后一行下面 String Genders Gender getSelectedItem t
  • 将代码分配给动态创建的按钮

    我正在尝试获取一个在 Excel 用户表单上动态创建的按钮来运行名为的宏transfer我写过的Module 1我的项目的 模块 部分 下面我将迄今为止编写的代码粘贴到用户窗体中 该窗体实际上设法创建了Transfer to Sheet框架
  • “创建用户”怎么写?使用 MySQL 准备好的语句

    I tried SET user foo localhost SET pass bar SET sql CREATE USER IDENTIFIED BY PREPARE stmt FROM sql 我得到错误 ERROR 1064 420
  • FastAI lrfind()方法无法正常工作

    Update 1 我根据 无论坡度如何 你都希望从该点返回 10 倍 更新了我的 lr 并将其设置为 max lr 切片 1e 3 1e 2 这就是我得到的 和情节 这是什么意思 正如您在第二张图中看到的那样 从 1e 08 开始损失就非常