FastAI lrfind()方法无法正常工作

2024-01-08

Update 1

我根据“无论坡度如何，你都希望从该点返回 10 倍”更新了我的 lr。并将其设置为 max_lr=-切片(1e-3, 1e-2)

这就是我得到的

和情节

这是什么意思？

正如您在第二张图中看到的那样

从 1e-08 开始损失就非常好，但我从未将 lr 设置为 1e-08，为什么我会看到这个？
损失在 1e-07 和 1e-04 之间上下波动，最终当 lr 在 4e-05 左右恢复时，损失飙升至近 0.05。这是什么意思？过度拟合？为什么最初当学习率约为相同值（4e-05）时，损失看起来还不错？
从批次处理/损失中，我可以看到 train_loss 和 valid_loss 结合在一起并且看起来非常好。这意味着模型训练得很好？如果训练有素，为什么会出现图 2 结尾处的突然上升？
我已经遵循了挑选正确lr的规则，为什么它不起作用？我可以断定 lr_find() 无法正常工作吗？

这是我的 lr_find() 图

然后根据它的图表，我选择了最陡的坡度部分：1e-2到1e-1作为我的lr。

这是代码：

learn.fit_one_cycle(20, max_lr=slice(1e-2,1e-1))

但这是我在训练期间得到的

这是 learn.recorder 的绘图

learn.recorder.plot_lr()
learn.recorder.plot()
learn.recorder.plot_losses()

正如您所看到的，valid_loss 周期性地变得更糟。所以我的结论是lr_find()方法不能正常工作。

我怎样才能验证它？

如果你想查看完整的代码，这里是；唯一的区别是我使用to_fp16():

learn = cnn_learner(data, models.resnet50, metrics=error_rate).to_fp16()

https://forums.fast.ai/t/train-loss-and-valid-loss-look-very-good-but-predicting-really-bad/60925 https://forums.fast.ai/t/train-loss-and-valid-loss-look-very-good-but-predicting-really-bad/60925

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

Pytorch

fastai

FastAI lrfind()方法无法正常工作的相关文章

caret::train：为 mlpWeightDecay（RSNNS 包）指定更多非调整参数

我在使用插入符号包和 RSNNS 包中的 mlpWeightDecay 方法指定学习率时遇到问题 mlpWeightDecay 的调整参数是大小和衰减将大小保持为 4 并在 c 0 0 0001 0 001 0 002 上调整衰减的示例
Altair 中具有自定义置信区间的折线图

假设我有下面的数据框我检查了文档 https altair viz github io gallery line with ci html但它仅基于单个列可重现的代码 x np random normal 100 5 100 data
Tensorflow：np数组的next_batch函数

我的火车数据为 xTrain numpy asarray 100 1 5 6 yTrain numpy asarray 200 2 10 12 如何定义 next batch size 方法以从训练数据中获取随机元素的 size 个数您可
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
Java机器学习库可以商用吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有谁知道我可以将其用于商业产品的优秀 Java 机器学习库吗不幸的是 Weka 和 Rapidmin
在提供给 sklearn 管道中的分类器之前获取所选特征的名称和数量

我在用sel SelectFromModel ExtraTreesClassifier 10 threshold mean 选择我的数据集中最重要的特征然后我想将这些选定的特征提供给我的 keras 分类器但是我的基于 keras 的神
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in

随机推荐

使用睡眠并选择信号

我想使用select 函数等待 1 秒因为我的程序使用信号来控制东西所以sleep 会提前返回奇怪的是当使用select 它也会提前返回我这样调用 select struct timeval timeout timeout tv
无法在 asp.net mvc 中使用资源文件进行本地化

我正在开发一个 ASP NET MVC 应用程序在我的应用程序中我想添加一个下拉选项供用户选择语言我找到了使用 ASP NET MVC 的本地化文章 http www c sharpcorner com UploadFile b8e
两个字符串日期与简单日期格式（如 EEE、MMM dd yyyy）进行比较

我需要使用 SimpleDateformat 比较两个字符串日期例如 EE MMM dd yyyy 但是当我比较它时它只会验证第一个值 EE 仅验证其他月份日期和年份不会验证如果有人知道这个问题解决方案请帮助我解决并提前感谢所有
为 python 安装 GDAL 时遇到问题

首先我要说的是我已经寻找了这个问题的帮助并浏览了我发现的大量线索但没有一个有效或者我无法理解他们所说的要做的事情一旦这样的线程在这里通过 pip 安装时 Python GDAL 包缺少头文件 https stackoverflo
如何将范围分配给 ssrs 2012 中的报表变量

我是 SSRS 2012 的新手有着使用 BusinessObjects 的悠久背景因此有时我很难知道如何搜索正确的术语我有一个这样的报告其中各部分位于 tablix 中而总计位于另一个中这个布局是必需的或者这会更简单一点 S
Swift 的 hash 和 hashValue 之间的区别

The HashableSwift 中的协议要求您实现一个名为的属性hashValue protocol Hashable Equatable Returns the hash value The hash value is not gua
C语言的回文程序

我的 C 程序是回文其功能有错误我的函数不是比较字符串中的 2 个字符当我输入单个字符时它会回答回文但如果是两个或更多字符则始终不是回文 Code int IntStrlength strlen StrWord int IntC
SQL Server TRY...CATCH 与 XACT_STATE

我对 MSDN 文档有疑问TRY CATCH块查看这篇文章并向下滚动到示例 C 使用 TRY CATCH 和 XACT STATE http msdn microsoft com en us library ms175976 aspx h
熊猫：删除连续的重复项

在 pandas 中仅删除连续重复项的最有效方法是什么 drop duplicates 给出 In 3 a pandas Series 1 2 2 3 2 index 1 2 3 4 5 In 4 a drop duplicates Out
IE8 中的 CSS 最大宽度

对于我的输入可以有classname half or half not placeholder value Firebug 显示两个输入都有一个固定的宽度25em input half input half not placeholder
将 CSS“#”（ID）替换为 .（类）

我有一个像这样的CSS字符串 xyz color ee2ee2 abc background color FFFFFF border color 1px solid eee def xyz border color 1px solid dd
解决灾难性回溯的工具[重复]

这个问题在这里已经有答案了我一般要求提供一种工具或方法来查找正则表达式中导致不受控制的回溯的热点我对所有格匹配否定前瞻断言原子组等有相当好的掌握但我面临着一种情况不清楚我的正则表达式到底错在哪里有问题的正则表达式是 PCRE
文件搜索索引的算法问题

有一个问题我也有解决方案但我无法理解解决方案请提供一些示例并提供一些经验 Question 给定一个包含大约 3 亿个社会安全号码 9 位数字的文件查找文件中没有的 9 位数字您拥有无限的驱动器空间但只有 2MB 的 RAM
如何将 Google One Tap 登录与 django-allauth 集成？

如何将 Google One Tap 登录体验与 django allauth 集成 django allauth 是集成的非常适合简单的用户名密码登录我拥有 Google OneTap 更好的用户体验可以识别用户经过身份验证的 G
从 Leaps regsubsets 获取所有模型

我使用 regsubsets 来搜索模型是否可以自动创建所有lm从参数选择列表中 library leaps leaps lt regsubsets y x1 x2 x3 data nbest 1 method exhaustive su
如何将 json 编码的 PHP 数组转换为 Javascript 中的数组？ [复制]

这个问题在这里已经有答案了我正在使用 AJAX 从 PHP 文件中获取 JSON 编码的数组但在 JavaScript 中我需要将其用作数组如何在 Javascript 中创建数组我对 PHP 文件的 AJAX 调用 ajax ty
如何在 Spinner 中选择项目并将其用作字符串？

只是想看看我是否可以找出如何在微调器中选择项目并将其存储在字符串中我已经看到了有关此问题的其他帖子人们说将此行放入代码中在我在下面发布的代码的最后一行下面 String Genders Gender getSelectedItem t
将代码分配给动态创建的按钮

我正在尝试获取一个在 Excel 用户表单上动态创建的按钮来运行名为的宏transfer我写过的Module 1我的项目的模块部分下面我将迄今为止编写的代码粘贴到用户窗体中该窗体实际上设法创建了Transfer to Sheet框架
“创建用户”怎么写？使用 MySQL 准备好的语句

I tried SET user foo localhost SET pass bar SET sql CREATE USER IDENTIFIED BY PREPARE stmt FROM sql 我得到错误 ERROR 1064 420
FastAI lrfind()方法无法正常工作

Update 1 我根据无论坡度如何你都希望从该点返回 10 倍更新了我的 lr 并将其设置为 max lr 切片 1e 3 1e 2 这就是我得到的和情节这是什么意思正如您在第二张图中看到的那样从 1e 08 开始损失就非常

FastAI lrfind()方法无法正常工作

FastAI lrfind()方法无法正常工作 的相关文章

随机推荐

热门标签

FastAI lrfind()方法无法正常工作的相关文章