Python Tensorflow - 多次运行 model.fit 而不重新实例化模型

2024-02-21

背景

我正在看一个热门 YouTube 速成课程 https://youtu.be/tPYj3fFJGjk?t=12950关于机器学习。

At 3:35:50 https://youtu.be/tPYj3fFJGjk?t=12950，他提到该模型可能过度拟合，因此用更少的 epoch 再次拟合。

由于他没有重新实例化模型，这是否相当于用相同的数据拟合模型，从而继续过度训练？

我的问题

假设您已创建模型并准备好数据。

You run:

model.fit(train_images, train_labels, epochs=10)
model.fit(train_images, train_labels, epochs=8)

这相当于运行：

model.fit(train_images, train_labels, epochs=18)

Or:

model.fit(train_images, train_labels, epochs=8)

If 之前拟合的数据被覆盖 https://stackoverflow.com/questions/49841324/what-does-calling-fit-multiple-times-on-the-same-model-do,为什么跑步model.fit第二次开始时是否与前一个模型的准确性相同？

In multiple https://stackoverflow.com/questions/42666046/loading-a-trained-keras-model-and-continue-training other https://stackoverflow.com/questions/45393429/keras-how-to-save-model-and-continue-training 问题 https://stackoverflow.com/questions/51854463/is-it-possible-to-retrain-a-previously-saved-keras-model关于保存和训练模型，公认的解决方案是加载先前训练的模型，然后运行model.fit again.

如果这会覆盖预先存在的权重，那么这是否就违背了保存模型的初衷？第一次使用新数据训练模型不是等效的吗？

在多个相似的数据集上训练模型同时保持所有数据的准确性的适当方法是什么？

既然他没有重新实例化模型，那这不就相当于使用相同的数据拟合模型，从而继续过度训练它？

你是对的！为了检查在他的示例中哪个纪元数会更好，他应该再次编译网络（即再次执行上述单元）。

请记住，一般来说，每当您再次实例化模型时，它很可能会以全新的权重开始，与过去的权重完全不同（除非您手动更改）。因此，即使您保留相同数量的 epoch，您的最终精度也会根据初始权重而变化。

这两个命令等效吗？

model.fit(train_images, train_labels, epochs=10)
model.fit(train_images, train_labels, epochs=8)

and

model.fit(train_images, train_labels, epochs=18)

No.

在第一种情况下，您正在使用一些权重训练网络X检查所有训练集 10 次，然后将权重更新为某个值y。然后，您将通过所有训练集再次训练您的网络 8 次，但现在您正在使用带有权重的网络X+y.

对于第二种情况，您将使用权重通过所有训练数据训练网络 18 次X.

这不一样！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python Tensorflow - 多次运行 model.fit 而不重新实例化模型的相关文章

生成 Flask 中使用的签名会话 cookie 值

我正在用另一个需要将项目注入会话的 Flask 服务器代理 Flask 服务器两台服务器具有相同的密钥因此加密签名将相同当使用 Flask 和会话时 http 响应包含一个 Set Cookie 标头session text 其中 t
Keras model.summary() 结果 - 了解参数数量

我有一个简单的神经网络模型用于使用 Keras Theano 后端从用 python 编写的 28x28px 图像中检测手写数字 model0 Sequential number of epochs to train for nb ep
Json.dump 失败并显示“必须是 unicode，而不是 str”TypeError

我有一个 json 文件其中恰好有大量中文和日文以及其他语言字符我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
TCP打孔问题

我尝试使用 Python 3 中概述的原则为防火墙编写一个基本的 TCP 打孔器本文 http www bford info pub net p2pnat index html 不过我无法连接任何东西这是代码 usr bin pytho
如何将嵌套的Python字典转换为简单的命名空间？

假设我有一个深度为 N 的嵌套字典如何将每个内部嵌套字典转换为简单的命名空间 example input key0a test key0b key1a key2a keyNx key2b test key1b test example o
python - 将cookie添加到cookiejar

如何在 python 中创建 cookie 并将其添加到 CookieJar 实例我拥有 cookie 的所有信息名称值域路径等但我不想通过 http 请求提取新的 cookie 我尝试了这个但看起来 SimpleCookie
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时
如何向 RetrievalQA.from_chain_type 添加内存？或者，如何向 ConversationalRetrievalChain 添加自定义提示？

如何向 RetrievalQA from chain type 添加内存或者如何向 ConversationalRetrievalChain 添加自定义提示在过去的两周里我一直在尝试制作一个可以通过文档聊天的聊天机器人因此不仅仅是
Tkinter 如何根据此组合框自动更新第二个组合框

我在 Tkinter Python 中遇到了组合框更新的问题我有两个组合框组合框A with values A B C and 组合框B 我想要的是当值A在组合框中选择A然后在组合框中B显示值 1 2 3 当值B在组合框中选择A然后在
收到“/：未找到事件。”使用 PyCharm 远程调试器时

当我使用 PyCharm 通过 ssh 进行远程调试时tcsh shell 服务器很多时候它停止工作并显示未找到事件更具体地说我在 pycharm 调试控制台中遇到以下内容 ssh username hostserver 22 p
Pandas：按日历周分组，然后绘制真实日期时间的分组条形图

EDIT 我找到了一个非常好的解决方案并将其发布在下面作为答案结果将如下所示您可以为此问题生成一些示例数据 codes list ABCDEFGH dates pd Series pd date range 2013 11 01 201
在 Python 中伪造一个对象是否是类的实例

假设我有一堂课FakePerson它模仿基类的所有属性和功能RealPerson 不扩展它在Python 3中是否可以伪造isinstance 为了认识到FakePerson as a RealPerson只通过修改对象FakePers
设置字符串中单词或字符数的限制

假设我有一个字符串元素列表 wordlist hi what s up home diddle mc doo Oh wise master kakarot hello have a da 我希望列表中的每个元素最多包含 3 个单词或 20
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有
Python Pandas：向类 pandas.core.series.Series 添加方法

我想在 Python 中处理时间序列因此 Pandas 的 Series 类非常完美并且有很多有用的方法现在我想添加一些我需要但未实现的方法例如假设我有兴趣添加一个方法该方法将两次一值附加到时间序列中让我们调用该方法appen
Python Web 编程的不同方法的优缺点

我想使用 Python 编写一些服务器端脚本但我对这样做的方法有点迷失了它从 DIY CGI 方法开始似乎以一些相当强大的框架结束这些框架基本上可以自己完成所有工作中间有很多东西比如web py http webpy org P
真实值与预测值的降维可视化

我有一个数据框如下所示 label predicted F1 F2 F3 F40 major minor 2 1 4 major major 1 0 10 minor patch 4 3 23 major patch 2 1 11 min
IOError：在 Linux 上的 ReportLab 中使用 matplotlib PNG 时“解码器 zip 不可用”，适用于 Windows

我正在使用 ReportLab 打印 matplotlib 生成的图表我可以在我的 Windows 开发机器上毫无问题地执行此操作然而当我部署到 Ubuntu 服务器时渲染失败并出现所述错误我假设我缺少一个 Python 模块但

随机推荐

在我的流程中了解 NIFI 中的通知和等待流程

我是 NIFI 流程的新手在我当前的工作中我有通知和等待流程有人可以帮助我理解这个流程吗 On what basis the Notify work in my case we have 4 schema files process
获取第一行数据（如果存在于 SQLite 中）

我正在编写一个应用程序其中如果存在于 SQLite 数据库表中我需要获取第一行数据我已经编写了将数据存储到数据库中的代码但现在我想从数据库中获取第一行数据到 TextView 中助手类 Select Data public Str
Django - 在 render_change_form 中获取对象 ID (ModelAdmin)

我有这两个模型和 modeladmin 在可用主机用户列表中添加新主机时仅显示未分配给其他主机的主机用户问题是如果我编辑一个已经创建的主机它的实际主机用户 ID 也会被过滤所以我想要做的是排除当前分配的主机用户 ID 如何在从主机
Chrome 内容脚本不起作用：DOMContentLoaded 侦听器不执行

我正在尝试编写可纠正 1 个论坛上的拼写错误的扩展代码我正在尝试访问 p 标签带有内容脚本但它不会改变任何内容使用下面的代码 document addEventListener DOMContentLoaded function d
找不到“UIView”的接口声明

我正在尝试添加一个目标 C祝酒图书馆 https github com scalessec Toast到我的 xcode 项目但我收到了一些这样的错误 Cannot find interface declaration for UIVie
msiexec.exe - 嵌入

我正在使用基于云的 EDR 平台来监控客户端受感染网络上发生的进程我最近经常看到的是使用选项 Embedding 调用 msiexec exe C Windows System32 MsiExec exe Embedding 35507F
当连续输入错误时，循环中断java

当您连续两次输入随机值例如 i 时程序将终止我希望无效数据请重试和您想再玩一次吗不断重复直到输入 N 或 Y 7 8 5 No numbers match Do you want to play again i Inval
除法不返回我期望的十进制值[重复]

这个问题在这里已经有答案了可能的重复这个部门有什么问题吗 https stackoverflow com questions 704702 whats wrong with this division 如果你分2 3 它应该返回0 66
适用于 OSX 和 Windows 应用程序的 Eclipse info.plist 文件

当我寻找隐藏 Java 应用程序停靠图标的方法时我到处都看到info plist 文件这个 and info plist 文件表示但我没有看到一个我的问题是如何在 eclipse 中生成 info plist 文件它属于哪里当我导
如何在 iPhone 的导航栏中添加右栏按钮

我想在导航栏中添加一个右栏按钮项目以便单击时执行某些功能我创建了以下代码来添加右侧栏按钮项目但完成后栏按钮项目没有显示在导航栏中 void viewDidload self navigationItem rightBarButton
从文件夹中的图像序列获取 numpy 数组

我有一个文件夹比如说video1一堆按顺序排列的图像frame 00 png frame 01 png 我想要的是格式为 4D numpy 数组 number of frames w h 3 这就是我所做的但我认为它很慢有没有更快或更
在哪里可以找到图形命令 shell？

终端和 shell 非常强大但学习起来可能很复杂尤其是要充分利用它们有谁知道有一个更加基于 GUI 的命令 shell 可以帮助用户或以更友好的方式显示答案我知道 IPython 但即使它的语法也有点复杂尽管这是朝着正确方向迈出的
将片段从 GraphQL 文件导入到另一个 GraphQL 文件不起作用

我正在尝试使用 graphql 文件并传递变量来对空手道进行测试在我的 graphql 模式上我试图重用另一个 graphql 文件中的片段我尝试按照以下说明进行操作https www apollographql com docs r
为什么GetType成功时FindType却获取不到RTTI？

我正在尝试使用来抓住一个物体TRttiContext FindType QualifiedTypeName 这是我所得到的 program MissingRTTI APPTYPE CONSOLE uses System SysUtils R
我无法让 super() 在 python 2.7 中工作

通过一对简单的课程我无法获得超级工作 class A object q foo class B A q bar def init self self a super A self q a B 像这样的错误 AttributeError T
Play框架2.4：NoClassDefFoundError：play/api/cache/CachePlugin

在尝试从 Play 2 2 更新到 Play 2 4 时我遇到了这个绊脚石我还添加了 memcached2 插件但已禁用我的conf文件 Cache configuration To avoid conflict with play
在 Socket.IO 客户端断开连接时释放事件处理程序

我正在使用 Socket IO 如本示例所示 io sockets on connection function socket myService on myevent function socket emit myevent some s
Spyder - python - 安装外部包

我刚刚开始使用 python 在 Windows 中 64 位我有一个关于如何在 anaconda spyder 环境中安装外部包的基本问题据我所知对于大多数软件包可以简单地使用 conda install bunnys 但是某些
检查tomcat是否运行？ [复制]

这个问题在这里已经有答案了可能的重复 Tomcat 正在运行吗 https stackoverflow com questions 3944157 is tomcat running hi 我在虚拟机中安装了tomcat服务器我想每天检
Python Tensorflow - 多次运行 model.fit 而不重新实例化模型

背景我正在看一个热门 YouTube 速成课程 https youtu be tPYj3fFJGjk t 12950关于机器学习 At 3 35 50 https youtu be tPYj3fFJGjk t 12950 他提到该模型可能

Python Tensorflow - 多次运行 model.fit 而不重新实例化模型

背景

我的问题

Python Tensorflow - 多次运行 model.fit 而不重新实例化模型 的相关文章

随机推荐

热门标签

Python Tensorflow - 多次运行 model.fit 而不重新实例化模型的相关文章