设置 Keras 模型可训练与使每一层可训练之间有什么区别

2023-12-13

我有一个由一些密集层组成的 Keras 顺序模型。我将整个模型的可训练属性设置为 False。但我看到各个层的可训练属性仍然设置为 True。我是否需要将图层的可训练属性也单独设置为 False？那么将整个模型的trainable属性设置为False有什么意义呢？

为了能够回答这个问题，您需要查看 Keras 的源代码，这样做后您可能会感到惊讶，因为您会意识到：

The Sequential class 是一个子类 of Model类，以及
the Model class 是一个子类 of Network类，以及
the Network class 是一个子类 of Layer class!

正如我所说，Keras 模型源自 Keras 层，这可能有点令人惊讶。但如果你进一步思考，你会发现它是合理的，因为它们有很多共同的功能（例如，两者都获取一些输入，对它们进行一些计算，产生一些输出，并更新它们的内部权重/参数）。它们的共同属性之一是trainable属性。现在当你设置trainable的财产model as False它会skip权重更新步骤。换句话说，它不检查trainable其底层的属性；相反，首先它检查自己的 trainable属性（更准确地说是Network类），如果是False更新被跳过。因此，这并不意味着它的底层有它们的trainable属性设置为False以及。不这样做有一个很好的理由：层的单个实例可以在多个模型中使用。例如，考虑以下两个具有共享层的模型：

inp = Input(shape=...)

shared_layer = Dense(...)
sout = shared_layer(inp)

m1_out = Dense(...)(sout)
m2_out = Dense(...)(sout)

model1 = Model(inp, m1_out)
model2 = Model(inp, m2_out)

现在如果我们设置model1.trainable = False，这会冻结整个model1（即训练model1不更新其底层的权重，包括shared_layer）；但是，那shared_layer和model2 仍然可以训练（即训练model2将更新其所有层的权重，包括shared_layer）。另一方面，如果我们设置model1.layers[1].trainable = False，那么shared_layer被冻结，因此在训练时其权重也不会更新model1 or model2。这样你就可以拥有更多的控制权和灵活性，因此你可以构建更复杂的架构（例如 GAN）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

设置 Keras 模型可训练与使每一层可训练之间有什么区别的相关文章

生成 Flask 中使用的签名会话 cookie 值

我正在用另一个需要将项目注入会话的 Flask 服务器代理 Flask 服务器两台服务器具有相同的密钥因此加密签名将相同当使用 Flask 和会话时 http 响应包含一个 Set Cookie 标头session text 其中 t
使用 glGetFloatv 检索 pyglet 中的模型视图矩阵

我正在使用 pyglet 在 python 中进行 3D 可视化并且需要检索模型视图和投影矩阵来进行一些选择我使用以下方式定义我的窗口 from pyglet gl import from pyglet window import wi
将数字转换为整数列表[重复]

这个问题在这里已经有答案了我该如何写magic下面的函数 gt gt gt num 123 gt gt gt lst magic num gt gt gt gt gt gt print lst type lst 1 2 3
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
python - 将cookie添加到cookiejar

如何在 python 中创建 cookie 并将其添加到 CookieJar 实例我拥有 cookie 的所有信息名称值域路径等但我不想通过 http 请求提取新的 cookie 我尝试了这个但看起来 SimpleCookie
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时
如何打印和显示子进程 stdout 和 stderr 输出而不失真？

也许有人可以帮助我解决这个问题我在 SO 上看到了许多与此类似的问题但没有一个问题同时处理标准输出和标准错误也没有处理像我这样的情况因此出现了这个新问题我有一个 python 函数它打开一个子进程等待它完成然后输出返回代码以
如何向 RetrievalQA.from_chain_type 添加内存？或者，如何向 ConversationalRetrievalChain 添加自定义提示？

如何向 RetrievalQA from chain type 添加内存或者如何向 ConversationalRetrievalChain 添加自定义提示在过去的两周里我一直在尝试制作一个可以通过文档聊天的聊天机器人因此不仅仅是
如何使用 selenium 获取 javascript 结果？

我有以下代码 from selenium import selenium selenium selenium localhost 4444 chrome http some site com selenium start sel selen
如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴？

我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中用户通过将第二个轴添加到与标
如何使用 PyAudio 选择特定的输入设备

通过 PyAudio 录制音频时如何指定要使用的确切输入设备我的电脑有两个麦克风一个内置一个通过 USB 我想使用 USB 麦克风进行录音这流类 https people csail mit edu hubert pyaudio
Pandas：按日历周分组，然后绘制真实日期时间的分组条形图

EDIT 我找到了一个非常好的解决方案并将其发布在下面作为答案结果将如下所示您可以为此问题生成一些示例数据 codes list ABCDEFGH dates pd Series pd date range 2013 11 01 201
使用神经网络包进行多项分类

这个问题应该很简单但文档没有帮助我正在使用 R 我必须使用neuralnet多项式分类问题的包所有示例均针对二项式或线性输出我可以使用二项式输出进行一些一对一的实现但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点其中
在 Python 中伪造一个对象是否是类的实例

假设我有一堂课FakePerson它模仿基类的所有属性和功能RealPerson 不扩展它在Python 3中是否可以伪造isinstance 为了认识到FakePerson as a RealPerson只通过修改对象FakePers
设置字符串中单词或字符数的限制

假设我有一个字符串元素列表 wordlist hi what s up home diddle mc doo Oh wise master kakarot hello have a da 我希望列表中的每个元素最多包含 3 个单词或 20
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有
float() 参数必须是字符串或数字，而不是“时间戳”

我无法使 scilearn 与日期时间系列一起工作找到了这篇文章但对我没有帮助 Pandas 类型错误 float 参数必须是字符串或数字 https stackoverflow com questions 41256626 panda
Python Web 编程的不同方法的优缺点

我想使用 Python 编写一些服务器端脚本但我对这样做的方法有点迷失了它从 DIY CGI 方法开始似乎以一些相当强大的框架结束这些框架基本上可以自己完成所有工作中间有很多东西比如web py http webpy org P
如何继承并重写 django 模型类来创建 listOfStringsField？

我想为 django 模型创建一个新类型的字段它基本上是一个 ListOfStrings 因此在您的模型代码中您将具有以下内容模型 py from django db import models class ListOfString

随机推荐

使用 Java 配置在 Spring 中重定向 404 错误

如您所知在 XML 中配置方法是
Java 对象的“相同性”是如何定义的？

我想将自定义类型的对象添加到集合中我有几个相同的即它们的公共变量具有相同的值我不希望将同一对象的多个实例添加到集合中但每次创建新对象时总是会添加它这是因为 Object 类的 equals 方法在对象上实现了最具辨别力的可能
禁用线性布局内的所有编辑文本

我正在尝试禁用线性布局内的所有字段该线性布局中有许多 edittext 和 textview 但是我只是想禁用 edittext 我能够禁用所有孩子但我希望能够禁用编辑文本有什么办法可以做到这一点吗 Where ll是你的线性布局
编写自定义函数时将列名称传递给 dplyr::coalesce()

我正在尝试编写一个将包装的函数dplyr coalesce 并将接受数据对象和列名称来合并到目前为止我的尝试都失败了示例数据 library dplyr df lt data frame col a c bob NA bob NA b
AppSync S3对象检索

我的文件目前正在根据提供的教程上传到 s3 存储桶我有一个 Post 类型其文件字段指向 S3Object S3Object 具有bucket key 和region 的值我想允许我的用户下载他们上传的文件但我无法通过查询访问发布
覆盖 SaveChanges 并设置 ModifiedDate，但如何设置 ModifiedBy？

我有一个 ASP NET MVC3 Web 应用程序包含 UI 业务实体和数据 DbContext 层我正在使用 Entity Framework 4 1 Code First 现在我正在推翻DbContext SaveChang
是否有人有批处理文件来应用并在 Clearcase 中创建标签或基线

这里我需要一个批处理文件它可以应用并创建标签或基线到透明案例项目中的版本化元素如果有人有这个请提供给我如果要创建 UCM 基线则无需先创建标签只需进入您的视图并设置基线 cd m myView myVob myRootCompo
使用 android MediaPlayer 进行无缝播放

我试图连续重复播放音频没有任何间隙我试过了 mediaplayer setLooping true 但它给出了重复时间之间的差距并尝试了这个 mediaplayer setOnCompletionListener new MediaP
@keyframes 不支持阿拉伯语

我尝试用 keyframes 用阿拉伯语写一个句子但 keyframes 不支持阿拉伯语并且出现难以理解的字符 caption background color black caption h1 after animation move
使用 JavaFX 11 的自定义 JRE

我正在使用 JDK 11 和 JavaFX 11 我使用 Jlink 为示例 FX 模块程序创建了一个自定义 JRE 但是当我尝试使用自定义 JRE 运行时它会呈现如下错误这就是我创建自定义 JRE 的方式没有错误 jlink mod
jQuery 只允许数字、字母和连字符

如何使用 jQuery 从字符串中删除除数字字母和连字符之外的所有内容我发现这段代码只允许使用字母数字字符但我不确定如何添加连字符 text keypress function e var regex new RegExp a zA
FullCalendar 在周末和无周末之间切换

我想知道 Arshaw 的 FullCalendar 是否有办法 1 将日历从显示周末更改为不显示周末反之亦然 2 动态地将时隙间隔从30分钟更改为60分钟换句话说我想做的是 Clicking the button that show
使用 JDBC 连接 Mysql 时出现 ClassNotFoundException

当我尝试在命令行运行简单的 Java JDBC 程序时出现以下错误 Exception in thread main java lang NoClassDefFoundError LoadDriver java Caused by jav
将元组转换为字符串

自从我发现boost lexical cast所有转换都轻而易举直到尝试将元组元素转换为字符串 Like Int2String or Double2String I want 一种从任意数量元素的元组生成单个字符串的方法由于转换的主题具
Git checkout 无意中删除了未跟踪的文件

我遇到过 Git 的一个奇怪的行为我有一个存储库其中包含在 gitignore file 我所做的具体步骤隐藏 4 个文件 git stash 查看了几个月前我的第一次提交 git checkout
Alamofire 5 逃避向前斜线

在过去的几天里我一直在谷歌上搜索并尝试有关 alamofire 前斜杠的自动转义其中 path image png 变为 path image png 然而如果您使用 swiftyJson 通过 httpBody 发送或使用 Alam
在Python中有效地检查字符串是否由一个字符组成

检查字符串是否有效的方法是什么s在Python中只包含一个字符比如说 A 就像是all equal s A 其行为如下 all equal AAAAA A True all equal AAAAAAAAAAA A True all equ
为什么 -moz-animation 不起作用？

以下 CSS 在 Webkit 中运行良好没有在 Opera 中检查过但我知道它在 Firefox 中不起作用有人能告诉我为什么吗正确的类肯定会应用到我的 HTML 用 Firebug 检查它我确实看到了 moz animatio
异步登录龙卷风

我使用 Tornado 创建了一个适用于同步方法的登录页面现在我想将其设为异步那么我应该对以下代码进行哪些更改 import tornado ioloop import tornado web import http import ti
设置 Keras 模型可训练与使每一层可训练之间有什么区别

我有一个由一些密集层组成的 Keras 顺序模型我将整个模型的可训练属性设置为 False 但我看到各个层的可训练属性仍然设置为 True 我是否需要将图层的可训练属性也单独设置为 False 那么将整个模型的trainable属性设置为

设置 Keras 模型可训练与使每一层可训练之间有什么区别

设置 Keras 模型可训练与使每一层可训练之间有什么区别 的相关文章

随机推荐

热门标签

设置 Keras 模型可训练与使每一层可训练之间有什么区别的相关文章