使用 CustomCallback() 类在训练时实现冻结层

2024-04-30

我正在尝试在 TensorFlow 中训练自定义 CNN 模型。我想以某种方式在训练仍在运行时冻结特定时期模型的某些层。我已经实现了冻结层，但我必须在某些时期训练模型，然后在我想要冻结的特定层中将可训练属性更改为 False，然后编译模型，然后再次开始训练。

我尝试使用 CustomCallback() 类来实现它，并在某些时期冻结某些层，但似乎这不起作用。至于 TensorFlow 提到更改层的 .trainable 属性，那么您必须编译模型才能将更改应用于模型，但出现错误“TypeError：‘NoneType’对象不可调用” 。

这是我的代码：

加载库

import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
from keras.callbacks import ModelCheckpoint, EarlyStopping
from tensorflow.keras.utils import Sequence
from keras.models import load_model

加载数据集

#Load dataset
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.cifar10.load_data()
#Normalize
X_train, X_test = X_train/255.0, X_test/255.0

搭建模型

cnn = models.Sequential([
    
    layers.Conv2D(filters = 32, kernel_size = (1,1), padding = "same", activation = "relu", input_shape = (32,32,3)),
    layers.Conv2D(filters = 64, kernel_size = (3,3), padding = "same", activation = "relu"),
    layers.MaxPool2D(pool_size = (2,2)),
    
    layers.Conv2D(filters = 64, kernel_size = (3,3), padding = "same", activation = "relu"),
    layers.Conv2D(filters = 128, kernel_size = (5,5), padding = "same", activation = "relu"),
    layers.MaxPool2D(pool_size = (2,2)),
    
    layers.Flatten(),
    layers.Dense(64, activation = "relu"),
    layers.Dense(128, activation = "relu"),
    layers.Dense(64, activation = "relu"),
    layers.Dense(10, activation = "softmax")  
])

创建自定义回调类

class CustomCallback(tf.keras.callbacks.Callback):
    def on_epoch_begin(self, epoch, logs = None):
        if epoch == 5:
            cnn.layers[0].trainable, cnn.layers[1].trainable, cnn.layers[2].trainable = (False, False, False)
            cnn.compile(optimizer = optimizer, loss = "sparse_categorical_crossentropy", metrics = ["accuracy"])
        elif epoch == 10:
            cnn.layers[3].trainable, cnn.layers[4].trainable, cnn.layers[5].trainable = (False, False, False)
            cnn.compile(optimizer = optimizer, loss = "sparse_categorical_crossentropy", metrics = ["accuracy"])
        elif epoch == 15:
            cnn.layers[6].trainable, cnn.layers[7].trainable, cnn.layers[8].trainable = (False, False, False)
            cnn.compile(optimizer = optimizer, loss = "sparse_categorical_crossentropy", metrics = ["accuracy"])

定义优化器并编译

#Define the optimizer
optimizer = tf.keras.optimizers.Adam(learning_rate = 0.001)

#Compile the model
cnn.compile(optimizer = optimizer , loss = "sparse_categorical_crossentropy", metrics = ["accuracy"])

火车模型

results = cnn.fit(X_train, y_train, epochs = 20, validation_data = (X_test, y_test), batch_size = 1024, callbacks = [CustomCallback()])

弹出错误“TypeError: 'NoneType' object is not callable”。如果我在冻结某些层后不编译模型，它似乎不会出现错误，但在训练时所有层都会在所有时期更新。

正如所指出的，为了更改层的状态，必须重新编译模型。所以我所做的就是训练模型 5 个 epoch。我将权重保存到文件中。然后我将第 7 层设置为不可训练。然后我重新编译了模型。然后我将保存的权重加载到模型中，然后再运行 5 个 epoch。在这些时期结束时，我将重量与我加载的重量进行了比较，它们是相同的。因此，模型编译后开始的代码如下所示：

print('{0:^8s}{1:^80s}{2:^12s}'. format('Layer', 'Layer Description', 'Trainable'))
for i, layer in enumerate(cnn.layers):    
    print( '{0:^8s}{1:^80s}{2:^12s}'. format(str(i), str(layer), str(layer.trainable)))

这只是根据下面所示的打印输出给出了模型中每一层的信息

Layer                                 Layer Description                                 Trainable  
   0            <keras.layers.convolutional.Conv2D object at 0x00000261CCB7A370>            True    
   1            <keras.layers.convolutional.Conv2D object at 0x00000261E55F4700>            True    
   2            <keras.layers.pooling.MaxPooling2D object at 0x00000261E55F4970>            True    
   3            <keras.layers.convolutional.Conv2D object at 0x00000261E567B160>            True    
   4            <keras.layers.convolutional.Conv2D object at 0x00000261E567B280>            True    
   5            <keras.layers.pooling.MaxPooling2D object at 0x00000261E55F44C0>            True    
   6            <keras.layers.core.flatten.Flatten object at 0x00000261E567B700>            True    
   7              <keras.layers.core.dense.Dense object at 0x00000261E567BD30>              True    
   8              <keras.layers.core.dense.Dense object at 0x00000261E5680070>              True    
   9              <keras.layers.core.dense.Dense object at 0x00000261E56802B0>              True    
   10             <keras.layers.core.dense.Dense object at 0x00000261E56805B0>              True

然后我对模型进行了 5 个 epoch 的训练，并打印出权重和偏差代码如下

history=cnn.fit(x=train_gen,   epochs=5, verbose=1,   validation_data=valid_gen,
                   validation_steps=None,  shuffle=True,  initial_epoch=0) # train the model
weights_and_biases=cnn.layers[7].get_weights()
weights=weights_and_biases[0]
print ('shape of weights is= ',weights.shape) # has 64 nodes receiving 131072 inputs from the flatten layer
biases=weights_and_biases[1]
print ('shape of biases is- ',biases.shape)
first_10_weights=weights[0][0:10]
print (first_10_weights)
first_10_biases=biases[0:10]
print (first_10_biases)

第 5 个 epoch 结束时的权重和偏差的打印输出如下所示

shape of weights is=  (131072, 64)
shape of biases is-  (64,)
[-0.00171461 -0.00061654 -0.0004427   0.006399    0.00065272  0.00117902
  0.00206342 -0.00248441 -0.00172774  0.00399113]
[-0.0098094  -0.01114658 -0.00550008  0.00675221 -0.00647649  0.01904665
  0.0103933   0.01889692 -0.01373082  0.00189758]

然后我将权重保存到文件中。我将第 7 层的状态更改为不可训练并重新编译模型。编译后，我将保存的权重加载到模型中，并再次打印出权重和偏差，以确保它们正确加载。代码如下

filepath=r'C:\DATASETS\spiders\run1.h5' # save the weights at the end of 5 epochs to this file
cnn.save_weights(filepath, overwrite=True, save_format=None, options=None) # save the weights
cnn.layers[7].trainable=False # make layer 7 not trainable
cnn.compile(optimizer = optimizer , loss = "categorical_crossentropy", metrics = ["accuracy"]) # compile the model
cnn.load_weights(filepath, by_name=False, skip_mismatch=False, options=None) # load the model with the saved weights
weights_and_biases=cnn.layers[7].get_weights() #get the weights to make sure they are the same as at the end of epoch 5
weights=weights_and_biases[0] # print out the weights
print ('shape of weights is= ',weights.shape) # has 64 nodes receiving 131072 inputs from the flatten layer
biases=weights_and_biases[1]
print ('shape of biases is- ',biases.shape)
first_10_weights=weights[0][0:10]
print (first_10_weights)
first_10_biases=biases[0:10]
print (first_10_biases)

打印结果如下所示，符合预期

shape of weights is=  (131072, 64)
shape of biases is-  (64,)
[-0.00171461 -0.00061654 -0.0004427   0.006399    0.00065272  0.00117902
  0.00206342 -0.00248441 -0.00172774  0.00399113]
[-0.0098094  -0.01114658 -0.00550008  0.00675221 -0.00647649  0.01904665
  0.0103933   0.01889692 -0.01373082  0.00189758]

然后我又训练了 5 个 epoch。在这些 epoch 结束时，我打印出了不应该改变的第 7 层权重。代码如下所示

history=cnn.fit(x=train_gen,   epochs=5, verbose=1,   validation_data=valid_gen,
                   validation_steps=None,  shuffle=True,  initial_epoch=0) # train the model
weights_and_biases=cnn.layers[7].get_weights()
weights=weights_and_biases[0]
print ('shape of weights is= ',weights.shape) # has 64 nodes receiving 131072 inputs from the flatten layer
biases=weights_and_biases[1]
print ('shape of biases is- ',biases.shape)
first_10_weights=weights[0][0:10]
print (first_10_weights)
first_10_biases=biases[0:10]
print (first_10_biases)

下面显示的打印结果显示权重和偏差没有改变

shape of weights is=  (131072, 64)
shape of biases is-  (64,)
[-0.00171461 -0.00061654 -0.0004427   0.006399    0.00065272  0.00117902
  0.00206342 -0.00248441 -0.00172774  0.00399113]
[-0.0098094  -0.01114658 -0.00550008  0.00675221 -0.00647649  0.01904665
  0.0103933   0.01889692 -0.01373082  0.00189758]

所以这个过程就是构建和编译你的模型。运行 N 个 epoch。将权重保存到文件中。然后更改各层的训练状态。重新编译模型。加载保存的权重。继续训练。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 CustomCallback() 类在训练时实现冻结层的相关文章

如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
ctypes 错误：libdc1394 错误：无法初始化 libdc1394

我正在尝试将程序编译为共享库我可以使用 ctypes 在 Python 代码中使用该库使用以下命令该库可以正常编译 g shared Wl soname mylib O3 o mylib so fPIC files pkg config
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www

随机推荐

如何重定向到另一个 URI 并访问先前 modelAndView 中的对象

我有以下代码我想访问 nextPage jsp 上的 booleanValueObj 这是怎么做到的该对象并不总是可用于每个请求的 nextPage 方法因此 requestParam 似乎不合适 RequestMapping met
NDK 对静态库中函数的未定义引用

因此我尝试在 Android 应用程序的本机代码上使用 libopus 我的 Android mk 文件如下所示 PLATFORM PREFIX opt android ext LOCAL PATH PLATFORM PREFIX lib
嵌入函数和克隆链接函数到底是做什么的？

来自指令 Angular 文档 http docs angularjs org guide directive 我看到compile函数有3个参数其中之一是transclude 文档提供的唯一解释是 transclude 嵌入链接函数 f
NullInjectorError：没有 InjectionToken angularfire2.app.options 的提供者！ 2021年

好吧我刚刚开始使用 Angular Firebase 我已经挠头两天了大多数教程主要针对旧版本的 firebase 这是我将身份验证服务注入组件时收到的错误 Uncaught in promise NullInjectorError R
AngularJS - 使用 Angular-UI Typeahead 时出现“错误：模板必须只有一个根元素”

我在用着AngularUI 提前输入 http angular ui github io bootstrap typeahead 在我的应用程序的索引页面上我没有做任何花哨的事情事实上我只是想让他们在 UI 网站上发布的示例正常工
C# - 将指向 sockaddr 结构的 IntPtr 转换为 IPAddress

从 P Invoked 本机函数中我得到一个IntPtr http msdn microsoft com en us library system intptr aspx它指向一个sockaddr http msdn microsoft
带有 ManyToMany 字段和 500,000 个对象的 Django 表单超时

假设我有一个名为 Client 的模型和一个名为 PhoneNumbers 的模型 class PhoneNumbers models Model number forms IntegerField class Client models
使用 Alamofire 获取 JSON 并解码 - Swift 4

我有一个 API 我也想获取请求但我尝试使用 JSONDecoder 来转换数据类型但失败了我不知道如何像下面的数据一样解码这个 Json 我要拿json 响应设置我的用户结构的内容对我有什么建议吗谢谢错误域 NSCocoaE
如何自定义 MPMoviePlayerController 背景和行为的进度条？

因为我是新人所以我还不能发布图片所以我必须画图 Done Loading
按顺序范围循环映射

我正在寻找一种确定的方法来范围Go map为了 Go 规范 https golang org ref spec For statements陈述如下映射的迭代顺序未指定并且不保证从一次迭代到下一次迭代的顺序相同如果在迭代过程中删除尚未
Django ORM：查看一个模型在另一个模型中是否没有外键条目

所以我有这两个模型 class Site models Model 和另一个 class SiteInfo models Model site models ForeignKey Site 有没有办法获取 SiteInfo 中没有条目的站
如何通过 FHIR REST api (HAPI) 添加配置文件

我查看了为 FHIR 创建配置文件的文档并且使用 Forge 创建了一些我认为对于描述配置文件有效的 xml 我在文档中找不到实际说明我需要向 RESTful api 发出什么请求才能实际添加新配置文件有任何想法吗您当然可以通过以下方
我应该在 HTML 中添加什么内容来确保用户获得我的页面的最新版本，而不是旧版本？

我有一个主要由 CDN 提供服务的静态 HTML 网站加上一些到服务器的 AJAX 并且确实希望用户的浏览器缓存所有内容直到我更新任何文件然后我希望用户的浏览器获取新版本对于我网站上的所有类型的静态文件 HTML JS CSS 图像
HTTP 请求未经客户端身份验证方案“Ntlm”的授权从服务器收到的身份验证标头为“NTLM”

我知道有很多与此类似的问题但我找不到针对这一特定问题的问题首先有几点 I have 无控制通过我们的 Sharepoint 服务器我无法调整任何 IIS 设置我相信我们的IIS服务器版本是IIS 7 0 我们的 Sharepoint
为什么我的 PlayFramework 应用程序出现很长的超时？

我已经创建了一个工作应用程序但有时当我更改内容并点击浏览器中的重新加载按钮时该应用程序会永远超时 300000 毫秒或5分钟之后我在浏览器中得到以下异常 java util concurrent TimeoutException
分段错误（核心转储），执行线程

我试图在 python 中运行一个程序该程序打开一个程序并从其标准输出中读取当我运行程序代码时出现分段错误错误但是当我将代码放入函数 Myfunc 中的线程外时它可以正常工作我不明白发生了什么这是我的代码 class Work
在 R Markdown 文件中嵌入 pdf 并调整分页

我即将完成博士学位我需要在 R Markdown 文本中间的某个位置嵌入一些论文 pdf 格式将 R Markdown 转换为 PDF 时我希望将这些 PDF 论文嵌入到转换中但是我希望这些 PDF 论文也根据 Markdown
获取通过discord.js选项传递的值

const data new SlashCommandBuilder gt command setName info setDescription addStringOption option gt option setName steam
JavaFX 使用动画最小化和最大化未装饰的舞台

我在这个问题中使用已接受的答案 JavaFX 最小化未修饰的阶段 https stackoverflow com questions 26972683 javafx minimizing undecorated stage正确最小化我的应用
使用 CustomCallback() 类在训练时实现冻结层

我正在尝试在 TensorFlow 中训练自定义 CNN 模型我想以某种方式在训练仍在运行时冻结特定时期模型的某些层我已经实现了冻结层但我必须在某些时期训练模型然后在我想要冻结的特定层中将可训练属性更改为 False 然后编译模型

使用 CustomCallback() 类在训练时实现冻结层

使用 CustomCallback() 类在训练时实现冻结层 的相关文章

随机推荐

热门标签

使用 CustomCallback() 类在训练时实现冻结层的相关文章