恢复 Tensorflow 中新模型子集的变量？

2024-01-18

我正在做一个通过 Tensorflow 增强（4 层 DNN 到 5 层 DNN）的示例。我在 TF 中使用保存会话和恢复来制作它，因为 TF 教程中有一个简短的段落： '例如，你可能已经训练了一个 4 层的神经网络，现在想要训练一个 5 层的新模型，将之前训练模型的 4 层的参数恢复到新模型的前 4 层。 '，tensorflow tute 的启发之处https://www.tensorflow.org/how_tos/variables/ https://www.tensorflow.org/how_tos/variables/.

然而，我发现没有人询问当检查点保存 4 层参数时如何使用“恢复”，但我们需要将其放入 5 层，从而引发危险信号。

我用真实的代码做了这个

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)
    outputs = tf.nn.softmax(outputs)
with tf.name_scope('boosting'):
    boosts = fully_connected_layer(outputs, train_data.num_classes, train_data.num_classes, tf.identity)

其中变量在“fcl1”内部（或从“fcl1”调用） - 这样我就可以使用“fcl1/Variable”和“fcl1/Variable_1”来表示权重和偏差 -“fcl2”、“fclf”和“outputl”由 saver.save 存储() 在没有“Boosting”层的脚本中。但是，由于我们现在有“增强”层，所以 saver.restore(sess, "saved_models/model_list.ckpt") 不起作用

NotFoundError: Key boosting/Variable_1 not found in checkpoint

我真的希望听到这个问题。谢谢。下面的代码是我遇到麻烦的代码的主要部分。

def fully_connected_layer(inputs, input_dim, output_dim, nonlinearity=tf.nn.relu):
    weights = tf.Variable(
        tf.truncated_normal(
            [input_dim, output_dim], stddev=2. / (input_dim + output_dim)**0.5), 
        'weights')
    biases = tf.Variable(tf.zeros([output_dim]), 'biases')
    outputs = nonlinearity(tf.matmul(inputs, weights) + biases)    

    return outputs

inputs = tf.placeholder(tf.float32, [None, train_data.inputs.shape[1]], 'inputs')
targets = tf.placeholder(tf.float32, [None, train_data.num_classes], 'targets')

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)

with tf.name_scope('error'):    
    error = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(outputs, targets))
with tf.name_scope('accuracy'):
    accuracy = tf.reduce_mean(tf.cast(
        tf.equal(tf.argmax(outputs, 1), tf.argmax(targets, 1)), 
        tf.float32))
with tf.name_scope('train'):
    train_step = tf.train.AdamOptimizer().minimize(error)

init = tf.global_variables_initializer()  
saver = tf.train.Saver()

with tf.Session() as sess:
    sess.run(init)
    saver.restore(sess, "saved_models/model.ckpt")
    print("Model restored")

    print("Optimization Starts!")
    for e in range(training_epochs):
        ...

   #Save model - save session        
    save_path = saver.save(sess, "saved_models/model.ckpt")
    ### I once saved the variables using var_list, but didn't work as well...
    print("Model saved in file: %s" % save_path)

为了清楚起见，检查点文件有

fcl1/Variable:0

fcl1/Variable_1:0

fcl2/Variable:0

fcl2/Variable_1:0

fclf/Variable:0

fclf/Variable_1:0

outputl/Variable:0

outputl/Variable_1:0

由于原始 4 层模型没有“Boosting”层。

在这种情况下，从检查点读取提升值看起来不正确，我认为这不是您想要做的。显然，您遇到了错误，因为在恢复变量时，您首先捕获模型中所有变量的列表，然后在检查点中查找相应的变量，而检查点中没有这些变量。

您可以通过定义模型变量的子集来仅恢复模型的一部分。例如，您可以使用 tf.slim 库来做到这一点。获取模型中的变量列表：

variables = slim.get_variables_to_restore()

现在，变量是张量列表，但对于每个元素，您都可以访问其名称属性。使用它，您可以指定您只想恢复除增强之外的层，例如：

variables_to_restore = [v for v in variables if v.name.split('/')[0]!='boosting'] 
model_path = 'your/model/path'

saver = tf.train.Saver(variables_to_restore)

with tf.Session() as sess:
    saver.restore(sess, model_path)

这样你的 4 层就恢复了。理论上，您可以尝试通过创建另一台服务器来尝试从检查点捕获其中一个变量的值，该服务器仅在变量列表中进行增强并从检查点重命名所选变量，但我真的不认为这是您在这里需要的。

由于这是模型的自定义层，并且您在任何地方都没有此变量，因此只需在工作流程中初始化它，而不是尝试导入它。例如，您可以通过在调用函数 full_connected 时传递此参数来执行此操作：

weights_initializer = slim.variance_scaling_initializer()

不过，您需要自己检查详细信息，因为我不确定您的导入是什么以及您在这里使用哪个函数。

一般来说，我建议您看一下 slim 库，这将使您更容易定义层的模型和范围（而不是通过 with 定义它，您可以在调用函数时传递范围参数）。它看起来像 slim：

boost = slim.fully_connected(input, number_of_outputs, activation_fn=None, scope='boosting', weights_initializer=slim.variance_scaling_initializer())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

恢复 Tensorflow 中新模型子集的变量？的相关文章

这段代码中list[:]的含义是什么？ [复制]

这个问题在这里已经有答案了这段代码来自Python的文档我有点困惑 words cat window defenestrate for w in words if len w gt 6 words insert 0 w print wo
如何计算Numpy数组中特定范围内的值？

我有一个 NumPy 值数组我想计算有多少个值在特定范围内例如 x25 我已阅读有关计数器的信息但它似乎仅对特定值有效对值范围无效我已经搜索过但没有找到任何关于我的具体问题的信息如果有人能指出我正确的文档我将不胜感激谢谢
DRF ManyToMany Field 在创建对象时出现错误

我有一个Rant模型与Category使用链接到它ManyToManyField 我已经序列化了它但问题是这个错误 categories Expected a list of items but got type str 这些是我的序列化
使用 Pandas 读取带有额外逗号且没有 quotechar 的 CSV？

Data from io import StringIO import pandas as pd s ID Level QID Text ResponseID responseText date key 375280046 S D3M Wh
加速 Numpy 数组上的循环

在我的代码中我有一个 for 循环它对多维 numpy 数组进行索引并使用每次迭代时获得的子数组进行一些操作看起来像这样 for sub in Arr do stuff using sub 现在使用完成的东西sub是完全矢量化的所
使用 pybind11 修改 std::array 的默认值

我的目标是修改在中声明的数组C struct并赋予默认值我读过了this https pybind11 readthedocs io en stable advanced cast stl html making opaque types
python-click：添加修改其他参数行为的选项

这个问题是关于click http click pocoo org 5 包裹 Click 是一个用于创建漂亮命令行的 Python 包使用尽可能少的代码以可组合的方式进行接口它是命令行界面创建工具包它具有高度可配置性但带有开箱即用
如何在 Pandas 中将多列乘以一列

我想拥有 df income 1 income 2 df mtaz proportion 返回这些列乘以df mtaz proportion 这样我就可以设置 df mtaz income 1 mtaz income 2 df income
如何在 pygame 中水平翻转图像？

这是在 pygame 如何翻转图像假设一个图像猪向右看时向左看我按向左箭头键然后保持这样即使我不按任何键或者按向上和向下箭头键那么当我按向右箭头键时如何再次将其切换回向右看并使其保持这种状态即使我不按任何键或按向上和向
如何从 google place api for python 中的地点 id 获取地点详细信息

我正在使用 Google Places API 和 Python 来构建一个食品集体智能应用程序例如周围有哪些餐馆他们的评级如何营业时间是什么等等我正在Python中执行以下操作 from googleplaces import
Python 的最佳实践：assert command() == False [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？

考虑以下DataFrame gt gt gt df pd DataFrame A 1 2 3 B abc def ghi apply A int B list gt gt gt df A B 0 1 a b c 1 2 d e f 2 3
如何在Python中比较枚举？

从 Python 3 4 开始 Enum类存在我正在编写一个程序其中一些常量具有特定的顺序我想知道哪种方式最适合比较它们 class Information Enum ValueOnly 0 FirstDerivative 1 Sec
将 pandas DataFrame 写入 unicode 中的 JSON

我正在尝试将包含 unicode 的 pandas DataFrame 写入 json 但是内置的 to json函数对字符进行转义我该如何解决 Example import pandas as pd df pd DataFrame a
我们可以限制 luigi 任务的吞吐量吗？

我们有一个 Luigi 任务它向第三方服务请求一条信息我们对该 API 调用每分钟可以执行的调用请求数量受到限制有没有办法在每个任务的基础上指定调度程序每单位时间必须运行多少个此类任务我们在任务中实施了自己的速率限制我们的 API
用python在pygame中制作一个8*8的棋盘

我想用 python 在 pygame 中制作一个棋盘只是带有 for 循环的棋盘我尝试了多种方法来做到这一点但我不知道它到底是什么这是我的代码 import pygame pygame init set color with rg
API 调用时出现 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果但收到 UnicodeEncodeError 可能是超级菜鸟问题但非常感谢任何帮助 import http client import json api key hidden connection h
Python - 函数无法在新线程中运行

我正试图杀死notepad exe使用此函数在 Windows 上进行处理 import thread wmi os print CMD Kill command called def kill c wmi WMI Commands not
如何在seaborn displot上绘制正态曲线

distplot 已被弃用取而代之的是 displot 之前的函数可以选择绘制正态曲线 import seaborn as sns import matplotlib pyplot as plt from scipy import sta
选择 matplotlib xticks 频率

我正在用字符串作为 x 标签绘制数据我想控制标签频率以免文本使轴过载在下面的示例中我只想每 3 个刻度看到一个标签 a d g j 我可以做到这一点的一种方法是每 n 个元素用 2 个空字符串替换 my xticks 元素但我确信

随机推荐

ActiveRecord：返回对象时隐藏列

是否有一种开箱即用的方法可以在返回 ActiveRecord 对象时始终隐藏删除列例如 User password 使用内置序列化您可以覆盖as json模型上的方法来传递其他默认选项 class User lt ActiveReco
如何在 Robolectric 中测试选项菜单项的可见性？

我想断言菜单项的可见性但是我的菜单项总是返回 true 我正在使用以下代码来扩充我的菜单 SherlockMenuInflater inflater new SherlockMenuInflater activity MenuBuild
simplecursoradapter textview 给出 nullpointerException

我有两个 xml 文件一个是列表视图另一个是列表视图和一些 texview 的布局我想更改第二个 xml 文件中文本视图的颜色这就是我到目前为止所做的 main1 xml
Laravel Eloquent `take` 和 `orderBy`

当我尝试使用每个 take 和 orderBy 查询时模型返回一些记录 this gt hasMany App User gt take 3 this gt hasMany App User gt orderBy id desc 但是当我
如何在CSS中制作具有透明度的径向渐变

我想在透明度变化的地方制作一个径向渐变我可以让它线性工作但不是径向工作 background webkit gradient linear left top left bottom from rgba 50 50 50 0 8 to r
具有高多边形网格的 OpenGL 3D 光线拾取

如何在包含高多边形网格的模型的 3D 场景中实现 3D 光线拾取迭代所有三角形来执行三角形线相交测试需要花费太多时间我知道存在八叉树等方法并且应该可以将这些方法用于场景中的模型但我不知道应该如何在网格级别使用这些概念但是如果您在
GWT - 如何编译移动排列

我知道如何使用延迟绑定为不同的用户代理编译 GWT 应用程序但这似乎没有提供区分桌面移动浏览器的方法除了制作基于 gwt mobile webkit 的新应用程序之外如何将现有的 GWT 应用程序转换为具有重新设计的移动界面如果您
如何使maven-compiler-plugin不隐藏错误源位置

也许有一个maven compiler plugin这个选项但我还没有找到 When javac直接运行并打印错误在消息的第一行之后它显示受影响的源行下一行上有一个插入符号指向错误位置它看起来像这样 com invariantpro
确保泛型类型在 Typescript 中仅具有原始属性

我有一个采用泛型类型的函数我需要确保该类型是 JSON 可序列化的也称为仅原始属性我的尝试是为 JSON 兼容类型定义一个接口并强制我的泛型扩展此类型 type JSONPrimitive string number boolean
如何通过按键终止 while 循环？

我正在读取串行数据并使用 while 循环写入 csv 文件我希望用户一旦觉得已经收集了足够的数据就能够终止 while 循环 while True do a bunch of serial stuff if the user press
swift 中 DispatchQueue 类型之间的区别

据我了解 Swift 中有 3 种类型的 DispatchQueue 主要连续剧主线全球并发后台线程并行工作自定义并发或串行每一个都可能有效异步或同步第一个问题主队列是否在工作仅 UI 线程并且不在另一个线程上工作如
为什么反应路由器在 vercel 上不起作用？

我正在尝试将无服务器网络发布到 vercel 我想使用react router 这在我的计算机上运行良好但是当我部署它时它不起作用有人可以帮助我吗我想在没有服务器的情况下完成 My main code import React fro
ServiceLocator 是一种反模式吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案最近我读过马克西曼的文章 http blog ploeh dk 2010 02 03 ServiceLocatorisanAnti Patte
如何在 Android 上设置 ImageView 的背景颜色？

我尝试了一些方法但没有任何效果我试图更改 Android 上 ImageView 上的背景颜色但没有任何反应这是我的 xml
CSS3“提升角”不透明度阴影

我一直在玩一些 CSS3 阴影效果我非常喜欢升角效果但在尝试向元素添加不透明度时遇到了问题我的问题是有没有办法在不透明的元素上创建升角效果 http jsfiddle net WAvZu http jsfiddle net
为什么我的 Android 应用程序在类开头使用 findViewById(R.id.******) 初始化变量时会崩溃并出现 NullPointerException？

此代码带有注释的顶部块成功运行 public class MainActivity extends AppCompatActivity EditText username EditText findViewById R id editT
多列索引还需要单列索引吗？

我陷入了一个设计不佳的系统中现在我正在他们的数据库上做DBA 我有很多像下面这样的情况伪代码 Table t1 c1 c2 c3 c4 key c1 key c2 key c1 c2 key c1 c2 c3 单列索引真的有必要吗因为
如何获取 Objective C（Foundation 框架）中命令行工具的可执行路径？

我正在尝试找出一种方法来识别 Objective C 中命令行工具的可执行路径因此如果可执行文件是 Applications Utils MyTool 则该方法将返回 Applications Utils 我正在使用基础框架称我为纯粹
Codeigniter 会话安全

如何提高会话的安全性 this gt session gt userdata userid 我一直在为我的 ajax 调用而抛弃这个小坏男孩有些情况我没有然后我就想使用 DOM 中的 id 真的安全吗如果 DOM 被更改以破解用户帐
恢复 Tensorflow 中新模型子集的变量？

我正在做一个通过 Tensorflow 增强 4 层 DNN 到 5 层 DNN 的示例我在 TF 中使用保存会话和恢复来制作它因为 TF 教程中有一个简短的段落例如你可能已经训练了一个 4 层的神经网络现在想要训练一个 5 层的

恢复 Tensorflow 中新模型子集的变量？

恢复 Tensorflow 中新模型子集的变量？ 的相关文章

随机推荐

热门标签

恢复 Tensorflow 中新模型子集的变量？的相关文章