在 TensorFlow 张量上调用 Keras 模型但保留权重

2023-11-22

In Keras 作为 TensorFlow 的简化接口：教程他们描述了如何在 TensorFlow 张量上调用 Keras 模型。

from keras.models import Sequential

model = Sequential()
model.add(Dense(32, activation='relu', input_dim=784))
model.add(Dense(10, activation='softmax'))

# this works! 
x = tf.placeholder(tf.float32, shape=(None, 784))
y = model(x)

他们还说：

注意：通过调用 Keras 模型，您可以重用其架构和权重。当您在张量上调用模型时，您将在输入张量之上创建新的 TF 操作，并且这些操作将重用模型中已存在的 TF 变量实例。

我将其解释为模型的权重在y如模型中所示。然而，对我来说，生成的 Tensorflow 节点中的权重似乎已重新初始化。下面是一个最小的例子：

import numpy as np
from keras.models import Sequential
from keras.layers import Dense
# Create model with weight initialized to 1
model = Sequential()
model.add(Dense(1, input_dim=1, kernel_initializer='ones',
                bias_initializer='zeros'))
model.compile(loss='binary_crossentropy', optimizer='adam',
              metrics=['accuracy'])

# Save the weights 
model.save_weights('file')

# Create another identical model except with weight initialized to 0
model2 = Sequential()
model2.add(Dense(1, input_dim=1, kernel_initializer='zeros',
                 bias_initializer='zeros'))
model2.compile(loss='binary_crossentropy', optimizer='adam',
               metrics=['accuracy'])
# Load the weight from the first model
model2.load_weights('file')
# Call model with Tensorflow tensor
v = tf.Variable([[1, ], ], dtype=tf.float32)
node = model2(v)
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)
print(sess.run(node), model2.predict(np.array([[1, ], ])))
# Prints (array([[ 0.]], dtype=float32), array([[ 1.]], dtype=float32))

为什么我要这样做：

我想在另一个最小化方案中使用经过训练的网络，网络“惩罚”搜索空间中不允许的位置。因此，如果您有不涉及这种特定方法的想法，我们也非常感激。

终于找到了答案。问题中的示例有两个问题。

1:

第一个也是最明显的是我称之为tf.global_variables_intializer()函数将重新初始化会话中的所有变量。相反，我应该打电话给tf.variables_initializer(var_list) where var_list是要初始化的变量列表。

2:

第二个问题是 Keras 没有使用与本机 Tensorflow 对象相同的会话。这意味着能够运行张量流对象model2(v)与我的会议sess它需要重新初始化。再次Keras 作为张量流的简化接口：教程能够提供帮助

我们应该首先创建一个 TensorFlow 会话并将其注册到 Keras。这意味着 Keras 将使用我们注册的会话来初始化它内部创建的所有变量。

import tensorflow as tf
sess = tf.Session()

from keras import backend as K
K.set_session(sess)

如果我们将这些更改应用于我的问题中提供的示例，我们将得到以下代码，该代码完全符合预期。

from keras import backend as K
from keras.models import Sequential
from keras.layers import Dense
sess = tf.Session()
# Register session with Keras
K.set_session(sess)
model = Sequential()
model.add(Dense(1, input_dim=1, kernel_initializer='ones',
                bias_initializer='zeros'))
model.compile(loss='binary_crossentropy', optimizer='adam',
              metrics=['accuracy'])
model.save_weights('test')

model2 = Sequential()
model2.add(Dense(1, input_dim=1, kernel_initializer='zeros',
                 bias_initializer='zeros'))
model2.compile(loss='binary_crossentropy', optimizer='adam',
               metrics=['accuracy'])
model2.load_weights('test')
v = tf.Variable([[1, ], ], dtype=tf.float32)
node = model2(v)
init = tf.variables_initializer([v, ])
sess.run(init)
print(sess.run(node), model2.predict(np.array([[1, ], ])))
# prints: (array([[ 1.]], dtype=float32), array([[ 1.]], dtype=float32))

结论：

教训是，在混合 Tensorflow 和 Keras 时，请确保所有内容都使用相同的会话。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

在 TensorFlow 张量上调用 Keras 模型但保留权重的相关文章

访问 AWS 上的 Tensorboard

我正在尝试访问 AWS 上的 Tensorboard 这是我的设置张量板 tensorboard host 0 0 0 0 logdir train 在端口 6006 上启动 TensorBoard b 39 您可以导航到http 172
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co

随机推荐

Apache Spark 处理倾斜数据

我有两张桌子想连接在一起其中之一的数据偏差非常严重这导致我的 Spark 作业无法并行运行因为大部分工作都是在一个分区上完成的我听过读过并尝试对我的密钥进行加盐以增加分发 https www youtube com watch v
“使用警告”与“#!/usr/bin/perl -w”有区别吗？

我读到最好use warnings 而不是放置一个 w在shebang的最后两者有什么区别警告编译指示是命令行标志 w 的替代品但编译指示仅限于封闭块而标志是全局的看佩勒克斯警告了解更多信息和内置警告类别列表 warnings文档
为什么“find . -name *.txt | xargs du -hc”给出多个总计？

我有一大堆目录我正在尝试计算其中数百个 txt 文件的总大小我尝试过这个大部分有效 find name txt xargs du hc 但最后我没有给我一个总数而是得到了几个我的猜测是管道一次只会传递这么多行 find 的输出
Cypress：存根打开窗口

在我的应用程序中有一个推荐列表单击该列表会打开一个带有动态地址的新窗口 window open shopURL blank 现在我正在尝试存根 windows open 事件如下所示https github com cypress io
如何查找AWS S3存储桶中的重复文件？

有没有办法在 Amazon S3 存储桶中递归查找重复文件在普通文件系统中我只需使用 fdupes r my directory Amazon S3 中没有查找重复项命令但是您确实执行以下操作检索一个对象列表在桶里寻找具有以
如何返回至少 4D 的数组：模拟 numpy.atleast_4d 的高效方法

numpy 提供了三个方便的例程来将数组转换为至少 1D 2D 或 3D 数组例如通过numpy atleast 3d 我需要多一维的等价物 atleast 4d 我可以想到使用嵌套 if 语句的各种方法但我想知道是否有更有效和更快的方
我可以从 PowerShell 访问我的自定义 .NET 类吗？

我对 PowerShell 和 NET 类有一些问题和疑问我正在尝试编写一个 foo 类它将调用 Rest Web 服务并执行一些任务如果我在 GAC 中部署该类那么我可以从 PowerShell 调用它吗 Try ADD TYPE
此版本的 Realm 不支持在 Realm Studio 中打开格式版本 11 的 Realm 文件

我正在使用 React Native 在此我指的是this在 React Native 中使用领域数据库的文档我可以创建react native数据库但无法在Realm Studio V3 11 0中打开它当我在工作室中打开保存的 R
使用 JavaScript 创建 HTML 文件

我正在寻找一种使用 JavaScript 函数在本地目录中创建新 HTML 文件的方法这可能吗 Thanks 客户端是的但您可能需要创建一个新的 ActiveX 对象因此浏览器只能是 IE 服务器端只需使用任何服务器端脚本语言 J
确定枚举值是否在列表中 (C#)

我正在构建一个有趣的小应用程序来确定我是否应该骑自行车上班我想测试一下是下雨还是雷雨 public enum WeatherType byte Sunny 0 Cloudy 1 Thunderstorm 2 Raining 4 Snowi
将 csv 数据加载到 Hive 表时出错

我在 hadoop 中有一个 csv 文件并且有一个 Hive 表现在我想将该 csv 文件加载到此 Hive 表中我已使用 load LOAD DATA local path to csv file 覆盖 INTO TABLE 表名
React Native，TouchableOpacity 包裹浮动按钮什么也得不到

我正在创建一个简单的操作按钮浮动按钮这是工作
如何保护dll？

如何保护我的项目的dll 使其不被其他人引用和使用 Thanks 简而言之除了显而易见的事情之外您无能为力您可能需要考虑的明显事情大致按照难度增加和合理性降低的顺序包括静态链接因此没有 DLL 可供攻击删除所有符号使用 D
javascript：带有 html 标签的 focusOffset

我有一个 contenteditable div 如下光标位置 div lorem ipsum div
Python 列表理解，具有独特的项目

有没有办法在 Python 中创建仅包含唯一项的列表理解我最初的想法是使用这样的东西 new items unicode item for item in items 然而我后来意识到我需要省略重复的项目所以我最终得到了这个丑陋的怪物
android - 如何使用 achartengine 更改图表的背景颜色

我使用 achartengine 实现了折线图但我想改变折线图的背景颜色有人建议使用以下代码来更改背景颜色 mRenderer setApplyBackgroundColor true mRenderer setBackgroundCo
用于创建尚不存在的内容的函数名称

我有时会编写一个函数如果尚不存在则只创建一些东西否则不执行任何操作名字像CreateFooIfNecessary or EnsureThereIsAFoo 做工作但他们感觉有点笨拙也可以说GetFoo 但这个名字并不意味着foo
捕获另一个表单抛出的异常

我正在尝试这样做我正在创建另一个表单它的 FormClosed 方法会抛出一个异常该异常应该由主表单捕获主要形式 try frmOptions frm new frmOptions frm ShowDialog catch Exce
循环内的 JavaScript 闭包 – 简单的实际示例

var funcs let s create 3 functions for var i 0 i lt 3 i and store them in funcs funcs i function each should log its val
在 TensorFlow 张量上调用 Keras 模型但保留权重

In Keras 作为 TensorFlow 的简化接口教程他们描述了如何在 TensorFlow 张量上调用 Keras 模型 from keras models import Sequential model Sequential m

在 TensorFlow 张量上调用 Keras 模型但保留权重

为什么我要这样做：

1:

2:

结论：

在 TensorFlow 张量上调用 Keras 模型但保留权重 的相关文章

随机推荐

热门标签

在 TensorFlow 张量上调用 Keras 模型但保留权重的相关文章