如何为解码器加载经过训练的自动编码器权重？

2024-01-05

我有一个 CNN 1d 自动编码器，它有一个密集的中央层。我想训练这个自动编码器并保存它的模型。我还想保存解码器部分，目标是：将一些中心特征（独立计算）提供给经过训练和加载的解码器，通过解码器查看这些独立计算的特征的图像是什么。

## ENCODER
encoder_input = Input(batch_shape=(None,501,1))
x  = Conv1D(256,3, activation='tanh', padding='valid')(encoder_input)
x  = MaxPooling1D(2)(x)
x  = Conv1D(32,3, activation='tanh', padding='valid')(x)
x  = MaxPooling1D(2)(x)
_x = Flatten()(x)
encoded = Dense(32,activation = 'tanh')(_x)

## DECODER (autoencoder)
y = Conv1D(32, 3, activation='tanh', padding='valid')(x)
y = UpSampling1D(2)(y)
y = Conv1D(256, 3, activation='tanh', padding='valid')(y)
y = UpSampling1D(2)(y)
y = Flatten()(y)
y = Dense(501)(y)
decoded = Reshape((501,1))(y)

autoencoder = Model(encoder_input, decoded)
autoencoder.save('autoencoder.hdf5')

## DECODER (independent)
decoder_input = Input(batch_shape=K.int_shape(x))  # import keras.backend as K
y = Conv1D(32, 3, activation='tanh', padding='valid')(decoder_input)
y = UpSampling1D(2)(y)
y = Conv1D(256, 3, activation='tanh', padding='valid')(y)
y = UpSampling1D(2)(y)
y = Flatten()(y)
y = Dense(501)(y)
decoded = Reshape((501,1))(y)

decoder = Model(decoder_input, decoded)
decoder.save('decoder.hdf5')

EDIT:

为了确保清楚，我首先需要加入encoded和第一个y，在某种意义上说y必须采取encoded作为输入。完成此操作后，我需要一种方法来加载经过训练的解码器并替换encoded具有一些新的核心功能，我将向我的解码器提供这些功能。

编辑以下答案：

我实施了建议，请参阅下面的代码

## ENCODER
encoder_input = Input(batch_shape=(None,501,1))
x  = Conv1D(256,3, activation='tanh', padding='valid')(encoder_input)
x  = MaxPooling1D(2)(x)
x  = Conv1D(32,3, activation='tanh', padding='valid')(x)
x  = MaxPooling1D(2)(x)
_x = Flatten()(x)
encoded = Dense(32,activation = 'tanh')(_x)

## DECODER (autoencoder)
encoded = Reshape((32,1))(encoded)
y = Conv1D(32, 3, activation='tanh', padding='valid')(encoded)
y = UpSampling1D(2)(y)
y = Conv1D(256, 3, activation='tanh', padding='valid')(y)
y = UpSampling1D(2)(y)
y = Flatten()(y)
y = Dense(501)(y)
decoded = Reshape((501,1))(y)

autoencoder = Model(encoder_input, decoded)
autoencoder.compile(optimizer='adam', loss='mse')
epochs = 10
batch_size = 100
validation_split = 0.2
# train the model
history = autoencoder.fit(x = training, y = training,
                    epochs=epochs,
                    batch_size=batch_size,
                    validation_split=validation_split)
autoencoder.save_weights('autoencoder_weights.h5')


## DECODER (independent)
decoder_input = Input(batch_shape=K.int_shape(encoded))  # import keras.backend as K
y = Conv1D(32, 3, activation='tanh', padding='valid', name='decod_conv1d_1')(decoder_input)
y = UpSampling1D(2, name='decod_upsampling1d_1')(y)
y = Conv1D(256, 3, activation='tanh', padding='valid', name='decod_conv1d_2')(y)
y = UpSampling1D(2, name='decod_upsampling1d_2')(y)
y = Flatten(name='decod_flatten')(y)
y = Dense(501, name='decod_dense1')(y)
decoded = Reshape((501,1), name='decod_reshape')(y)

decoder = Model(decoder_input, decoded)
decoder.save_weights('decoder_weights.h5')


encoder = Model(inputs=encoder_input, outputs=encoded, name='encoder')
features = encoder.predict(training) # features
np.savetxt('features.txt', np.squeeze(features))

predictions = autoencoder.predict(training)
predictions = np.squeeze(predictions)
np.savetxt('predictions.txt', predictions)

然后我打开另一个文件

import h5py
import keras.backend as K

def load_weights(model, filepath):
    with h5py.File(filepath, mode='r') as f:
        file_layer_names = [n.decode('utf8') for n in f.attrs['layer_names']]
        model_layer_names = [layer.name for layer in model.layers]

        weight_values_to_load = []
        for name in file_layer_names:
            if name not in model_layer_names:
                print(name, "is ignored; skipping")
                continue
            g = f[name]
            weight_names = [n.decode('utf8') for n in g.attrs['weight_names']]

            weight_values = []
            if len(weight_names) != 0:
                weight_values = [g[weight_name] for weight_name in weight_names]
            try:
                layer = model.get_layer(name=name)
            except:
                layer = None
            if layer is not None:
                symbolic_weights = (layer.trainable_weights + 
                                    layer.non_trainable_weights)
                if len(symbolic_weights) != len(weight_values):
                    print('Model & file weights shapes mismatch')
                else:
                    weight_values_to_load += zip(symbolic_weights, weight_values)

        K.batch_set_value(weight_values_to_load)

## DECODER (independent)
decoder_input = Input(batch_shape=(None,32,1))
y = Conv1D(32, 3, activation='tanh',padding='valid',name='decod_conv1d_1')(decoder_input)
y = UpSampling1D(2, name='decod_upsampling1d_1')(y)
y = Conv1D(256, 3, activation='tanh', padding='valid', name='decod_conv1d_2')(y)
y = UpSampling1D(2, name='decod_upsampling1d_2')(y)
y = Flatten(name='decod_flatten')(y)
y = Dense(501, name='decod_dense1')(y)
decoded = Reshape((501,1), name='decod_reshape')(y)

decoder = Model(decoder_input, decoded)
#decoder.save_weights('decoder_weights.h5')

load_weights(decoder, 'autoencoder_weights.h5')

# Read autoencoder
decoder.summary()

# read encoded features
features = np.loadtxt('features.txt'.format(batch_size, epochs))
features = np.reshape(features, [1500,32,1])

# evaluate loaded model on features
prediction = decoder.predict(features)



autoencoderpredictions = np.loadtxt('predictions.txt'.format(batch_size, epochs))

fig, ax = plt.subplots(5, figsize=(10,20))
for i in range(5):
        ax[i].plot(prediction[100*i], color='blue', label='Decoder')
        ax[i].plot(autoencoderpredictions[100*i], color='red', label='AE')
        ax[i].set_xlabel('Time components', fontsize='x-large')
        ax[i].set_ylabel('Amplitude', fontsize='x-large')
        ax[i].set_title('Seismogram n. {:}'.format(1500+100*i+1), fontsize='x-large')
        ax[i].legend(fontsize='x-large')
plt.subplots_adjust(hspace=1)
plt.close()

prediction and autoencoderpredictions不同意。看起来好像prediction只是很小的噪音，而autoencoder predictions具有合理的价值。

你需要：（1）保存AE（自动编码器）的权重； (2)负载权重文件； (3) 反序列化文件并仅分配那些与新模型（解码器）兼容的权重。

(1): .save确实包括权重，但有一个额外的反序列化步骤，可以通过使用来避免.save_weights反而。还，.save保存优化器状态和模型架构，后者与您的新解码器无关
(2): load_weights默认情况下尝试分配all节省了重量，但这是行不通的

下面的代码完成 (3)（以及补救措施 (2)）如下：

加载所有重量
检索加载的重量名称并将其存储在file_layer_names (list)
取回当前型号权重名称并将它们存储在model_layer_names (list)
迭代一遍file_layer_names as name; if name is in model_layer_names，将带有该名称的加载重量附加到weight_values_to_load
分配权重weight_values_to_load建模使用K.batch_set_value

请注意，这需要您nameAE 和解码器模型中的每一层并使它们匹配。可以重写此代码以在 a 中按顺序进行暴力分配try-except循环，但这既低效又容易出错。

Usage:

## omitted; use code as in question but name all ## DECODER layers as below
autoencoder.save_weights('autoencoder_weights.h5')

## DECODER (independent)
decoder_input = Input(batch_shape=K.int_shape(x))
y = Conv1D(32, 3, activation='tanh',padding='valid',name='decod_conv1d_1')(decoder_input)
y = UpSampling1D(2, name='decod_upsampling1d_1')(y)
y = Conv1D(256, 3, activation='tanh', padding='valid', name='decod_conv1d_2')(y)
y = UpSampling1D(2, name='decod_upsampling1d_2')(y)
y = Flatten(name='decod_flatten')(y)
y = Dense(501, name='decod_dense1')(y)
decoded = Reshape((501,1), name='decod_reshape')(y)

decoder = Model(decoder_input, decoded)
decoder.save_weights('decoder_weights.h5')

load_weights(decoder, 'autoencoder_weights.h5')

功能：

import h5py
import keras.backend as K

def load_weights(model, filepath):
    with h5py.File(filepath, mode='r') as f:
        file_layer_names = [n.decode('utf8') for n in f.attrs['layer_names']]
        model_layer_names = [layer.name for layer in model.layers]

        weight_values_to_load = []
        for name in file_layer_names:
            if name not in model_layer_names:
                print(name, "is ignored; skipping")
                continue
            g = f[name]
            weight_names = [n.decode('utf8') for n in g.attrs['weight_names']]

            weight_values = []
            if len(weight_names) != 0:
                weight_values = [g[weight_name] for weight_name in weight_names]
            try:
                layer = model.get_layer(name=name)
            except:
                layer = None
            if layer is not None:
                symbolic_weights = (layer.trainable_weights + 
                                    layer.non_trainable_weights)
                if len(symbolic_weights) != len(weight_values):
                    print('Model & file weights shapes mismatch')
                else:
                    weight_values_to_load += zip(symbolic_weights, weight_values)

        K.batch_set_value(weight_values_to_load)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何为解码器加载经过训练的自动编码器权重？的相关文章

在 Pandas 中，如何从基于另一个数据框的数据框中删除行？

我有 2 个数据框一个名为 USERS 另一个名为 EXCLUDE 他们都有一个名为电子邮件的字段基本上我想删除 USERS 中包含 EXCLUDE 中包含电子邮件的每一行我该怎么做您可以使用boolean indexing
使用 Python 创建 MIDI

本质上我正在尝试从头开始创建 MIDI 并将它们放到网上我对不同的语言持开放态度但更喜欢使用Python 两种语言之一如果这有什么区别的话并且想知道我应该使用哪个库提前致谢看起来这就是您正在寻找的适用于 Python 的简单
numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo

随机推荐

ASP.NET Core 3.0 Razor Pages 中的路由本地化

我想在 ASP NET Core 3 0 Razor Pages 应用程序中使用路由本地化 https stackoverflow com a 52976625 107718 https stackoverflow com a 529766
使 JPA EntityManager 会话失效

我正在开发的一个项目使用 Spring 2 5 和 JPA 并以 Hibernate 作为提供程序我的 DAO 类扩展了 JpaDaoSupport 因此我使用 getJpaTemplate 方法获取 JpaTemplate 后端数据库可
在VB6中编译DLL时出现“加载DLL时出错”

我有一个使用引用的 Visual Basic 6 dll 项目当单击文件 gt 生成 dll 选项时它应该生成一个 dll 文件好吧当单击文件 gt 生成 dll 时我收到错误加载 DLL 时出错如何查看缺少哪些参考文献
由 twine python 发布的包未出现在存储库中

我正在尝试将我的 python 包发布到私有存储库我是按照官方指南来的https packaging python org en latest tutorials packaging projects https packaging py
如何在已被 Rails 转义的正则表达式中转义 \\ ？

我试图将正则表达式存储在数据库中但它们被 Rails 转义了例如 w s s变成 w s s在数据库中以及检索时我插入尝试将它们与 mystring sub regex variable 一起使用但转义的正则表达式未按预期匹配解决
Mongodb：如何检查点是否包含在多边形中？

我有一个点数组纬度经度中某个区域的点列表我已经在这些数组上创建了一个索引现在我想知道一个点是否在该多边形内部 MongoDB 可以吗我已经尝试过这些命令但没有运气 gt polygonA 48 780809 2 307129 4
具有左右标签的 UITableViewCell 的最佳方法

我的应用程序有多个可选择的设置例如枚举值我想复制 iOS 的声音设置表视图单元格其中名称位于左侧所选值位于右侧后面是公开指示器 gt 到目前为止我的方法是创建一个自定义表格视图单元格 xib和定制UITableViewCell类
如何使用 jQuery 或纯 JS 重置所有复选框？

如何使用 jQuery 或纯 JS 重置文档中的所有复选框如果您的意思是如何从所有复选框中删除选中状态 input checkbox removeAttr checked
有没有适用于Python3的工作内存分析器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 Python 2 中有一些工具但一切似乎都已经过时了我找到了 PySizer 和 Heapy 但一
使用 LINQ 查找数组中的最小和最大日期？

我有一系列带有属性的类Date i e class Record public DateTime Date get private set void Summarize Record arr foreach var r in arr do
多少个线程太多了？

我正在编写一个服务器当收到请求时我将每个操作发送到一个单独的线程中我这样做是因为几乎每个请求都会进行数据库查询我正在使用线程池库来减少线程的构造销毁我的问题是对于这样的 I O 线程来说什么是一个好的截止点我知道这只是一个
使用新标签页替换插件打开新标签时，如何保持地址栏清晰？

我正在为 Firefox 开发一个新的标签页替换插件安装后当我单击新选项卡图标打开新选项卡时新选项卡打开正常但地址栏显示混乱的 URL 资源 firefox p at getblog dot com getblog buttons
使用字典更新 pandas DataFrame 行

我在 pandas DataFrames 中发现了我不理解的行为 df pd DataFrame np random randint 1 10 3 3 index one one two columns col1 col2 col3 new
Rails 升级到 Angular 2

我想升级现有的 Rails 和 Angular 1 x 应用程序我正在关注 ng upgrade文档 https angular io docs ts latest guide upgrade html并看到有很多依赖项包括system
WPF：TabControl 和动态 TabItem

我正在尝试使用 C 中的 WPF 为我当前的项目创建一个 GUI 我想要有选项卡在运行时动态创建并且每个选项卡应该打开一个具有相同列标题但内容不同的表我知道我可以实现这样的选项卡和表格
如何组合列表元素并找到最大组合的价格

我有一个类其中包含特定项目的详细信息如下所示 Detail class Long detailsId Integer price List
如何处理 REST API 中的更新？

我想了解一些有关使用 RESTful API 执行写入的方法的观点对于此示例假设有一个 Person 对象 id 1 name Example Person addresses id 11 friends id 21 name John
为什么 cabal 不能动态构建 mighttpd2？

GHC 当静态链接我的可执行文件时太慢所以我想使用 dynamic 选项进行测试尽管以下两个命令会导致相同的错误cabal install mighttpd2 is ok cabal install ghc options dynami
如何通过帖子链接阅读 Telegram 频道帖子的内容？

右键单击 Telegram 频道帖子时会显示帖子链接格式如下 https telegram me channel name post ID https telegram me channel name post ID 问题是我们如何使用服
如何为解码器加载经过训练的自动编码器权重？

我有一个 CNN 1d 自动编码器它有一个密集的中央层我想训练这个自动编码器并保存它的模型我还想保存解码器部分目标是将一些中心特征独立计算提供给经过训练和加载的解码器通过解码器查看这些独立计算的特征的图像是什么 ENCODE

如何为解码器加载经过训练的自动编码器权重？

如何为解码器加载经过训练的自动编码器权重？ 的相关文章

随机推荐

热门标签

如何为解码器加载经过训练的自动编码器权重？的相关文章