指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？

2024-01-01

我正在构建一个基本的 seq2seq 自动编码器，但我不确定我是否做得正确。

model = Sequential()
# Encoder       
model.add(LSTM(32, activation='relu', input_shape =(timesteps, n_features ), return_sequences=True))
model.add(LSTM(16, activation='relu', return_sequences=False))
model.add(RepeatVector(timesteps))
# Decoder
model.add(LSTM(16, activation='relu', return_sequences=True))
model.add(LSTM(32, activation='relu', return_sequences=True))
model.add(TimeDistributed(Dense(n_features)))'''

然后使用批量大小参数拟合模型

model.fit(data, data,       
          epochs=30, 
          batch_size = 32)

该模型是用mse损失函数似乎可以学习。

为了获取测试数据的编码器输出，我使用 K 函数：

get_encoder_output = K.function([model.layers[0].input],
                                  [model.layers[1].output])

encoder_output = get_encoder_output([test_data])[0]

我的第一个问题是模型是否指定正确。特别是是否需要RepeatVector层。我不确定它在做什么。如果我省略它并指定前一层怎么办return_sequences = True?

我的第二个问题是我是否需要告诉get_encoder_output有关batch_size在训练中使用？

预先感谢您对任一问题的任何帮助。

This https://datascience.stackexchange.com/questions/26401/how-to-implement-one-to-many-and-many-to-many-sequence-prediction-in-keras/36196#36196可能对你有用：

作为一个玩具问题，我创建了一个 seq2seq 模型来预测不同正弦波的延续。

这是模型：

def create_seq2seq():
    features_num=5 
    latent_dim=40

    ##
    encoder_inputs = Input(shape=(None, features_num))
    encoded = LSTM(latent_dim, return_state=False ,return_sequences=True)(encoder_inputs)
    encoded = LSTM(latent_dim, return_state=False ,return_sequences=True)(encoded)
    encoded = LSTM(latent_dim, return_state=False ,return_sequences=True)(encoded)
    encoded = LSTM(latent_dim, return_state=True)(encoded)

    encoder = Model (input=encoder_inputs, output=encoded)
    ##

    encoder_outputs, state_h, state_c = encoder(encoder_inputs)
    encoder_states = [state_h, state_c]

    decoder_inputs=Input(shape=(1, features_num))
    decoder_lstm_1 = LSTM(latent_dim, return_sequences=True, return_state=True)
    decoder_lstm_2 = LSTM(latent_dim, return_sequences=True, return_state=True)
    decoder_lstm_3 = LSTM(latent_dim, return_sequences=True, return_state=True)
    decoder_lstm_4 = LSTM(latent_dim, return_sequences=True, return_state=True)

    decoder_dense = Dense(features_num)

    all_outputs = []
    inputs = decoder_inputs


    states_1=encoder_states
    # Placeholder values:
    states_2=states_1; states_3=states_1; states_4=states_1
    ###

    for _ in range(1):
        # Run the decoder on the first timestep
        outputs_1, state_h_1, state_c_1 = decoder_lstm_1(inputs, initial_state=states_1)
        outputs_2, state_h_2, state_c_2 = decoder_lstm_2(outputs_1)
        outputs_3, state_h_3, state_c_3 = decoder_lstm_3(outputs_2)
        outputs_4, state_h_4, state_c_4 = decoder_lstm_4(outputs_3)

        # Store the current prediction (we will concatenate all predictions later)
        outputs = decoder_dense(outputs_4)
        all_outputs.append(outputs)
        # Reinject the outputs as inputs for the next loop iteration
        # as well as update the states
        inputs = outputs
        states_1 = [state_h_1, state_c_1]
        states_2 = [state_h_2, state_c_2]
        states_3 = [state_h_3, state_c_3]
        states_4 = [state_h_4, state_c_4]


    for _ in range(149):
        # Run the decoder on each timestep
        outputs_1, state_h_1, state_c_1 = decoder_lstm_1(inputs, initial_state=states_1)
        outputs_2, state_h_2, state_c_2 = decoder_lstm_2(outputs_1, initial_state=states_2)
        outputs_3, state_h_3, state_c_3 = decoder_lstm_3(outputs_2, initial_state=states_3)
        outputs_4, state_h_4, state_c_4 = decoder_lstm_4(outputs_3, initial_state=states_4)

        # Store the current prediction (we will concatenate all predictions later)
        outputs = decoder_dense(outputs_4)
        all_outputs.append(outputs)
        # Reinject the outputs as inputs for the next loop iteration
        # as well as update the states
        inputs = outputs
        states_1 = [state_h_1, state_c_1]
        states_2 = [state_h_2, state_c_2]
        states_3 = [state_h_3, state_c_3]
        states_4 = [state_h_4, state_c_4]


    # Concatenate all predictions
    decoder_outputs = Lambda(lambda x: K.concatenate(x, axis=1))(all_outputs)   

    model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

    #model = load_model('pre_model.h5')


    print(model.summary()
    return (model)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

keraslayer

autoencoder

Seq2Seq

指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？的相关文章

Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
如何应用一个函数 n 次？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案假设我有一个函数它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

Webkit 必须始终在主线程上使用吗？

我试图在后台渲染网页但遇到了以下麻烦 2012 05 11 12 39 02 086 77207 1c03 An uncaught exception was raised 2012 05 11 12 39 02 087 77207 1c
在从代码库中的 dockerfile 构建的 Docker 容器中运行 Jenkins 测试

我想部署一个基于Jenkins的持续集成平台由于我有各种类型的项目 PHP Symfony node Angular 等并且我希望这些测试既可以在本地运行也可以在 Jenkins 上运行所以我正在考虑使用 Docker 容器我的目
数据库内部结构 - 从哪里开始？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案假设您想了解一些有关数据库内部结构的知识最好看的源代码是什么最好买的书前几天我和一个朋友讨论这个问
构建 Qt5 Git / Perl - 路径

我的理解能力有点问题 In the Qt Wiki http qt project org wiki Building Qt 5 from Git aea23489ce3aa9b6406ebb28e0cda430上面写着我必须 Hint 确
如何将 Delphi 调试器附加到 64 位 IIS 7.5？

我在 Windows 7 Pro 64 和 IIS 7 5 上运行 Delphi XE 开发 ISAPI 应用程序 IIS 配置正确包括允许 32 位代码在 ISAPI 进程中运行 ISAPI进程运行正常在 Delphi 中我尝试附加
Chrome Inspect - 关闭预览框架

在 Chrome 的最新更新中检查窗口 chrome inspect 有一个预览窗口在屏幕移动框架中显示网页我该如何关闭它到目前为止我所做的最接近的事情是减少宽度这样它就不会占用太多的屏幕空间图片示例您可以使用下面突出显示
Docker 镜像 - 类型。修身 vs 修身弹力 vs 弹力 vs 高山

我正在寻找一个 docker 镜像来构建一个 java 应用程序并查看可用的 OpenJDK 镜像的变体我正在看这里https github com docker library openjdk tree master 8 jdk ht
如何正确地使JSP会话失效？

所以问题就在这里当用户退出我的网站时他们仍然可以点击后退按钮并继续使用该网站为了跟踪用户是否登录我创建了一个会话属性 isActive 该属性在用户登录时设置为 true 并在注销时会话失效之前被冗余删除另外我在每个页面上检
如何替换 Web API 模型绑定的行为，以便在没有传入参数时收到一个新实例而不是 Null

我们有一个包含许多操作的 API 这些操作需要Filter目的但是当有人调用 API 方法并且不传递任何参数时我们最终会得到空引用为了避免在任何地方都必须检查这一点我们希望改变模型绑定的行为以便对于该类型它返回一个新实例而不是
OpenGL 中的透明 FrameBuffer 背景

我想使用 glClear 和 glClearColor 用包括 alpha 透明度的颜色填充帧缓冲区但是当绑定到渲染到屏幕的纹理时帧缓冲区始终呈现为不透明我希望渲染到帧缓冲区的所有内容都保持其透明度我只是想改变背景请看下面的代码
ASP.NET C# - 使用用户控件的下拉列表

我是 ASP NET 新手这个论坛中的某人帮助我如何使下拉列表与用户控件一起使用并且它正在工作在我的用户控制文件 VendorListControl ascx 中我有下面的代码请假设 VendorListControl ascx c
在 Windows 10 驱动程序中将内核空间虚拟地址映射到用户空间虚拟地址

我正在 Windows 10 64 位中编写一个内核模式驱动程序其主要目的是从 DMA 读取我想知道是否不是将内存块从内核空间复制到用户空间中分配的缓冲区我可以以某种方式向用户空间公开一个地址当然不是物理地址并节省内存复制操作
返回 foreach 循环外部 var 中存储的所有值

因此我假设某些内容正在被覆盖但我不确定如何停止此操作并检索循环外的所有值有任何想法吗 foreach gallids as gallterm postterms wp get post terms gallterm type arra
将 null 转换为任何类型

Can null被转换为任何类型即以下代码可以工作吗 public
在 DynamoDB 中对关系数据进行建模（嵌套关系）

实体模型我已阅读有关创建的 AWS 指南在 DynamoDB 中建模关系数据 https docs aws amazon com amazondynamodb latest developerguide bp modeling nosql
RabbitMQ 插件用于删除重复消息

我有一个用于生成文档的 RabbitMQ 队列基本上每个文档都有type and state 新的处理中的准备就绪所以我使用带有路由键的主题交换例如type state 每次文档更改时我都会将带有最新文档描述的消息发送到交易所
如何让 webdriver 实例在所有类文件中使用相同的实例

我是 java selenium 的新手我想使用 webdDrierSingleton 概念它将帮助我在所有类中使用单个驱动程序实例我无法获取驱动程序实例有人可以指导我如何获取它吗单例类 public class WebDrive
Visual Studio 2015。无法注册站点访问的 URL 被拒绝 IIS Express。访问被拒绝 0x80070005

我在 Visual Studio 2015 中启用了 SSL 以实现Facebook and Google本地登录我改变了项目网址 in the Web tab项目的属性https 本地主机 44300 https localhost 4
是否可以刷新“今日小部件”中的计时器？

我想知道是否可以更新今日小部件中计时器的文本标签我环顾四周但没有任何帮助是的你可以我刚刚测试过并且有效您只需将计时器添加到主运行循环 NSRunLoopCommonModes 中 RunLoop main add yourTime
指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？

我正在构建一个基本的 seq2seq 自动编码器但我不确定我是否做得正确 model Sequential Encoder model add LSTM 32 activation relu input shape timesteps n

指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？

指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？ 的相关文章

随机推荐

热门标签

指定 seq2seq 自动编码器。 RepeatVector有什么作用？批量学习对预测输出有何影响？的相关文章