如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

2024-05-18

我正在尝试使用 tf.contrib.seq2seq 模块对某些数据（仅 float32 向量）进行预测，但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译，因此用于嵌入。

我正在努力准确理解 tf.contrib.seq2seq.Helper 为 Seq2Seq 架构所做的事情以及如何在我的案例中使用 CustomHelper。

这就是我现在所做的：

import tensorflow as tf 
from tensorflow.python.layers import core as layers_core

input_seq_len = 15 # Sequence length as input
input_dim = 1 # Nb of features in input

output_seq_len = forecast_len = 20 # horizon length for forecasting
output_dim = 1 # nb of features to forecast


encoder_units = 200 # nb of units in each cell for the encoder
decoder_units = 200 # nb of units in each cell for the decoder

attention_units = 100

batch_size = 8


graph = tf.Graph()
with graph.as_default():

    learning_ = tf.placeholder(tf.float32)

    with tf.variable_scope('Seq2Seq'):

        # Placeholder for encoder input
        enc_input = tf.placeholder(tf.float32, [None, input_seq_len, input_dim])

        # Placeholder for decoder output - Targets
        target = tf.placeholder(tf.float32, [None, output_seq_len, output_dim])


        ### BUILD THE ENCODER

        # Build RNN cell
        encoder_cell = tf.nn.rnn_cell.BasicLSTMCell(encoder_units)

        initial_state = encoder_cell.zero_state(batch_size, dtype=tf.float32)

        # Run Dynamic RNN
        #   encoder_outputs: [batch_size, seq_size, num_units]
        #   encoder_state: [batch_size, num_units]
        encoder_outputs, encoder_state = tf.nn.dynamic_rnn(encoder_cell, enc_input, initial_state=initial_state)

        ## Attention layer

        attention_mechanism_bahdanau = tf.contrib.seq2seq.BahdanauAttention(
            num_units = attention_units, # depth of query mechanism
            memory = encoder_outputs, # hidden states to attend (output of RNN)
            normalize=False, # normalize energy term
            name='BahdanauAttention')

        attention_mechanism_luong = tf.contrib.seq2seq.LuongAttention(
            num_units = encoder_units,
            memory = encoder_outputs,
            scale=False,
            name='LuongAttention'
        )


        ### BUILD THE DECODER

        # Simple Dense layer to project from rnn_dim to the desired output_dim
        projection = layers_core.Dense(output_dim, use_bias=True, name="output_projection")

        helper = tf.contrib.seq2seq.TrainingHelper(target, sequence_length=[output_seq_len for _ in range(batch_size)])
 ## This is where I don't really know what to do in my case, is this function changing my data into [ GO, data, END] ?

        decoder_cell = tf.nn.rnn_cell.BasicLSTMCell(decoder_units)

        attention_cell = tf.contrib.seq2seq.AttentionWrapper(
            cell = decoder_cell,
            attention_mechanism = attention_mechanism_luong, # Instance of AttentionMechanism
            attention_layer_size = attention_units,
            name="attention_wrapper")

        initial_state = attention_cell.zero_state(batch_size=batch_size, dtype=tf.float32)
        initial_state = initial_state.clone(cell_state=encoder_state)

        decoder = tf.contrib.seq2seq.BasicDecoder(attention_cell, initial_state=initial_state, helper=helper, output_layer=projection)

        outputs, _, _ = tf.contrib.seq2seq.dynamic_decode(decoder=decoder)


        # Loss function:

        loss = 0.5*tf.reduce_sum(tf.square(outputs[0] - target), -1)
        loss = tf.reduce_mean(loss, 1)
        loss = tf.reduce_mean(loss)

        # Optimizer

        optimizer = tf.train.AdamOptimizer(learning_).minimize(loss)

我知道 Seq2seq 架构的训练状态和推理状态有很大不同，但我不知道如何使用模块中的帮助器来区分两者。我使用这个模块是因为它对于注意力层非常有用。如何使用 Helper 为解码器创建 ['Go' , [input_sequence]] ？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

forecasting

如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？的相关文章

错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device
Tensorflow-GPU安装导入错误：DLL加载失败：找不到指定的模块

好吧我知道这可能已经回答了问题但我已经尝试了 stackoverflow 上建议的几乎所有技巧来安装 tensorflow gpu 并在官方文档上建议但没有运气我遇到了同样的错误首先我尝试过this https towardsda
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
精度类型

使用 keras 库获得的精度如下 model compile optimizer sgd loss mse metrics tf keras metrics Precision sklearn 计算出的哪种精度与 keras 计算出的精度
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
在 Tensorflow 中每行选择一个元素的优雅方法

Given 一个矩阵A形状的 m n 张量I形状的 m 我想要一份清单J的元素来自A where J i A i I i 那是 I保存要从每行中选择的元素的索引A 背景我已经有了argmax A 1 现在我也想要max 我知道我可以使用r
tensorflow：检查标量布尔张量是否为 True

我想使用占位符控制函数的执行但不断收到错误不允许使用 tf Tensor 作为 Python bool 这是产生此错误的代码 import tensorflow as tf def foo c if c print This is tr
让 TensorFlow 在 ARM Mac 上使用 GPU

我已经安装了TensorFlow在 M1 上 ARM Mac 根据这些说明 https github com apple tensorflow macos issues 153 一切正常然而模型训练正在进行CPU 如何将培训切换到GPU
稍微不同的形状会收敛到错误的数字 - 为什么？

我试图弄清楚为什么 TensorFlow 会做一些令人惊讶的事情我将其归结为一个测试用例尝试对一个简单的问题进行线性回归该问题只需将两个输入加在一起权重收敛到 1 0 偏差收敛到 0 0 正如它们应该的那样使用此版本的训练输出 t
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
在 Datalab 中使用 Python3，我无法将代表 Google Cloud Storage 存储桶中的文件的字符串列表作为带有张量流的 feed_dict 提供

我是 tf 新手在尝试处理某些文件时遇到问题这是代码摘录 xlabel to files list map dog bark subset of data with two files result gs some bucket som
查找张量流运算所依赖的所有变量

有没有办法找到给定操作通常是损失所依赖的所有变量我想用它来将该集合传递到optimizer minimize or tf gradients 使用各种set intersection 组合到目前为止我已经找到了op op input
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
缩小轴 1 的形状为空 [x,0]

我正在尝试训练 SVHN 街景门牌号码数据集用于张量流中的对象检测对数字进行一些基本的 OCR 到目前为止我已经成功地遵循了对象检测张量流指南中的宠物训练示例当我基于样本 fast rcnn resnet101 config 训练
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用预训练（Tensorflow）CNN 提取特征

深度学习已成功应用于多个大型数据集用于对少数类别猫狗汽车飞机等进行分类其性能优于 SIFT 特征袋颜色直方图等更简单的描述符然而训练这样的网络需要每个类别大量的数据和大量的训练时间然而在花时间设计和训练这样一种设备并
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280

随机推荐

您可以将 Docker 映像直接拉入 IBM Cloud Kubernetes 集群吗？

TL DR 抱歉如果这是基础知识我正在学习 Kubernetes 我尝试在 IBM Cloud 中创建 Kubernetes 部署但失败了该部署在我的本地 minikube 上运行良好但在 IBM Cloud 中失败我是否需要使
我的 linq select 不起作用，我的 foreach 起作用

我有以下 LINQSelect这是行不通的 Data Select d gt d Value IsDirty true Not working 我的较长解决方法确实如此 foreach var d in Data d Value IsDir
将 Bootstrap 与 Bower 一起使用

我正在尝试将 Bootstrap 与 Bower 一起使用但由于它克隆了整个存储库因此没有 CSS 和其他内容这是否意味着我需要在我自己的构建过程中包含构建 Bootstrap 或者如果我错了正确的工作流程是什么 I finally
添加自定义过渡会导致 xib 加载错误的屏幕尺寸

我正在尝试向具有 xib 的 UIViewController 添加自定义过渡我尝试了几种方法但它们都有相同的问题视图显示的屏幕尺寸错误我当前的示例基于以下教程使用 Swift 在 iOS 中自定义 UIViewControlle
为什么这个谓词格式会变成 '= nil'

有人建议这个线程 https stackoverflow com questions 40686005 nspredicate crash after swift 3 migration与我的问题完全相同但是我的应用程序没有崩溃并且我
使 .net web api 队列请求以“单线程”方式运行

我们有一个 c net Web API 服务调用代码该代码无法一次处理多个数据库请求该系统适用于需求相对较小的账单在线支付我们无法控制代码来进行可以解决问题的更改另一个使用相同代码的小组使用 WCF API 和服务配置将并发请求限制
猪的组连接等效吗？

试图在 Pig 上完成这个任务寻找 MySQL 的 group concat 等效项例如在我的表中我有以下内容 3fields userid clickcount pagenumber 155 2 12 155 3 133 155
如何解决 Laravel 8 UI 分页问题？

我在尝试最近发布的 laravel 8 时遇到了问题我试图找出变化是什么以及它是如何工作的当我这样做时我遇到了分页 laravel 8 UI 变得混乱的问题不知何故它发生了有人可以帮助我吗或者经历过同样的事情像这样我在 lar
Inc 函数 Inno Setup

这可能非常简单但是当我尝试编译包含以下内容的程序时 Inc Count 在 Inno Setup 中我不断得到未知标识符 Inc 我相信这就是在 Pascal 中递增整数的方式并且对如何继续这里感到困惑我正在使用 Inno Setu
Rails 资源单数还是复数？

我有一条搜索路线我想将其设为单数但是当我指定单数路线时它仍然会生成复数控制器路线这是应该的样子吗 resource search Gives me search POST search format action gt create
在 Windows 7 中使用 ActivePerl @ARGV 为空

我有以下 Perl 脚本我正在尝试使用 ActivePerl 在 Windows 7 中运行它 c Perl64 bin perl exe w use strict my mp3splt exe c Program Files x86 m
为 PostgreSQL 查询选择正确的索引

简化表 CREATE TABLE products product no integer PRIMARY KEY sales integer status varchar 16 category varchar 16 CREATE INDE
如何在 Swift 中获取字典中最后输入的值？

如何获取 Swift 字典中最后输入的值例如我如何从下面获取值 CCC var dictionary Dictionary
Eslint 从另一个文件确定全局变量

我试图以这样的方式设置 ESLint 使其在对实际目标文件进行 linting 之前解析全局声明文件这样我就不必将所有确实是全局的函数和变量声明为全局而是让解析器弄清楚 In 一些模块 js function do something
可以读取目标文件吗？

我很好奇 obj文件我几乎不知道它们是什么或者它们包含什么所以我用 Vim 文本编辑器打开它们我在里面发现了一种类似外星人的语言有什么办法可以理解它们代表什么以及它们的内容是什么另外它们的用途是什么 Thanks Sure 但
Python-将标题写入csv

目前我正在用 python 编写查询将数据从 oracle dbo 导出到 csv 文件我不知道如何在文件中写入标题 try connection cx Oracle connect user pass tns name cursor
在真实设备上展示测试广告

这是我的代码 let request GADRequest request testDevices kGADSimulatorID XXXX2F32d69CCA859FFB559D0FEA3CF6483D08A6 adView load r
Python最大递归，关于sys.setrecursionlimit()的问题

我有一个问题sys setrecursionlimit 来自蟒蛇docs https docs python org 2 library sys html sys setrecursionlimit这个函数将Python解释器堆栈的最大深
Pyqt5 中的 QThreads：这是官方 QThread 文档的正确 C++ 到 Python 翻译吗？

关于如何实例化和使用的官方文档QThread可以在这里找到 http doc qt io qt 5 qthread html http doc qt io qt 5 qthread html 该文档描述了两种基本方法 1 工作对象方法和 2
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr

如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？ 的相关文章

随机推荐

热门标签

如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？的相关文章