了解 Tensorflow LSTM 模型输入？

2024-03-04

我在理解 TensorFlow 中的 LSTM 模型时遇到一些困难。

我用tflearn http://tflearn.org/作为包装器，因为它自动完成所有初始化和其他更高级别的工作。为了简单起见，我们考虑这个示例程序 https://github.com/tflearn/tflearn/blob/master/examples/nlp/lstm.py. Until line 42 https://github.com/tflearn/tflearn/blob/master/examples/nlp/lstm.py#L40, net = tflearn.input_data([None, 200])，很清楚会发生什么。您将数据集加载到变量中并使其具有标准长度（在本例中为 200）。在这种情况下，输入变量和 2 个类都转换为 one-hot 向量。

LSTM如何获取输入? 它通过多少个样本来预测输出？

什么是net = tflearn.embedding(net, input_dim=20000, output_dim=128)代表？

我的目标是复制 http://jeffdonahue.com/lrcn/中的活动识别数据集paper http://arxiv.org/abs/1411.4389。例如，我想输入一个 4096 个向量作为 LSTM 的输入，想法是取 16 个这样的向量，然后产生分类结果。我认为代码看起来像这样，但我不知道应该如何给出 LSTM 的输入。

from __future__ import division, print_function, absolute_import

import tflearn
from tflearn.data_utils import to_categorical, pad_sequences
from tflearn.datasets import imdb

train, val = something.load_data()
trainX, trainY = train #each X sample is a (16,4096) nd float64 
valX, valY = val #each Y is a one hot vector of 101 classes.

net = tflearn.input_data([None, 16,4096])
net = tflearn.embedding(net, input_dim=4096, output_dim=256)
net = tflearn.lstm(net, 256)
net = tflearn.dropout(net, 0.5)
net = tflearn.lstm(net, 256)
net = tflearn.dropout(net, 0.5)
net = tflearn.fully_connected(net, 101, activation='softmax')
net = tflearn.regression(net, optimizer='adam',
                         loss='categorical_crossentropy')

model = tflearn.DNN(net, clip_gradients=0., tensorboard_verbose=3)
model.fit(trainX, trainY, validation_set=(testX, testY), show_metric=True,
          batch_size=128,n_epoch=2,snapshot_epoch=True)

基本上，lstm 获取一个单元格的向量大小：

lstm = rnn_cell.BasicLSTMCell(lstm_size, forget_bias=1.0)

那么，你想要喂多少个时间序列？这取决于你的喂食载体。中的数组数量X_split决定时间步数：

X_split = tf.split(0, time_step_size, X)
outputs, states = rnn.rnn(lstm, X_split, initial_state=init_state)

在你的例子中，我猜lstm_size是 256，因为它是一个单词的向量大小。这time_step_size将是训练/测试句子中的最大字数。

请看这个例子：https://github.com/nlintz/TensorFlow-Tutorials/blob/master/07_lstm.py https://github.com/nlintz/TensorFlow-Tutorials/blob/master/07_lstm.py

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

了解 Tensorflow LSTM 模型输入？的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
使用字典映射数据帧索引

为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
pip 列出活动 virtualenv 中的全局包

将 pip 从 1 4 x 升级到 1 5 后pip freeze输出我的全局安装系统软件包的列表而不是我的 virtualenv 中安装的软件包的列表我尝试再次降级到 1 4 但这并不能解决我的问题这有点类似于这个问题 http
import matplotlib.pyplot 给出 AttributeError: 'NoneType' 对象没有属性 'is_interactive'

我尝试在 Pycharm 控制台中导入 matplotlib pyplt import matplotlib pyplot as plt 然后作为回报我得到 Traceback most recent call last File D Pr
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

C# 属性修改方法

全部也许我在谷歌上搜索得不够但我找不到关于这个问题的任何例子在 C 中是否可以创建一个自定义属性该属性应用于类并修改其所有方法例如添加Console WriteLine Hello i m modified method 作为第
如何仅在安装（而不是卸载）中执行自定义操作

我确信这相当容易但我有点困难我有一个自定义操作可以在安装时执行不同的非 msi 安装程序不幸的是我注意到它还在卸载时执行安装程序我已经查看了这些选项但我似乎无法找到如何阻止这种情况如果有人能帮助我我将非常感激另外如何
SWI-Prolog 中的可逆谓词和字符串

append 3是一个非常强大的谓词假设我想要一个以相同方式工作但针对 SWI Prolog 字符串的谓词我看到的最简单的方法是将这些字符串转换为列表string codes 2 然后应用append 3 然后使用string code
Pandoc md 到 pdf：在分页之前插入图像时保持顺序

正如标题所述我的问题是关于 pandocs md 到 pdf 的当我像这样转换降价时 Title text that is about a 3 4 page image that is too large to fit page ima
关于 GWT 中 MVP 的问题。（总体概述）

你们中的任何人都可以对 MVP 模式在 GWT 应用程序中的使用给出一个很好的解释吗我看过的任何示例我发现很难理解实现该模式的概念诸如这是什么之类的问题它实现了什么它是如何实施的以及如何扩展它以适应未来的修改 http code
如何在javascript中获取所有待处理的http请求？

javascript 或 angular2 有没有办法获取待处理的 http 请求列表目标是启动其他几个进程根据这个榜单的波动是否存在类似可访问的请求堆栈之类的东西 Thanks 事实上你可以扩展Http类来拦截请求执行 impo
有没有更干净的方法来可靠地使用 write() 函数？

我读了man页我的理解是如果write 失败并设置errno to EAGAIN or EINTR 我可以执行write 再次所以我想出了以下代码 ret 0 while ret count write count write con
如何使用 PHP 在网站上实现 OCR？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
'NSInvalidArgumentException'，原因：'*** -[NSURL initFileURLWithPath:]: nil 字符串参数'

我对这里发生的事情感到摸不着头脑打印插件不起作用我正在尝试向应用程序添加打印机插件映射 xml 并加载 html 文件后我在 Xcode 中没有看到错误但是当我运行该应用程序时它崩溃了并且日志状态如下由于未捕获的异常而终止应
我如何知道用户正在打字或粘贴？

在我的 JSP 的文本字段中我希望知道用户是在输入数据还是只是粘贴我如何使用 javascript 来识别它 EDIT 根据安迪的回答我知道如何去做但仍然好奇那些人是如何编写 onpaste 事件的 Safari Chrome Fi
HTML onUnclick 处理程序？ [复制]

这个问题在这里已经有答案了我想在单击输入字段时触发一个处理程序并在取消选择输入字段时触发另一个处理程序即如果有人在字段之外单击有办法做到这一点吗点击处理程序非常简单
自动在 bash 命令末尾添加一些内容

我想知道如何在特定 bash 命令的末尾添加一些内容而无需显式键入它例如我希望能够输入 mycommand argument 该行将提交为 mycommand argument 我知道如何在我的中设置别名 bashrc e g ali
在 Mac 上启动 AVD（Android 虚拟设备）时 qemu-system-i386 意外退出（非法指令 4）

我在 Mac Macbook Pro 2017 年 8 月 OSX 10 12 4 上安装了 Android Studio 然后启动创建了一个 hello world 项目并创建了一个 AVD Android 虚拟设备 Nexus 5 来
CloudFront 签名 url 的最长过期时间是多少

我正在使用 CloudFront 从中生成签名 URLdoc https docs aws amazon com AmazonCloudFront latest DeveloperGuide CFPrivateDistJavaDevelop
JAXB 如何推进 XMLStreamReader？

我正在使用 JAXB 通过 XMLStreamReader 从非常大的 XML 文件中解组对象如果我要解组的 XML 元素是分隔的通过换行符甚至单个空格则效果很好如果我要解组的 XML 元素之间没有空格那么我会丢失所有其他项目 X
Rust 编译器什么时候不能证明借用是不相交的？

In 诺米康第 3 2 节 https doc rust lang org nomicon references html liveness 在活跃度标题下它说然而经常出现的情况是 Rust 不够聪明无法证明多次借用是不相交的
std 映射复合键

我有一个问题运算符std map 所需的方法我使用结构作为复合键如下所示 struct MyKey std string string1 std string string2 std string string3 unsigned in
跟踪实时推文流中的关键字

我安装并尝试了 tweepy 我现在正在使用以下功能 from API参考 http packages python org tweepy html api html api reference API public timeline 返回
检查拖放是否正在进行

有什么方法可以检查拖放是否正在进行中可以检查一些方法或win32 api吗我知道我可以设置AllowDrop 并使用事件但在这种情况下它不起作用基本上我想用代码检查是否any拖放正在进行中我有一个类似的问题我自己回答了经过几个
了解 Tensorflow LSTM 模型输入？

我在理解 TensorFlow 中的 LSTM 模型时遇到一些困难我用tflearn http tflearn org 作为包装器因为它自动完成所有初始化和其他更高级别的工作为了简单起见我们考虑这个示例程序 https github

了解 Tensorflow LSTM 模型输入？

了解 Tensorflow LSTM 模型输入？ 的相关文章

随机推荐

热门标签

了解 Tensorflow LSTM 模型输入？的相关文章