吃透tensorflow那本书里面的LSTM那个程序

2023-05-16

弄清了C++的这些之后，再看python的tensorflow LSTM代码感觉好很多

https://blog.csdn.net/sinat_16643223/article/details/114503233

===============================================================================

至少面试时经得起拷问，有底气对不对。

可以试着先跟这里面的学习。

https://www.julyedu.com/course/getDetail/82

参考我的这些博文，有助于啃透这部分LSTM的代码

现在这个代码应该再语法上没什么太多问题了。

代码可以去这里复制

https://github.com/seanyuner/tensorflow-tutorial/blob/master/Chapter08%20%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/8.3%20-%208.4%20%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E7%9A%84%E5%8F%98%E7%A7%8D%E3%80%81%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E6%A0%B7%E4%BE%8B%E7%A8%8B%E5%BA%8F.ipynb

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
%matplotlib inline

# 1. 定义RNN的参数
HIDDEN_SIZE = 30                            # LSTM中隐藏节点的个数。
NUM_LAYERS = 2                              # LSTM的层数。
TIMESTEPS = 10                              # 循环神经网络的训练序列长度。
TRAINING_STEPS = 10000                      # 训练轮数。
BATCH_SIZE = 32                             # batch大小。
TRAINING_EXAMPLES = 10000                   # 训练数据个数。
TESTING_EXAMPLES = 1000                     # 测试数据个数。
SAMPLE_GAP = 0.01                           # 采样间隔。


# 2. 产生正弦数据函数
def generate_data(seq):
    X = []
    y = []
    # 序列的第i项和后面的TIMESTEPS-1项合在一起作为输入；第i + TIMESTEPS项作为输出。
    # 即用sin函数前面的TIMESTEPS个点的信息，预测第i + TIMESTEPS个点的函数值。
    for i in range(len(seq) - TIMESTEPS):
        X.append([seq[i: i + TIMESTEPS]])
        y.append([seq[i + TIMESTEPS]])
    return np.array(X, dtype=np.float32), np.array(y, dtype=np.float32)  


# 3. 定义网络结构和优化步骤
def lstm_model(X, y, is_training):
    # 使用多层的LSTM结构。
    cell = tf.nn.rnn_cell.MultiRNNCell([
        tf.nn.rnn_cell.LSTMCell(HIDDEN_SIZE)
        for _ in range(NUM_LAYERS)]) 

    # 使用TensorFlow接口将多层的LSTM结构连接成RNN网络并计算其前向传播结果。
    outputs, _ = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)
    # outputs是顶层LSTM在每一步的输出结果，它的维度是[batch_size, time ,
    # HIDDEN_SIZE]。在本问题中只关注最后一个时刻的输出结果。
    output = outputs[:, -1, :]

    # 对LSTM网络的输出再做加一层全链接层并计算损失。注意这里默认的损失为平均
    # 平方差损失函数。
    predictions = tf.contrib.layers.fully_connected(
        output, 1, activation_fn=None)
    
    # 只在训练时计算损失函数和优化步骤。测试时直接返回预测结果。
    if not is_training:
        return predictions, None, None
        
    # 计算损失函数。
    loss = tf.losses.mean_squared_error(labels=y, predictions=predictions)

    # 创建模型优化器并得到优化步骤。
    train_op = tf.contrib.layers.optimize_loss(
        loss, tf.train.get_global_step(),
        optimizer="Adagrad", learning_rate=0.1)
    
    return predictions, loss, train_op


# 4. 定义训练方法
def train(sess, train_X, train_Y):
    # 将训练数据以数据集的方式提供给计算图
    ds = tf.data.Dataset.from_tensor_slices((train_X, train_Y))
    ds = ds.repeat().shuffle(1000).batch(BATCH_SIZE)   #maxi:这种该怎么理解
    X, y = ds.make_one_shot_iterator().get_next()
    
    # 定义模型，得到预测结果、损失函数，和训练操作。
    with tf.variable_scope("model"):
        _, loss, train_op = lstm_model(X, y, True)
        
    sess.run(tf.global_variables_initializer())
    for i in range(TRAINING_STEPS):
        _, l = sess.run([train_op, loss])
        if i % 1000 == 0:
            print("train step: " + str(i) + ", loss: ", str(l))
            

# 5. 定义测试方法
def run_eval(sess, test_X, test_y):
    # 将测试数据以数据集的方式提供给计算图。
    ds = tf.data.Dataset.from_tensor_slices((test_X, test_y))
    ds = ds.batch(1)
    X, y = ds.make_one_shot_iterator().get_next()
    
    # 调用模型得到计算结果。这里不需要输入真实的y值。
    with tf.variable_scope("model", reuse=True):
        prediction, _, _ = lstm_model(X, [0.0], False)
    
    # 将预测结果存入一个数组。
    predictions = []
    labels = []
    for i in range(TESTING_EXAMPLES):
        p, l = sess.run([prediction, y])
        predictions.append(p)
        labels.append(l)

    # 计算rmse作为评价指标。
    predictions = np.array(predictions).squeeze()
    labels = np.array(labels).squeeze()
    rmse = np.sqrt(((predictions - labels) ** 2).mean(axis=0))
    print("Root Mean Square Error is: %f" % rmse)
    
    # 对预测的sin函数曲线进行绘图。
    plt.figure()
    plt.plot(predictions, label='predictions')
    plt.plot(labels, label='real_sin')
    plt.legend()
    plt.show()
    
    
# 6. 生成数据并训练、验证
# 用正弦函数生成训练和测试数据集合。
# numpy.linspace函数可以创建一个等差序列的数组，它常用的参数有三个参数，
# 第一个参数表示起始值，第二个参数表示终止值，第三个参数表示数列的长度。
# 例如linespace(1, 10, 10)产生的数组是arrray([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 
test_start = (TRAINING_EXAMPLES + TIMESTEPS) * SAMPLE_GAP
test_end = test_start + (TESTING_EXAMPLES + TIMESTEPS) * SAMPLE_GAP
train_X, train_y = generate_data(np.sin(np.linspace(
    0, test_start, TRAINING_EXAMPLES + TIMESTEPS, dtype=np.float32)))
test_X, test_y = generate_data(np.sin(np.linspace(
    test_start, test_end, TESTING_EXAMPLES + TIMESTEPS, dtype=np.float32)))

#maxi:可以看到最后的步骤就是先训练模型，然后把训练出的模型拿去预测
with tf.Session() as sess:
    train(sess, train_X, train_y)
    run_eval(sess, test_X, test_y)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

LSTM

那本书里面

那个程序

吃透tensorflow那本书里面的LSTM那个程序的相关文章

Tensorflow：np数组的next_batch函数

我的火车数据为 xTrain numpy asarray 100 1 5 6 yTrain numpy asarray 200 2 10 12 如何定义 next batch size 方法以从训练数据中获取随机元素的 size 个数您可
您必须为 MNIST 数据集的占位符张量“Placeholder”提供一个值，dtype float 和 shape [?,784]

这是我在 MNIST 数据集上测试量化的示例我正在使用以下代码测试我的模型 import tensorflow as tf from tensorflow examples tutorials mnist import input dat
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av
Tensorflow lite 目标检测示例中相机的屏幕尺寸 [水平屏幕]

在tensorflow lite示例对象检测中相机不会拍摄整个屏幕而只会拍摄一部分我试图在 CameraActivity CameraConnectionFragment 和 Size 类中找到一些常量但没有结果所以我只是想要一种
Tensorflow：从 TFRecords 文件中提取图像和标签

我有一个 TFRecords 文件其中包含图像及其标签名称大小等我的目标是将标签和图像提取为 numpy 数组我执行以下操作来加载文件 def extract fn data record features Extract fea
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
Keras LSTM 密集层多维输入

我正在尝试创建一个 keras LSTM 来预测时间序列我的 x train 形状像 3000 15 10 示例时间步长特征 y train 形状像 3000 15 1 我正在尝试构建一个多对多模型每个序列 10 个输入特征产生 1
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
TensorFlow：有没有办法将冻结图转换为检查点模型？

可以将检查点模型转换为冻结图 ckpt 文件转换为 pb 文件但是是否有反向方法将 pb 文件再次转换为检查点文件我想它需要将常量转换回变量有没有办法将正确的常量识别为变量并将它们恢复回检查点模型目前支持将变量转换为常量 http
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
NotImplementedError：尚未为未构建的模型子类启用“fit_generator”

我正在使用以下代码 import tensorflow as tf traindata tf keras preprocessing image ImageDataGenerator rescale 1 255 shear range 0

随机推荐

同时装T265和光流的时候，应该是T265提供的位置信息，光流提供的速度信息，其实不冲突，一个位置环一个速度环，融合起来效果应该更好。

同时装T265和光流的时候 xff0c 应该是T265提供的位置信息 xff0c 光流提供的速度信息 xff0c 其实不冲突 xff0c 一个位置环一个速度环 xff0c 融合起来效果应该更好明白这个我感觉我甚至可以用其他飞控来做了光流
我感觉互补滤波不就是一种融合么，把两个数据融合，你叫我融合两个数据我确实很可能就是用互补的方式

我感觉互补滤波不就是一种融合么 xff0c 把两个数据融合 xff0c 你叫我融合两个数据我确实很可能就是用互补的方式 xff0c 两个数据各自给个权值相乘再相加 xff0c 这么理解滤波做数据融合就应该好理解些了卡尔曼滤波应该只不过说把
mysql字符集（SQLException: #HY000）

myssql字符集补充一篇关于myssql字符集的文章今天在mysql中遇到一个问题 xff0c SQLException HY000 xff0c 百度都说是插入数据的时候有空数据 xff0c 数据库不允许为空导致 xff0c 经过仔细
扩展卡尔曼滤波定位是马尔可夫定位中的一种特殊情况（古月居）

摘自 xff1a https mp weixin qq com s J3H3vbERpExlnu wkF1xg 我与Robot有个约会扩展卡尔曼滤波定位原创 Z 古月居今天扩展卡尔曼滤波定位是马尔可夫定位中的一种特殊情况 xff0c
我自己已经写好而且编译0错误

我自己已经写好而且编译0错误是的 xff0c 只需要改动commulink cpp就可以了我把commulink cpp放在这下面 include 34 Commulink hpp 34 include 34 Basic hpp 34
我现在知道为什么会有对天光流了，因为比赛场地地面全白。

我现在知道为什么会有对天光流了 xff0c 因为比赛场地地面全白
协议还有物理层/电气层的协议 RS232 RS485

是不是比如多高的电平是1 xff0c 多低的电平是0 xff0c 这种协议 xff1f 协议真的是无处不在啊编程上面232和UART没有任何区别 xff0c 它只是在硬件层次去做了个信号的增强 232和485是在串口 xff08 UART
烧写之前备份过的树莓派镜像到SD卡，证明这样备份恢复是可行的！！！！！！！

可以参考以前的树莓派烧写教程 https blog csdn net sinat 16643223 article details 108032651 插入U盘会自动识别到镜像选择这个 xff0c 就是之前备份的树莓派的镜像 xff0c
我在苍穹四轴买的F450的动力配置（包含基本组件）

我在苍穹四轴买的F450的动力配置 xff08 包含基本组件 xff09 浆是1045的浆电调是好盈乐天20A电调电池是5200 电机是这种电机下面可以参考 xff0c 不是完全一样 xff0c 比如我不是乐迪pixhawk xff0
串口通信是需要共地的，所以你树莓派要和飞控串口通信还是得把树莓派弄到无人机的电池上供电才行，或者飞控通过电脑的USB供电。

你就算是电脑给STM32通过串口烧录程序也是工地的呀对不对 xff0c 开发板和电脑都是插的同一个插座 xff0c 或者开发板是通过电脑USB口供电都是共地的所以你树莓派要和飞控串口通信还是得把树莓派弄到无人机的电池上供电才行 xff0c
现在发现激光雷达和双目真正的融合没那么简单

现在发现激光雷达和双目真正的融合没那么简单不是把T265的位置数据和激光得到的位置数据这么简单融合 xff0c 而是把激光得到的二维图和双目得到的深度图去融合这可不比加速度计和陀螺仪的融合
普通的激光雷达就可以是一个三维激光雷达，比如一个16线的激光雷达，它是上下正负30度往外扫，只是16线你选取1线就是一个平面，16线都考虑就是立体的了。

普通的激光雷达就可以是一个三维激光雷达 xff0c 比如一个16线的激光雷达 xff0c 它是上下正负30度往外扫 xff0c 只是16线你选取1线就是一个平面 xff0c 16线都考虑就是立体的了
阿木实验室的一些信息（包含一些wiki地址）

官网 xff1a https www amovlab com github xff1a https github com amov lab gitee P200wiki地址 xff1a https amov wiki readthedocs
Bootloader介绍（1）

Bootloader介绍 xff1a bootloader就是在操作系统内核运行之前运行的一段代码类似于WINDOWS中的BIOS程序通过这段代码可以完成硬件设备的初始化 xff0c 以及内存空间的映射图的功能 xff0c 从而把系统的
NUC作为开发机不足的地方

首先USB口只有两个 xff0c 插鼠标键盘就没了 xff0c 你插不了T265还有其他设备了 xff0c 树莓派都有四个USB口我更正一下 xff0c NUC有四个USB口 xff0c 只是一面只有两个 xff0c TB上图片只拍出了一
TB上看到迷你主机似乎都是酷睿的CPU

我查了下发现我们平常说的i3 i5 i7似乎就是酷睿的 xff0c 英特尔似乎就两个牌子的芯片 xff0c 酷睿和奔腾这类电脑似乎都是酷睿芯片比买一台笔记本划算些阿木现在也提供因特尔平台 xff0c 不知是什么板子似乎还不贵这种就
英特尔处理器全部系列

最近想买迷你主机 xff0c 被CPU各种处理器弄的有点乱 xff0c 想整理一下摘自 xff1a https zhidao baidu com question 814271646749048812 html 英特尔CPU有几个系列锦
AGV小车

li ji好像就是去青岛弄 AGV小车 https mp weixin qq com s 6iWzmkvdgqXf1xgCL6y7qg
基于ADRC的单点自平衡立方体，我搜了下有人写过了，看来我这种写论文的思路是对的，把一个实现过的项目用其他方法实现一遍。

基于ADRC的单点自平衡立方体这个也可以作为一个写的点子我搜了下有人写过了 xff0c 看来我这种写论文的思路是对的 xff0c 把一个实现过的项目用其他方法实现一遍
吃透tensorflow那本书里面的LSTM那个程序

弄清了C 43 43 的这些之后 xff0c 再看python的tensorflow LSTM代码感觉好很多 https blog csdn net sinat 16643223 article details 114503233 61 6

吃透tensorflow那本书里面的LSTM那个程序

吃透tensorflow那本书里面的LSTM那个程序 的相关文章

随机推荐

热门标签

吃透tensorflow那本书里面的LSTM那个程序的相关文章