循环神经网络（RNN）的基本原理及LSTM的基本结构

2023-11-17

来源于课上实验，结果清晰，遂上传于此

实验环境TensorFlow1.14

该课件仅用于教学，请勿用于其他用途。

一、实验目的

学习掌握循环神经网络（RNN）的基本原理及LSTM的基本结构；

掌握利用LSTM神经元构造循环神经网络进行训练和预测时间序列。

二、实验内容

通过PC上位机连接服务器，登陆SimpleAI平台，利用python语言搭建基于LSTM的RNN模型。利用RNN模型对正线曲线或余弦曲线的数值变化进行预测。所用到的数据集由学生自己利用python编写代码采样生成。目标是利用正弦曲线或者余弦曲线的前10个点的数值预测下一个点的数值。

三、实验环境

硬件：x86_64 Centos 3.10.0服务器/GPU服务器、GPU、PC上位机

软件：SimpleAI实验平台、Docker下Ubuntu16.04镜像、python3.5、tensorflow1.7, numpy1.12.1

四、实验原理

RNN是一种用于处理时序数据的神经网络模型。在传统神经网络中，模型不会关注上一时刻的处理会有什么信息可以用于下一时刻，每一次都只会关注当前时刻的处理。举个例子来说，我们想对一部影片中每一刻出现的事件进行分类，如果我们知道电影前面的事件信息，那么对当前时刻事件的分类就会非常容易。实际上，传统神经网络没有记忆功能，所以它对每一刻出现的事件进行分类时不会用到影片已经出现的信息。基于对这种时间序列关注的需求，循环神经网络应运而生。递归神经网络的结果与传统神经网络有一些不同，它带有一个指向自身的环，用来表示它可以传递当前时刻处理的息给下一时刻使用，结构如下：

其中，X_t为转存失败重新上传取消时间节点的输入，A 为模型处理部分，h_t 为 t 时间节点的输出。为了更好地说明RNN的工作原理，可以将上图的循环网络结构展开，得到：

这样的一条链状神经网络代表了一个递归神经网络，可以认为它是对相同神经网络的多重复制，每一时刻的神经网络会传递信息给下一时刻。在本次试验中可以认为 X_i 为当前 i 时的正线曲线值，h_i 为预测的 i+1 时刻的正弦曲线值。

不过RNN也有它自己的问题，即在当预测点与依赖的相关信息距离比较远的时候，就难以学到该相关信息。为了解决这类问题，人们发明了Long Short Term Memory（LSTM）。其结构与普通的循环神经网络的神经元结构对比如下：

理解LSTMs的关键就是下面的矩形方框，被称为memory block（记忆块），主要包含了三个门（forget gate、input gate、output gate）与一个记忆单元（cell）。方框内上方的那条水平线，被称为cell state（单元状态），它就像一个传送带，可以控制信息传递给下一时刻。

下面来逐步了解LSTM的工作原理。LSTM第一步是用来决定什么信息可以通过cell state。这个决定由“forget gate”层通过sigmoid来控制，它会根据上一时刻的输出 h_(t-1) 和当前输入 x_t 来产生一个0到1 的 f_t 值，来决定是否让上一时刻学到的信息 C_(t-1) 通过或部分通过。如下：

举个例子来说就是，我们在之前的句子中学到了很多东西，一些东西对当前来讲是没用的，可以对它进行选择性地过滤。

第二步是产生我们需要更新的新信息。这一步包含两部分，第一个是一个“input gate”层通过sigmoid来决定哪些值用来更新，第二个是一个tanh层用来生成新的候选值 C_t，它作为当前层产生的候选值可能会添加到cell state中。我们会把这两部分产生的值结合来进行更新。

最后一步是决定模型的输出，首先是通过sigmoid层来得到一个初始输出，然后使用tanh将 C_t 值缩放到-1到1间，再与sigmoid得到的输出逐对相乘，从而得到模型的输出。

五、实验步骤

提示：实验步骤中给出的代码不是按照代码顺序给出，请结合代码截图中的行号进行实验。

1、启动jupyter。

2、新建子目录log/sin文件夹和log/cos文件夹。这两个文件夹将用于存储训练好的RNN模型目录结构如下图所示：

3、新建python文件，rnnPredict.py进行模型编写，引入需要的包

4、定义主函数，首先进行数据集的创建，首先利用numpy工具包进行正弦值或者余弦值序列的生成，并划分训练集和测试集的范围。

5、编写采样函数对正弦曲线值或者余弦曲线值进行采样。每11个采样点为一组数据，其中前10个为输入数据（x），最后一个为预测数据（label）。

同时定义辅助函数用于获取数据以及计算MSE

随后在主函数中调用采样函数生成训练集（x,y）对和测试集（x,y）对。

6、编写RNN模型，首先对超参数进行定于。在三个参数分别代表超参数变量名称、默认值、参数含义描述。需要特别注意的两个参数是model_state和debugging。model_state控制模型是训练状态还是预测状态，训练状态将进行反向传播进行优化，预测状态只会前向传播进行预测。debugging参数用于控制是否删除当前保存的模型，debugging为True即为重新训练，为False则读取原有模型继续训练。

7、创建模型类，名为RNN，编写初始化函数。定义输入x和真实标签y。

8、编写RNN模型定义函数。

9、编写优化操作，用于模型训练。

10、编写模型创建函数，该函数为class对外界的接口，用于创建模型图对象。

11、至此RNN模型定义完毕，回到主函数定义模型训练过程。首先创建RNN对象实体并调用build_net函数构建模型图。

12、创建session对象。

13、定义训练过程和预测过程。主要区别是在sess.run函数中，预测阶段不需要调用rnn_model.train_op这个operation，即无需优化损失函数。

将模式改为训练，运行程序

训练过程输出如下图所示，每10次优化输出一次当前损失函数值，当损失函数值不再下降时则应停止训练。

再将参数改为预测运行程序

预测阶段输出如下图所示将显示预测结果的平均MSE值。

最后也可以将预测结果可视化。查看预测效果。示范预测结果如下图所示，蓝色线为真实值，红色线为预测值。

为了真切的看到差别，将曲线图放大，如下所示，可以看到虽然预测的很接近，但还是存在一定的偏差。

六、扩展实验

以上是利用单层RNN使用10个连续的正弦函数值或者余弦函数值来预测第11个值的实验。在扩展实验中，（1）使用GRU网络与LSTM网络进行比较。（2）使用多层RNN来进行进行预测，将预测的MSE值结果与单层模型的MSE值进行对比分析。

import os
import shutil
import tensorflow as tf
import numpy as np
from sklearn.utils import shuffle
import matplotlib.pyplot as plt

FLAGS = tf.flags.FLAGS

tf.app.flags.DEFINE_integer("train_samples_num", 1000, "number of point in the train dataset")
tf.app.flags.DEFINE_float("sample_gap", 0.01, "the interval of sampling")
tf.app.flags.DEFINE_integer("layer_num", 3, "number of lstm layer")
tf.app.flags.DEFINE_integer("test_samples_num", 1000, "number of point in the test dataset")
tf.app.flags.DEFINE_integer("units_num", 128, "number of hidden units of lstm")
tf.app.flags.DEFINE_integer("epoch", 50, "epoch of training step")
tf.app.flags.DEFINE_integer("batch_size", 64, "mini_batch_size")
tf.app.flags.DEFINE_integer("max_len", 10, "use ten point to predict the value of 11th")
tf.app.flags.DEFINE_enum("model_state", "predict", ["train", "predict"], "model state")
tf.app.flags.DEFINE_boolean("debugging", False, "delete log or not")
tf.app.flags.DEFINE_float("lr", 0.01, "learning rate")
tf.app.flags.DEFINE_enum("function", "cos", ["sin", "cos"], "select sin function or cosing function")

class RNN(object):
    def __init__(self):
        self.x = tf.placeholder(dtype=tf.float32, shape=[None, FLAGS.max_len])
        self.y_ = tf.placeholder(dtype=tf.float32, shape=[None])
        self.global_step = tf.train.create_global_step()
        self.input = tf.expand_dims(input=self.x, axis=-1)      # [batch_size, seq_len, dim_size]

    def build_rnn(self):
        with tf.variable_scope("lstm_layer"):
            cells = tf.contrib.rnn.MultiRNNCell(
                [tf.contrib.rnn.BasicLSTMCell(FLAGS.units_num) for _ in range(FLAGS.layer_num)])
            # cells = tf.contrib.rnn.MultiRNNCell(
            #     [tf.contrib.rnn.GRUCell(FLAGS.units_num) for _ in range(FLAGS.layer_num)])

            outputs, final_states = tf.nn.dynamic_rnn(cell=cells, inputs=self.input, dtype=np.float32)
            self.outputs = outputs[:, -1]

        with tf.variable_scope("output_layer"):
            self.predicts = tf.contrib.layers.fully_connected(self.outputs, 1, activation_fn=None)
            self.predicts = tf.reshape(tensor=self.predicts, shape=[-1])

    def build_train_op(self):
        with tf.variable_scope("train_op_layer"):
            self.loss = tf.reduce_sum(tf.square(self.y_ - self.predicts))
            tf.summary.scalar(name="loss", tensor=self.loss)
            optimizer = tf.train.AdamOptimizer(learning_rate=FLAGS.lr)
            self.train_op = optimizer.minimize(self.loss, self.global_step)

    def build_net(self):
        self.build_rnn()
        self.build_train_op()
        self.merged_summary = tf.summary.merge_all()


def generate_date(seq):
    x = []
    y = []
    for i in range(len(seq) - FLAGS.max_len):
        x.append(seq[i:i + FLAGS.max_len])
        y.append(seq[i + FLAGS.max_len])
    return np.array(x, dtype=np.float32), np.array(y, dtype=np.float32)


def get_batches(X, y):
    batch_size = FLAGS.batch_size
    for i in range(0, len(X), batch_size):
        begin_i = i
        end_i = i + batch_size if (i+batch_size) < len(X) else len(X)
        yield X[begin_i:end_i], y[begin_i:end_i]


def average_mse(real, predict):
    predict = np.array(predict)
    mse = np.mean(np.square(real - predict))
    return mse


if __name__ == "__main__":
    tf.logging.set_verbosity(tf.logging.INFO)
    if FLAGS.function == "sin":
        func = lambda x: np.sin(x)
        log_dir = "log/sin/"
    else:
        func = lambda x: np.cos(x)
        log_dir = "log/cos/"
    test_start = FLAGS.train_samples_num * FLAGS.sample_gap
    test_end = (FLAGS.train_samples_num + FLAGS.test_samples_num) * FLAGS.sample_gap
    train_x, train_y = generate_date(func(np.linspace(0, test_start, FLAGS.train_samples_num, dtype=np.float32)))
    tf.logging.info(
        "train dataset has been prepared, train_x shape:{};train_y shape:{} ".format(train_x.shape, train_y.shape))
    test_x, test_y = generate_date(func(np.linspace(test_start, test_end, FLAGS.test_samples_num, dtype=np.float32)))
    tf.logging.info(
        "test dataset has been prepared, test_x shape:{};test_y shape:{} ".format(test_x.shape, test_y.shape))
    rnn_model = RNN()
    rnn_model.build_net()
    if FLAGS.debugging:
        if os.path.exists(log_dir):
            print("remove: " + log_dir)
            shutil.rmtree(log_dir)

    if FLAGS.model_state == "train":
        if not os.path.exists(log_dir):
            os.makedirs(log_dir)

    saver = tf.train.Saver()
    sv = tf.train.Supervisor(logdir=log_dir, is_chief=True, saver=saver, summary_op=None, save_summaries_secs=None,
                             save_model_secs=60, global_step=rnn_model.global_step)
    tf.logging.info("preparing or waiting for session..")
    sess_context_manager = sv.prepare_or_wait_for_session()
    tf.logging.info("Created session")
    minLoss = 1000

    with sess_context_manager as sess:
        if FLAGS.model_state == "train":
            print("----------------Enter train model----------------")
            summary_writer = tf.summary.FileWriter(log_dir)
            for e in range(FLAGS.epoch):
                train_x, train_y = shuffle(train_x, train_y)
                for xs, ys in get_batches(train_x, train_y):
                    feed_dict = {rnn_model.x: xs, rnn_model.y_: ys}
                    _, loss, step, merged_summary = sess.run(
                        [rnn_model.train_op, rnn_model.loss, rnn_model.global_step, rnn_model.merged_summary], feed_dict=feed_dict)
                    if step % 10 == 0:
                        tf.logging.info("epoch->{} step->{} loss:{}".format(e, step, loss))
                        summary_writer.add_summary(merged_summary, step)
                        if loss < minLoss:
                            minLoss = loss
                            saver.save(sess=sess, save_path=log_dir, global_step=step)

        if FLAGS.model_state == "predict":
            print("-------------------Enter train model---------------")
            results = []

            for xs, ys in get_batches(test_x, test_y):
                feed_dict = {rnn_model.x: xs, rnn_model.y_: ys}
                predicts = sess.run(rnn_model.predicts, feed_dict=feed_dict)
                results.extend(predicts.tolist())

            print(average_mse(test_y, results))
            plt.plot(test_y, color="green", label="train")
            plt.plot(results, color="red", label="test")
            plt.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

循环神经网络（RNN）的基本原理及LSTM的基本结构的相关文章

验证损失远高于训练损失

我对深度学习模型非常陌生并尝试使用 LSTM 和 Keras Sequential 来训练多个时间序列模型 50 年中每年有 25 个观测值 1250 个样本因此不确定是否可以将 LSTM 用于如此小的数据然而我有数千个特征变量不
基于在线鲁棒主成分分析（RPCA）模型，结合长短期记忆（LSTM）循环网络的商品需求预测（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
基于GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接基于ChatGPT4 Python近红外光谱数据分析及机器学习与深度学习建模教程第一 GPT4 基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初
毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？

正常的第一个参数Dense层也是units 是该层中神经元节点的数量然而标准 LSTM 单元如下所示这是的修改版本了解 LSTM 网络 http colah github io posts 2015 08 Understandi
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
Keras - 从一个神经网络做出两个预测

我正在尝试组合由同一网络产生的两个输出该网络对 4 类任务和 10 类任务进行预测然后我希望将这些输出组合起来得到一个长度为 14 的数组我将其用作最终目标虽然这似乎很有效但预测总是针对一个类别因此它会产生一个概率分布该概率
如何处理极长的LSTM序列长度？

我有一些数据以非常高的速率大约每秒数百次采样对于任何给定实例这会导致平均序列长度很大约 90 000 个样本整个序列有一个标签我正在尝试使用 LSTM 神经网络将新序列分类为这些标签之一多类分类然而使用具有如此大序列长度
Keras ConvLSTM2D：输出层上的 ValueError

我正在尝试训练 2D 卷积 LSTM 以根据视频数据进行分类预测然而我的输出层似乎遇到了问题 ValueError 检查目标时出错预期dense 1 有 5 个维度但得到了形状为 1 1939 9 的数组我当前的模型基于ConvL
Keras 中的 Seq2Seq 双向编码器解码器

我正在尝试使用 Keras 实现 seq2seq 编码器解码器并在编码器上使用双向 lstm 如下所示 from keras layers import LSTM Bidirectional Input Concatenate from
张量流中 LSTM 的正则化

Tensorflow 提供了一个很好的 LSTM 包装器 rnn cell BasicLSTM num units forget bias 1 0 input size None state is tuple False activatio
将 CNN 的输出传递给 BILSTM

我正在开发一个项目其中我必须将 CNN 的输出传递给双向 LSTM 我创建了如下模型但它抛出不兼容错误请让我知道哪里出了问题以及如何解决这个问题 model Sequential model add Conv2D filters
在 Tensorflow 中检索 LSTM 序列的最后一个值

我有不同长度的序列想在 Tensorflow 中使用 LSTM 进行分类对于分类我只需要每个序列最后一个时间步长的 LSTM 输出 max length 10 n dims 2 layer units 5 input tf place
如何为 keras lstm 输入重塑数据？

我是 Keras 新手我发现很难理解 LSTM 层输入数据的形状 Keras 文档表示输入数据应该是形状为 nb samples timesteps input dim 的 3D 张量我有808信号每个信号有22个通道和2000个数据
将静态数据（不随时间变化）添加到 LSTM 中的序列数据

我正在尝试建立一个如下图所示的模型请看下图我想在 LSTM 层中传递序列数据在另一个前馈神经网络层中传递静态数据血型性别后来我想将它们合并然而我对这里的维度感到困惑如果我的理解是正确的如图所示 5维序列数据如何与4维静态
Tensorflow动态RNN（LSTM）：如何格式化输入？

我已获得这种格式的一些数据以及以下详细信息 person1 day1 feature1 feature2 featureN label person1 day2 feature1 feature2 featureN label person
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim

随机推荐

【详解】指令系统中跳转指令与OF,SF,CF,ZF的关系

目录无符号跳转表示法有符号跳转表示法无符号跳转表示法详解有符号跳转表示法详解无符号跳转表示法小于大于等于小于等于大于有符号跳转表示法小于大于等于小于等于大于无符号跳转表示法详解我在学习这部分的最大的困惑点就是
TensorboardX和Tensorboard的介绍及使用

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录一 Tensorboard是什么 conda环境安装二 Tensorboard可供显示的内容三 Tensorboard使用步骤 1 标量SCALARS 2 图片
Dubbo和Spring Cloud微服务架构对比

Dubbo和Spring Cloud微服务架构对比微服务架构是互联网很热门的话题是互联网技术发展的必然结果它提倡将单一应用程序划分成一组小的服务服务之间互相协调互相配合为用户提供最终价值虽然微服务架构没有公认的技术标准和规范或
动态代理模式（实例化详解）

简介代理模式通常用于达到对原有系统功能进行扩充的目的比如你刚接手一个别人没有完成的项目这是你不想动别人原理的代码还需要添加新功能这时代理模式这时代理模式这时代理模式会很好的帮助解决问题代理模式分为两种静态代理模式动态代
蓝桥杯2021年第十二届真题第一场-砝码称重

题目题目链接题解动态规划状态定义 dp i j 表示前i个砝码是否能称出重量为j的物品状态转移对于第i个砝码选和不选两种情况对于选又可以分为放在左边和放在右边看样例存在加和减的情况也就是放在左边和右边的情况我们规定放
爬虫日常-12306自动购票程序

文章目录前言页面分析代码设计前言 hello兄弟们最近在钻研新鲜知识一不留神没想起来更新今天我们顺着前面几篇文章完整的写出一篇12306的自动购票软件首先把我们已经写完的前期步骤代码再顺一遍 from selenium we
IDEA常用快捷键集合(详解)

keymap中定义的快捷键实在是太多了全部记住几乎不可能但在项目开发或调试的工程中快捷键是绝对的效率工具查询快捷键 CTRL N 查找类 CTRL SHIFT N 查找文件 CTRL SHIFT ALT N 查找类中的方法或变量
msvcp140.dll缺失重新安装的方法【msvcp140.dll修复工具下载安装】

如果您在使用某些应用程序或游戏时遇到了 msvcp140 dll丢失的错误提示那么您需要采取一些措施来解决这个问题以下是几种解决msvcp140 dll丢失的方法 msvcp140 dll解决方法一 1 在浏览器顶部网页搜索 dll修
【vue】实现首屏加载等待动画避免首次加载白屏尴尬

原文链接在线体验 width 100 height 443 src jsfiddle net kajweb qrno8s0g 9 embedded html css result allowfullscreen allowfullscre
a foreign key constraint fails

可能由两种原因导致 1 设置的外键和对应的另一个表的主键值不匹配解决方法找出不匹配的值修改或者清空两表数据 2 字符集和排序规则的差异引起如果确认外键和主键一致使用如下方式解决代码前段插入 SET OLD CHARACTER S
iOS 15 越狱情报

关注后回复进群拉你进程序员交流群作者丨小集来源丨小集 ID zsxjtip iOS 15 正式版本已经发布了而 iOS 15 1 beta 版本也在近期发布在普通用户和开发者追更各个 beta 版和正式版时另一个神秘群体也没有
架构但服务多租户_华为以AI和混合云实现多租户数据中心架构转型

华为采用全球直播的方式以你好智能世界为主题举办行业数字化转型大会把原计划在巴塞罗那现场举办的活动时间不变 2月24日 27日搬到线上针对互联网服务行业数字化专门举办的MTDC 多租户数据中心论坛于北京时间27日开启全球线上直
外包干了2个月，技术退步明显...

先说一下自己的情况大专生 18年通过校招进入湖南某软件公司干了接近4年的功能测试今年年初感觉自己不能够在这样下去了长时间呆在一个舒适的环境会让一个人堕落而我已经在一个企业干了四年的功能测试已经让我变得不思进取谈了2年的女朋友
调用halcon函数时的错误处理

注以下材料来自halcon帮助文档因水平有限难免有误欢迎指正 0 概述在遇到一个运行时错误时 HALCON C 会以默认的方式给出错误信息并终止程序然而在某些情况下我们并不希望按照这样的规则来处理错误例如当一个程序允许
centos7.8从卸载python2，安装python3

因为目前所有环境都是python2 7 5 但是项目上使用的是python3 7 5 迫切需要使用python3 7 5验证安装遇到困难记录一下首先卸载python2 如果不想卸载python2的可以跳过这里卸载python2和其依
信息图：iOS 7开发者需要知道的事

如果你想为iOS 设备开发app 你需要知道如何与软件交互如何设计你还要知道苹果独特的开发理念和开发工具真正的能力还需要成功地从其他行业领域借鉴核心概念最后把所有这些东西糅合进你的信息库中所以我们画了一张iOS 7开发者应该的知识
iOS开发：使用大图+脚本，生成各种size的app icon和图片素材

美术UI在公司是宝贵的资源集各种项目宠爱于一身为了努力完成好老板的进度需求不给UI添麻烦程序员开始忙活了在iOS里面我们使用image assert来管理素材和app icon 为什么呢因为方便按照image assert要
怎样在前端遍历后端服务器传递来的json字符串中的集合？

怎样在前端遍历后端服务器传递来的json字符串中的集合后端把一个List类型的集合先转换成json字符串然后返回给通过ajax返回给前端如下图后端服务器中的代码如下图紧着着前端页面遍历后端传递来的json字符串中的集合数据先来看
读论文（二） - BERT

Introduction 预训练的语言模型在改进自然语言处理任务方面非常有效包括句子级别的任务自然语言推理和释义也包括分词级别的任务 NER和问答将预训练的语言表示应用于下游任务有两种现有策略基于特征 feature based
循环神经网络（RNN）的基本原理及LSTM的基本结构

来源于课上实验结果清晰遂上传于此实验环境TensorFlow1 14 该课件仅用于教学请勿用于其他用途详细参考实验笔记实验视频一实验目的学习掌握循环神经网络 RNN 的基本原理及LSTM的基本结构掌握利用LSTM神经元

循环神经网络（RNN）的基本原理及LSTM的基本结构

来源于课上实验，结果清晰，遂上传于此

循环神经网络（RNN）的基本原理及LSTM的基本结构 的相关文章

随机推荐

热门标签

循环神经网络（RNN）的基本原理及LSTM的基本结构的相关文章