keras LSTM 层训练时间太长

2023-11-26

每当我在 Keras 上尝试 LSTM 模型时，似乎由于训练时间过长，该模型无法训练。

例如，像这样的模型每步需要 80 秒来训练：

def create_model(self):
        inputs = {}
        inputs['input'] = []
        lstm = []
        placeholder = {}
        for tf, v in self.env.timeframes.items():
            inputs[tf] = Input(shape = v['shape'], name = tf)
            lstm.append(LSTM(8)(inputs[tf]))
            inputs['input'].append(inputs[tf])
        account = Input(shape = (3,), name = 'account')
        account_ = Dense(8, activation = 'relu')(account)
        dt = Input(shape = (7,), name = 'dt')
        dt_ = Dense(16, activation = 'relu')(dt)
        inputs['input'].extend([account, dt])

        data = Concatenate(axis = 1)(lstm)
        data = Dense(128, activation = 'relu')(data)
        y = Concatenate(axis = 1)([data, account, dt])
        y = Dense(256, activation = 'relu')(y)
        y = Dense(64, activation = 'relu')(y)
        y = Dense(16, activation = 'relu')(y)
        output = Dense(3, activation = 'linear')(y)

        model = Model(inputs = inputs['input'], outputs = output)
        model.compile(loss = 'mse', optimizer = 'adam', metrics = ['mae'])
        return model

而使用 Flatten + Dense 替代 LSTM 的模型如下：

def create_model(self):
        inputs = {}
        inputs['input'] = []
        lstm = []
        placeholder = {}
        for tf, v in self.env.timeframes.items():
            inputs[tf] = Input(shape = v['shape'], name = tf)
            #lstm.append(LSTM(8)(inputs[tf]))
            placeholder[tf] = Flatten()(inputs[tf])
            lstm.append(Dense(32, activation = 'relu')(placeholder[tf]))
            inputs['input'].append(inputs[tf])
        account = Input(shape = (3,), name = 'account')
        account_ = Dense(8, activation = 'relu')(account)
        dt = Input(shape = (7,), name = 'dt')
        dt_ = Dense(16, activation = 'relu')(dt)
        inputs['input'].extend([account, dt])

        data = Concatenate(axis = 1)(lstm)
        data = Dense(128, activation = 'relu')(data)
        y = Concatenate(axis = 1)([data, account, dt])
        y = Dense(256, activation = 'relu')(y)
        y = Dense(64, activation = 'relu')(y)
        y = Dense(16, activation = 'relu')(y)
        output = Dense(3, activation = 'linear')(y)

        model = Model(inputs = inputs['input'], outputs = output)
        model.compile(loss = 'mse', optimizer = 'adam', metrics = ['mae'])
        return model

每步训练需要 45-50 毫秒。

模型中是否存在导致此问题的问题？或者这是否与该模型的运行速度一样快？

-- self.env.timeframes 看起来像这样：有 9 个项目的字典

timeframes = {
            's1': {
                'lookback': 86400,
                'word': '1 s',
                'unit': 1,
                'offset': 12
                },
            's5': {
                'lookback': 200,
                'word': '5 s',
                'unit': 5,
                'offset': 2
                },
            'm1': {
                'lookback': 100,
                'word': '1 min',
                'unit': 60,
                'offset': 0
                },
            'm5': {
                'lookback': 100,
                'word': '5 min',
                'unit': 300,
                'offset': 0
                },
            'm30': {
                'lookback': 100,
                'word': '30 min',
                'unit': 1800,
                'offset': 0
                },
            'h1': {
                'lookback': 200,
                'word': '1 h',
                'unit': 3600,
                'offset': 0
                },
            'h4': {
                'lookback': 200,
                'word': '4 h',
                'unit': 14400,
                'offset': 0
                },
            'h12': {
                'lookback': 100,
                'word': '12 h',
                'unit': 43200,
                'offset': 0
                },
            'd1': {
                'lookback': 200,
                'word': '1 d',
                'unit': 86400,
                'offset': 0
                }
            }

提示中的 GPU 信息 -

2018-06-30 07:35:16.204320: I T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
2018-06-30 07:35:16.495832: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1356] Found device 0 with properties:
name: GeForce GTX 1080 major: 6 minor: 1 memoryClockRate(GHz): 1.86
pciBusID: 0000:01:00.0
totalMemory: 8.00GiB freeMemory: 6.59GiB
2018-06-30 07:35:16.495981: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1435] Adding visible gpu devices: 0
2018-06-30 07:35:16.956743: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-06-30 07:35:16.956827: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:929]      0
2018-06-30 07:35:16.957540: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:942] 0:   N
2018-06-30 07:35:16.957865: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 6370 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080, pci bus id: 0000:01:00.0, compute capability: 6.1)

如果您使用 GPU，请将所有 LSTM 层替换为 CuDNNLSTM 层。您可以从以下位置导入它keras.layers:

from keras.layers import  CuDNNLSTM

def create_model(self):
    inputs = {}
    inputs['input'] = []
    lstm = []
    placeholder = {}
    for tf, v in self.env.timeframes.items():
        inputs[tf] = Input(shape = v['shape'], name = tf)
        lstm.append(CuDNNLSTM(8)(inputs[tf]))
        inputs['input'].append(inputs[tf])
    account = Input(shape = (3,), name = 'account')
    account_ = Dense(8, activation = 'relu')(account)
    dt = Input(shape = (7,), name = 'dt')
    dt_ = Dense(16, activation = 'relu')(dt)
    inputs['input'].extend([account, dt])

    data = Concatenate(axis = 1)(lstm)
    data = Dense(128, activation = 'relu')(data)
    y = Concatenate(axis = 1)([data, account, dt])
    y = Dense(256, activation = 'relu')(y)
    y = Dense(64, activation = 'relu')(y)
    y = Dense(16, activation = 'relu')(y)
    output = Dense(3, activation = 'linear')(y)

    model = Model(inputs = inputs['input'], outputs = output)
    model.compile(loss = 'mse', optimizer = 'adam', metrics = ['mae'])
    return model

以下是更多信息：https://keras.io/layers/recurrent/#cudnnlstm

这将显着加快模型速度 =)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

keras LSTM 层训练时间太长的相关文章

切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
即使页面未完全加载，我们也可以使用 Selenium 获取页面源吗（TimeoutException: Message: timeout）？

即使遇到 TimeoutException Message timeout 也能获取页面源码吗当我调用 driver page source 时有时无法加载整页但我只需要它的部分信息尚未确定所以我只想在任何情况下保存页面是否可以
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

C# 仅使用代码添加引用（没有 IDE“添加引用”功能）

我正在为一个程序编写一个插件我想将我的代码放入 DLL 中这样我就可以自由地共享该插件而无需暴露泄露我的代码这是我可以访问的基本结构 using System public class Plugin public void In
flutter - 自更新到 firebase 9.0.X 以来出现错误 event.snapshot.value

我收到错误event snapshot value自从更新到 firebase 9 0 5 以来我有很多这样的函数它们在 firebase 8 X 中运行良好 Stream
如何根据指定的行数拆分 CSV 文件？

我有 CSV 文件大约 10 000 行每行有 300 列存储在 LINUX 服务器上我想将此 CSV 文件分成 500 个 CSV 文件每个文件有 20 条记录每个都具有与原始 CSV 中相同的 CSV 标头有没有什么lin
Java HTTP/2 服务器套接字

我想让服务器套接字在 Java 中支持 HTTP 2 最好是 TLS https 我有一个 TLS 服务器套接字工作正常但浏览器只能与它对话 HTTP 1 1 如果我理解正确的话您需要 ALPN 来让 HTTP 2 浏览器连接到您的 T
如何在 SELECT 语句中使用 BOOLEAN 类型

我有一个参数为 BOOLEAN 的 PL SQL 函数 function get something name in varchar2 ignore notfound in boolean 此功能是第三方工具的一部分我无法更改它我想在
如何授予 ASP.NET 写入 Windows 7 文件夹的权限？

我有一个新的 Win7 工作站我正在尝试让 ScrewTurn Wiki 在该机器上运行我的 STW 安装使用文件系统选项来存储其数据因此我需要向网站安装文件夹中的 ASP NET 工作进程授予写入权限然而我似乎无法想出 Win7
如何更改 openshift 容器平台中的权限？

我是 Openshift 的新手我已经在 openshift 中部署了一个应用程序当我检查日志时某些文件存在权限被拒绝错误现在我想更改已部署在 Openshift 中的容器的权限但收到不允许操作警告我该如何解决这是针对运
面试：为集合的集合设计一个迭代器

在java中为集合的集合设计一个迭代器迭代器应该隐藏嵌套允许您迭代属于所有集合的所有元素就像使用单个集合一样这是一个老问题但现在 2019 年我们有了 JDK8 的好东西特别是我们有流这使得这项任务变得简单 public
自定义 Mathematica 快捷键

Is there a place I can view change global shortcut options like Command 9 turn into Input style 特别是我需要一种更快的方法来创建项目符号列表
从元组列表中格式化 JSON 字符串的更 Pythonic 方式

目前我正在这样做 def getJSONString lst join rs for i in lst rs join str i 0 str i 1 join return rs 我称之为 rs getJSONString name va
字符串中的 JSON 转义序列无效

我正在使用一个 MySQL 数据库它为谷歌地图编码了多边形当我尝试以 json 形式返回查询时 jsonlint 抱怨我不确定为什么它抱怨我确实尝试转义 latlon 中的但仍然得到相同的错误 Parse error on lin
JavaScript：打印前 12 个月——“March”打印两次？

我正在尝试编写一个脚本来打印过去 12 个月的名称由于本月是一月因此应该打印十二月十一月十月九月八月七月六月可能四月行进二月一月相反它打印 March 两次 http jsfiddle net h69gm04
有什么方法可以分析 firestore 数据库吗？

我的 Firestore 数据库中的实体写入数量非常多大多数路径的写入权限都受到限制通过后端服务器使用 admin SDK 完成只有极少数路径具有写访问权限特别是仅对已通过身份验证注册加入和批准的特定组的用户而言因此即使滥用的
连接到 Amazon RDS Oracle 实例时如何解决“读取调用减一”错误

我在 Amazon RDS 实例上运行 Oracle 11GR2 有时我会得到一个IO Error Got minus one from a read call当打电话给DriverManager getConnection getUrl
Git 哈希重复

Git 允许使用以下命令检索提交的哈希值 git rev parse HEAD 这使33b316c or git rev parse short HEAD 这使33b316cbeeab3d69e79b9fb659414af4e7829a32
错误：未找到名称“ngModel”的导出

构建我的角度项目后我收到错误错误未找到名称 ngModel 的导出我的 UI 在 Docker 容器中运行甚至不知道在哪里寻找这个它在开发中工作正常发球有任何想法吗我有同样的错误尽管在开发中事实证明我没有添加表单模块模
如何从 Google Analytics 获取原始日志？

是否可以从 Google Analytic 获取原始日志有没有可以从GA生成原始日志的工具不您无法获取原始日志但没有什么可以阻止您将完全相同的数据记录到您自己的 Web 服务器日志中看看顽童代码并借用它将以下两行更改为指向您的
如何创建 AND 或 OR 表达式？

我写了这个 if a 11 b 1 if a 1 AND b 1 但两者都不起作用我也有同样的问题OR 如何编写包含以下内容的表达式OR or AND You use 对于和以及为或
如何将 JavaScript onClick 处理程序添加到嵌入的 html 对象？

我正在尝试将 onClick 处理程序添加到嵌入对象中处理程序需要执行外部 js 文件中的函数该文件通过链接到当前 html 文件button svg id buttonEmbed width 95 height 53 type ima
keras LSTM 层训练时间太长

每当我在 Keras 上尝试 LSTM 模型时似乎由于训练时间过长该模型无法训练例如像这样的模型每步需要 80 秒来训练 def create model self inputs inputs input lstm placehol

keras LSTM 层训练时间太长

keras LSTM 层训练时间太长 的相关文章

随机推荐

热门标签

keras LSTM 层训练时间太长的相关文章