CPU 上的 Keras LSTM 比 GPU 更快？

2024-01-03

我正在 Keras 上测试 LSTM 网络，在 CPU 上的训练（i2600k 16GB 上为 5 秒/epoch）比在 GPU 上（Nvidia 1060 6GB 上为 35 秒）要快得多。 GPU 利用率运行在 15% 左右，在尝试其他 LSTM 网络（包括 Keras 示例）时，我从未见过它超过 30%。当我运行其他类型的网络 MLP 和 CNN 时，GPU 速度要快得多。我正在使用最新的 theano 0.9.0dev4 和 keras 1.2.0

该序列有 50,000 个时间步长和 3 个输入（整数）。

如果输入为降序 (3,2,1)，则输出为 0，如果输入为升序，则输出为 1，除非最后两个也为升序，则输出为 0 而不是 1。

使用 Keras 的CuDNNLSTMNvidia GPU 上加速计算的单元：https://keras.io/layers/recurrent/#cudnnlstm https://keras.io/layers/recurrent/#cudnnlstm

这只是改变LSTM线路至：

model.add(CuDNNLSTM(20, input_shape=(50000,3), return_sequences=True))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CPU 上的 Keras LSTM 比 GPU 更快？的相关文章

LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
为什么 Haskell 的默认字符串实现是一个字符链接列表？

Haskell 默认值的事实String众所周知实现在速度和内存方面都效率不高据我所知 lists一般来说在 Haskell 中实现为单链表并且适用于大多数小型简单数据类型例如Int 这似乎不是一个好主意但是对于String这
为什么我的原生 C++ 代码在 Android 上运行速度比 Java 慢很多？

我将 Java 代码的某些部分移植到 C 以加快 Android 上的计算速度这是一个物理子例程我发现本机代码的运行速度比 Java 代码慢几倍我认为我的项目配置可能有问题或者可能是数组处理有问题所以我在 HelloAndroid
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
Oracle Many OR 与 IN () 的 SQL 性能调优 [重复]

这个问题在这里已经有答案了我手头没有解释计划您能帮忙判断以下哪一个更有效吗选项1 select from VIEW ABC where STRING COL AA OR STRING COL BB OR STRING COL BB
超慢的表格布局性能

我遇到了糟糕的 TableLayout 性能我在这里读过一些帖子谈论同样的事情 Android 动态创建表性能不佳 https stackoverflow com questions 9813427 android dynamical
我应该增强客户端上的 Jquery Mobile 元素还是发送带有 data-enhance="false" 的增强标记？

我有一个产品搜索我正在发送回结果每个结果都包含两个按钮 JQM 控制组我一次发送 24 条记录因此需要增强 24 个控制组如下所示 div class submitButton linkBox div
如何读取 GPU 负载？

我正在编写一个程序用于监控计算机的各种资源例如CPU使用率等我还想监控 GPU 使用情况 GPU 负载而不是温度 using System using System Collections Generic using System
双端队列与队列速度

我正在研究 LeetCode 上的一个问题 Here https leetcode com problems moving average from data stream 当我完成这个问题后我想出了 class MovingAverag
c++11 正则表达式比 python 慢

嗨我想了解为什么以下代码使用正则表达式进行分割字符串分割 include
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
java charAt() 和startsWith() 哪个更快？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我的问题是如果我想检查特定索引中字符串的一个字符仅检查一个字符哪种方法非常有效charAt or startsWith 我的意思是据我所
R：使用带有 .Call 和 C/C++ 包装器的 Fortran 子例程而不是 .Fortran 的优点？

我有一个 R 包它使用大量 Fortran 子例程来进行递归线性代数计算的嵌套循环很大程度上依赖于 BLAS 和 LAPACK 例程作为 Fortran 的接口我使用 Fortran功能我刚刚读过乔纳森卡拉汉的博客文章 http
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
确定向量中是否存在元素的最有效方法

我有几种算法取决于确定元素是否存在于向量中的效率在我看来这 in 这相当于is element 应该是最有效的因为它只返回一个布尔值在测试了几种方法之后令我惊讶的是这些方法是迄今为止效率最低的以下是我的分析随着向量大小的增加
通过增加索引之和来生成排序组合的有效方法

对于启发式算法我需要一个接一个地评估特定集合的组合直到达到停止标准由于它们很多目前我正在使用以下内存高效迭代器块生成它们受到 python 的启发 itertools combinations http docs python o
大数组上的 SSE 性能较慢

我是 SSE 编程新手所以我希望有人可以帮助我我最近使用 GCC SSE 内在函数实现了一个函数来计算 32 位整数数组的总和下面给出了我的实现代码 int ssum const int d unsigned int len stat
jQuery - 提高处理 XML 时的选择器性能

我正在处理一个 XML 文件当使用 XPath 样式选择器选择节点时该文件的性能非常慢这是运行特别慢的部分代码 for i 0 i
Python——捕获异常的效率[重复]

这个问题在这里已经有答案了可能的重复 Python 常见问题解答异常有多快 https stackoverflow com questions 8107695 python faq how fast are exceptions 我记得

随机推荐

Vue 和 Bootstrap Vue - 动态使用插槽

我试图在 bootstrap vue 表中创建一个插槽以使用自定义组件呈现任何布尔值所以我有一个简单的表
自动部分重新索引何时在 Magento EE 1.13 中实际运行？

Magento 1 13 为大多数索引添加了部分索引并能够将索引过程推迟到异步运行的 cron 作业我的问题是是否有现有的 cron 作业可以执行此操作或者这是我必须自己设置的东西文档对此并不清楚 http www magento
如何在 Android 应用程序中单击按钮时打开网站？

我正在设计一个应用程序有几个按钮供用户单击单击按钮后用户将被定向到适当的网站我该如何实现这个目标如果您正在谈论 RCP 应用程序那么您需要的是 SWTlink widget Here http dev eclipse org v
在 Google 表格中查找默认填充颜色的颜色代码

我正在编写一个脚本使用以下命令为 Google 电子表格中的单元格着色Range setBackground color 方法我想使用一种预设填充颜色但我很难找到确切的颜色代码十六进制 RGB 我只想要一个官方列表 000000 4
如何知道应用程序是否首次在 Mac 上运行

在Windows上我们可以将值写入注册表来知道但我如何知道我的应用程序是否是第一次在 Mac 上运行我需要执行一些初始化任务 Thanks 您正在寻找班级NSUserDefaults see 苹果文档 http developer a
完整的未来 | thenApplyAsync 与 thenCompose 及其用例[重复]

这个问题在这里已经有答案了我试图理解 CompletableFuture 并遇到了两种方法 thenApplyAsync 和 thenCompose 我试图理解这两者之间的区别 CompletableFuture
HTML5：通过 JavaScript 绘图后将透明度应用于 Canvas

我试图将多个对象绘制到画布元素上然后将它们干净地淡出然而当尝试使用 globalAlpha 来实现此目的时您可以看到通常会被遮挡的对象片段因为每个对象都变得单独透明解释考虑以下代码 context fillStyle yell
Moment Js 获取两个日期之间的小时差

我可以使用 MomentJs 获取两个日期之间的差异如下所示 moment end diff startTime format m m s s 但是我还想在适用时显示小时仅当已过去 gt 60 分钟时但是当我尝试使用以下命令检索持
用于分析 OCaml 代码的工具 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案除了在编译时使用 p 选项然后使用 gprof 之外是否有人知道用于分析 OCaml 代码的程序我
R 数据表 setkey - 错误某些列不在 data.table 中

我想使用 data tablesetkey具有预定义列表id and categories 但收到错误消息 gt setkey tr id cat dt id categories Error in setkeyv x cols verbo
有没有办法让 BaseX 提供 HTML 文档服务？

有没有办法让 BaseX 的 HTTP 服务器提供 HTML 文档该文档可以作为原始资源存储在数据库中也可以存储在文件系统中具有 text html 内容类型以便可以在浏览器中显示该文档是一个向 BaseX 发出 XHR 请求的网
如何在 R 中将因子转换为日期时间？

这个问题对你们中的一些人来说可能很简单但请耐心等待因为我是 R 的初学者我有一个数据框其中有一个因子列称为时间其中包含日期时间数据如下所示 time 01 01 2011 00 10 02 01 2011 03 00 03 0
在C中交换指针[重复]

这个问题在这里已经有答案了 include
在 Ruby 中使用或运算符简化“任意”检查

如何简化以下检查 if node base database adapter empty node base database host empty node base database database empty node base d
使用 Git 功能分支工作流程，什么时候更新 master 分支？

我对 git 和 Jenkins 相当陌生我们想要使用 Jenkins 并遵循功能分支工作流程概念 https www atlassian com git tutorials comparing workflows feature bra
RFC 2388 多部分 POST 的服务器实现与 RFC 2047 冲突？

我正在尝试在 HTTP 服务器上实现 RFC 2388 以支持多部分 POST 我正在专门查看内容处置的名称参数的规范 RFC 2388 第 3 节规定最初采用非 ASCII 字符集的字段名称可能会被编码使用标准方法在 name 参
弱 ISA 如何使用存储缓冲区解决 WAW 内存危险？

现代 CPU 使用存储缓冲区来延迟提交到缓存直至报废同时也避免了 WAR 和 WAWmemory危险我想知道弱 ISA 如何使用存储缓冲区否则不是 FIFO 解决 WAW 危险从而允许 StoreStore 重新排序他们是否插入了
如果 Nexus 服务器关闭，如何配置 Maven 访问 Maven Central？

我想设置我的构建以便它自动尝试从 Maven Central 下载工件前提是我们的 Nexus 服务器无法访问我在 settings xml 中有以下内容但我不知道如何更改它如果可能的话
从preferences.xml启动一个活动

我正在尝试进入位于的设置屏幕 android provider Settings ACTION LOCATION SOURCE SETTINGS 来自我的偏好活动的条目但我没有运气目前按下该条目只会刷新与我所在的屏幕相同的屏幕我的
CPU 上的 Keras LSTM 比 GPU 更快？

我正在 Keras 上测试 LSTM 网络在 CPU 上的训练 i2600k 16GB 上为 5 秒 epoch 比在 GPU 上 Nvidia 1060 6GB 上为 35 秒要快得多 GPU 利用率运行在 15 左右在尝试其他 L

CPU 上的 Keras LSTM 比 GPU 更快？

CPU 上的 Keras LSTM 比 GPU 更快？ 的相关文章

随机推荐

热门标签

CPU 上的 Keras LSTM 比 GPU 更快？的相关文章