AMD plaidml 与 CPU Tensorflow - 意外结果

2024-04-29

我目前正在运行一个简单的脚本来训练mnist数据集。

通过 Tensorflow 通过我的 CPU 运行训练给了我49us/sample和使用以下代码的 3e 纪元：-

# CPU

import tensorflow as tf
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = tf.keras.utils.normalize(x_train, axis=1)
x_test = tf.keras.utils.normalize(x_test, axis=1)

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(10, activation=tf.nn.softmax))

model.compile(optimizer='adam', loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(x_train, y_train, epochs=3)

当我使用 AMD Pro 580 运行数据集时opencl_amd_radeon_pro_580_compute_engine通过 plaidml 设置我得到以下结果249us/sample使用 15 秒的纪元，使用以下代码：-

# GPU

import plaidml.keras
plaidml.keras.install_backend()
import keras
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = keras.utils.normalize(x_train, axis=1)
x_test = keras.utils.normalize(x_test, axis=1)

model = keras.models.Sequential()
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(128, activation='relu'))
model.add(keras.layers.Dense(128, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

model.compile(optimizer='adam', loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(x_train, y_train, epochs=3)

我可以看到我的 CPU 在 CPU 测试中启动，而我的 GPU 在 GPU 测试中达到最大性能，但我很困惑为什么 CPU 的性能是 GPU 的 5 倍。

这应该是预期的结果吗？

我的代码中做错了什么吗？

看来我至少为 macOS/Keras/AMD GPU 设置找到了正确的解决方案。

TL;DR:

Do not使用 OpenCL，使用*metal反而。
Do not使用Tensorflow 2.0，仅使用Keras API

详细信息如下：

Run plaidml-setup和接送metal????????这很重要！

...
Multiple devices detected (You can override by setting PLAIDML_DEVICE_IDS).
Please choose a default device:

   1 : llvm_cpu.0
   2 : metal_intel(r)_uhd_graphics_630.0
   3 : metal_amd_radeon_pro_560x.0

Default device? (1,2,3)[1]:3
...

确保您保存了更改：

Save settings to /Users/alexanderegorov/.plaidml? (y,n)[y]:y
Success!

现在运行 MNIST 示例，您应该看到类似以下内容：

INFO:plaidml:Opening device "metal_amd_radeon_pro_560x.0"

就是这个。我已经使用进行了比较plaidbench keras mobilenet:

metal_amd_radeon_pro_560x.0最快的！

示例完成，耗时：0.435s（编译），8.057s（执行）

opencl_amd_amd_radeon_pro_560x_compute_engine.0

示例完成，耗时：3.197s（编译），14.620s（执行）

llvm_cpu.0

示例完成，耗时：3.619s（编译），47.837s（执行）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

tensorflow

machinelearning

Keras

AMD plaidml 与 CPU Tensorflow - 意外结果的相关文章

minAreaRect OpenCV 返回的裁剪矩形 [Python]

minAreaRectOpenCV 中返回一个旋转的矩形如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标以便可以通过循环框内的点来访问像素但是在 Python 中是否有更快的裁剪方法 EDIT See code在
Django 查询：“datetime + delta”作为表达式

好吧我的问题如下假设我有下一个模型这是一个简单的情况 class Period models Model name CharField field specs here start date DateTimeField field s
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
Django Web 应用程序中的 SMTP 问题

我被要求向使用 Django Python 框架实现的现有程序添加一个功能此功能将允许用户单击一个按钮该按钮将显示一个小对话框表单以输入值我确实编写了一些代码显示电子邮件已发送的消息但实际上它没有发送 My code from
如何仅注释堆积条形图的一个类别

我有一个数据框示例如下所示 data Date 2021 07 18 2021 07 19 2021 07 20 2021 07 21 2021 07 22 2021 07 23 Invalid NaN 1 1 NaN NaN NaN N
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
在 pygame 中，我如何创建一个数据结构来跟踪调整大小事件和对象的坐标？

我希望在调整屏幕大小后使鼠标事件与对象保持同步有人告诉我需要创建一个数据结构来跟踪调整事件大小新坐标以匹配调整大小如何使用简单的代数方程来完成此操作并将其集成到调整大小事件中以进行准确更新反过来做创建一个虚拟游戏地图在绘制场景
如何让 Streamlit 每 5 秒重新加载一次？

我必须每 5 秒重新加载 Streamlit 图表以便在 XLSX 报告中可视化新数据如何实现这一目标 import streamlit as st import pandas as pd import os mainDir os pa
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条
更新 matplotlib 中颜色条的范围

我想更新一个contourf在函数内绘制效果很好然而数据的范围发生了变化因此我还必须更新颜色条这就是我未能做到的地方请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
Python 或 C 语言中的 Matlab / Octave bwdist()

有谁知道 Matlab Octave bwdist 函数的 Python 替代品此函数返回给定矩阵的每个单元格到最近的非零单元格的欧几里得距离我看到了一个 Octave C 实现一个纯 Matlab 实现我想知道是否有人必须用 AN
Python RE（总之检查第一个字母是否区分大小写，其余部分不区分大小写）

在下面的情况下我想匹配字符串 Singapore 其中 S 应始终为大写其余单词可能为小写或大写但在下面的字符串 s 是小写的它在搜索条件中匹配任何人都可以让我知道如何实施吗 import re st Information in
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt
python 日志记录替代方案 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案蟒蛇记录模块 http docs python org library logging html使用起来

随机推荐

Flex 子项上的文本溢出省略号不起作用[重复]

这个问题在这里已经有答案了我有一个容器flex 我希望中间的孩子占据整个空间所以我设置了它flex 1 到目前为止一切都很好下一个级别是中间的孩子有 2 个孩子所以我也想将其设置为 Flex 如果你迷失了我只需跳到片段第一个孩
如何抑制有关已弃用 api 的 javac 警告？

当我编译时 javac 输出 Note Some input files use or override a deprecated API Note Recompile with Xlint deprecation for details
如何将文件保存到 iPhone 上？

我有一个问题你们大多数人可能会觉得有点奇怪我正在为 OS X 制作一个应用程序但我需要它来将文本文件写入 iPhone 文件夹我知道 iPhone 必须连接到电脑而且我认为发送电子邮件不起作用我认为这就像在连接时找到 iPhon
作为 iOS 应用程序向 Google Cloud Endpoints 进行身份验证（不是具有 Google 帐户凭据的用户）

我的一个 iOS 应用程序使用 Google Cloud Endpoints 联系我的一项服务我想限制该应用程序实例对该服务的访问我已按照有关添加的说明进行操作授权 https developers google com appengi
我们可以在 Mysql 查询中使用 PHP 函数 strtotime [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有以下 MySQL 语法这给了我一个错误我知道你不能直接比较日期变量所以我使用strtotime创建 Unix 时间戳来比较日
尽管设置为 1.7，IntelliJ IDEA 13 仍使用 Java 1.5

尽管在所有项目设置中指定了 JDK 1 7 包括File gt Project Structure gt Project Project SDK 则产生以下错误IntelliJ 13当尝试编译一些使用菱形运算符的简单 Java 7 代码时
Spring：当我的类已经用@RestController注释时，为什么我仍然应该使用@RequestBody？

我目前正在将 Java 和 Spring 用于我的 Web 服务应用程序我正在使用 RestController希望消除使用注释的需要 ResponseBody and RequestBody注释不幸的是删除 RequestBody注
“程序中出现杂散'\226'”编译器错误[重复]

这个问题在这里已经有答案了我写了下面的代码其目的是实施一个双向链表但出现了错误 while x 1 This line showed errors return 1 Errors DoublyLinkedList c In funct
如何在 django 中为模板应用背景图像

在我的网站中在特定的表格中我必须插入图像作为背景我这样做了但图像看起来像双图像因为图像小于单元格宽度和高度它正在重叠在背景图像单元格中我使用 no repeat 来结束同一图像的重复显示但它不起作用我正在 django
如何使用 UIImagePickerController 呈现 ViewController

我试图提出一个ImagePicker 然后在用户选择图像后呈现图像编辑ViewController用户可以在其中操作图像然后将编辑后的图像发送回原始图像ViewController 问题是否有一种标准或最佳实践方法从初始 ViewCo
使用 QtDesigner 的 pyQt 信号/槽

我正在尝试编写一个与 QGraphicsView 交互的程序我想在 QGraphicsView 中发生事件时收集鼠标和键盘事件例如如果用户单击 QGraphicsView 小部件我将获得鼠标位置类似的东西我可以很容易地对其进行硬
如何从 __subclasses__ 中删除类？

当从类继承时子类可以通过父类访问 subclasses method class BaseClass pass class SubClass BaseClass pass BaseClass subclasses
std::forward 的实现

我正在阅读新 C 概述 C 11 14 仅限 PDF http www artima com shop overview of the new cpp 在幻灯片 288 中它给出了一个实现std forward template
在 collectionView 单元格上添加边框

每次用户单击特定单元格时该单元格都会有边框问题是当我来回滚动时边框会选择随机单元格来设置边框 func collectionView collectionView UICollectionView didSelectItemAt in
使用 TABS 时 DataTable.js 无法正确加载

我使用 DataTables js 生成表非常棒运行良好我想将选项卡添加到我的页面但似乎当在主选项卡以外的其他选项卡上使用 DataTables 时它不会加载所有内容 First Tab 2nd Tab 以下是添加了 DataT
如何修复 scanf 将数据放入数组中？

有人可以就 scanf 提出建议吗 message 是一个 4 行 x 16 列的数组用户输入数字全部为 1 位整数后按 Enter 键时会出现错误消息正如所说可能与 scanf 有关 for int i 0 i lt M i
如何将 Chosen 合并到我的 React 项目中？

我想使用 jquery 插件Chosen https harvesthq github io chosen 在我的项目中我安装了 jQuery 并通过 npm 选择 npm i jquery chosen js S 这两个库现在都位于我的
jquery画布图像下载

我有我的画布元素和一些 div 单击后我希望打开下载画布快照现在我有 save live click function e var image canvas toDataURL image png true var imageEleme
在 Firebase 函数中验证 reCAPTCHA v3 导致 CORS 问题

我有以下代码可以验证谷歌验证码 v3在我的 Firebase 函数中导致CORS issue const functions require firebase functions const nodemailer require nodem
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k

AMD plaidml 与 CPU Tensorflow - 意外结果

AMD plaidml 与 CPU Tensorflow - 意外结果 的相关文章

随机推荐

热门标签

AMD plaidml 与 CPU Tensorflow - 意外结果的相关文章