使用所需的优化标志重新构建 Tensorflow

2024-04-17

预先感谢您的考虑，

我刚刚使用以下命令安装了tensorflow（在已安装Ubuntu 16.04和CUDA 8.0的新机器上）程序 http://www.nvidia.com/object/gpu-accelerated-applications-tensorflow-installation.html:

最初，我使用--copt=-march=native。我收到消息了

Wtensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 SSE3 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

Wtensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 SSE4.1 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

W tensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 SSE4.2 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

Wtensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 AVX 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

Wtensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 AVX2 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

W tensorflow/core/platform/cpu_feature_guard.cc:45] TensorFlow 库未编译为使用 FMA 指令，但这些指令可在您的计算机上使用，并且可以加快 CPU 计算速度。

因此，为了尝试解决此问题，我搜索了解决方案并使用了以下答案如何使用SSE4.2和AVX指令编译Tensorflow？ https://stackoverflow.com/questions/41293077/how-to-compile-tensorflow-with-sse4-2-and-avx-instructions#

通过使用 nVidia 的上述过程，从

bazel build -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mfpmath=both --copt=-msse4.2 --config=cuda -k //tensorflow/tools/pip_package:build_pip_package

但我仍然收到与上面相同的消息。我觉得我犯了一个非常简单的错误，有什么想法吗？

Thanks!

通过遵循 NVIDIA 指令，您将在 SIMD 指令优化可用 (1.0r) 之前将 TensorFlow 存储库重置为较旧的提交：

git reset --hard 70de76e

此提交可以追溯到以前的版本，当时此功能尚未实现，因此它实际上按预期工作。

解决方案是遵循官方 TensorFlow 文档 https://www.tensorflow.org/install/install_sources.

对于未来的情况，始终建议在寻求第三方解决方案之前使用官方资源，因为它们可能更有帮助，官方资源更可靠且维护得更好。

请注意，在配置过程中，由于上述原因，系统不会提示您要使用哪些 CPU 指令来构建 TF，因此您无法使用它们进行构建。

Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native]:

按照官方文档进行操作即可。如果您有任何后续问题，请随时提出，或者如果您遇到任何问题，请在 Github 上提出问题:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

使用所需的优化标志重新构建 Tensorflow 的相关文章

带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
Tensorflow：使用 Adam 优化器

我正在张量流中试验一些简单的模型包括一个看起来与第一个非常相似的模型面向 ML 初学者的 MNIST 示例 http www tensorflow org tutorials mnist beginners index md 但维数稍大一
加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
如何使用功能 API 训练 Keras 模型，该模型具有两个输入和两个输出，并使用两个 ImageDataGenerator 方法 (flow_from_directory)

我想使用 Function Keras API 创建一个模型该模型将有两个输入和两个输出该模型将使用两个实例ImageDataGenerator flow from directory 方法从两个不同的目录分别是inputs1和inp
3D 卷积神经网络输入形状

我在使用 3D CNN 提供数据时遇到问题Keras http keras io和 Python 对 3D 形状进行分类我有一个文件夹其中包含一些 JSON 格式的模型我将这些模型读入 Numpy 数组模型为 25 25 25 表示
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
使用 TensorFlow 2.1 的 Cloud TPU v3 Pod 的 TPUClusterResolver 出现错误

我正在尝试在带有 TensorFlow 2 1 的 Google Cloud Compute Engine VM 上使用我的抢占式 Cloud TPU v3 256 但它似乎无法正常工作TPUClusterResolver抛出一个Coul
访问 AWS 上的 Tensorboard

我正在尝试访问 AWS 上的 Tensorboard 这是我的设置张量板 tensorboard host 0 0 0 0 logdir train 在端口 6006 上启动 TensorBoard b 39 您可以导航到http 172
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant

随机推荐

如何在 Visual Studio Code 中更新 C# 版本？

我已经安装了 C 扩展我的 NET 框架已更新但我无法修复它我已经找到了修复方法希望这对将来的人有所帮助找你的 csproj file 将 LangVersion 属性更改为所需版本
AMD64 ABI 中的空类会发生什么情况？

我正在看AMD64 ABI http www cs tufts edu comp 40 readings amd64 abi pdf并且它似乎没有指定如何传递空类类型对于空类成员函数似乎this照常传递但对于空类 Clang 生成的代
RcppEigen - 从包中的内联函数到 .cpp 函数和“Map”

一切似乎都在我的包中工作但我想检查其步骤是否正确以及使用 Map 的内存使用情况这是一个简单的示例位于内联示例和fastLm 例子这是一个内联函数它取矩阵每一列的最大值 library Rcpp library inline li
如何将 long (currentTimeInMillis) 转换为 UTC 时间戳？

我的客户正在向我发送Long这可以被认为是 scala gt System currentTimeMillis res3 Long 1441056836609 scala gt 我如何将其转换为UTC时间戳在服务器上我们使用Java 8
Threejs + Vanilla JS 和 React-Three-Fiber + Create-React-App 之间的颜色差异

这已经困扰我一段时间了为什么 React Three Fiber 中的材质颜色看起来比 Threejs 中暗淡两种实现中的对象及其属性是相同的 Threejs 版本相同在新引导中实施 create react app 没有额外的依赖项
在 Eclipse 中编辑代码时如何禁用粗体字体？

我不希望 Eclipse 以粗体显示任何关键字我浏览了首选项窗口中的很多选项但找不到执行此操作的方法是否可以这取决于您正在编辑的文件类型例如在 Java 中窗口菜单 gt 首选项 gt Jave gt 编辑器 gt 语法着
Java反应式框架的比较[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我看到许多框架库声称它们可以帮助用 Java 构建响应式应用程序例如 Akka Vert x RxJava Reactor QBit 等他
如何将 activemq-core.xsd url 与 jar 文件中找到的 activemq.xsd 关联？

有人知道如何关联activemq core xsd网址与activemq xsd在 jar 文件 activemq core 5 2 0 jar 中找到我在互联网上找到了一些解决方案但没有成功我收到此错误 Caused by org
如何在 Rails 中保守 Secrets.yml 的秘密？

我对 Rails 还很陌生但我有一些 PHP 和其他语言编程经验我真的很喜欢 Rails 并且正在为我的公司开发一个应用程序但我仍然不完全理解 Secrets yml 文件如何与 git 和 heroku 配合使用我知道秘密用于身份
Swiper 在 Jquery Mobile 中不起作用

我在用idangero us 的 Swiper http www idangero us sliders swiper index php使用 Jquery 移动我在这里使用滚动容器滑动器对于内容滑块只是面临着将代码嵌入在一起的很多问题
rake db:rollback 为什么要回滚三步？

通常当我这样做时 rake db rollback 它会回滚一次迁移但现在反复多次已经回退了3步怎么会有这种行为呢我使用的是 Rails 3 2 13 您可以像这样指定步骤数 rake db rollback STEP 3 The
如何更改Cloud Functions部署中使用的bundler版本？

Context 从几天前开始云功能的部署一直失败 Gemfile source https rubygems org ruby gt 2 7 0 git source github repo name https github com r
如何在 Clojure 中处理大型二进制数据？

如何在 Clojure 中处理大型二进制数据文件我们假设数据文件大约为 50MB 小到足以在内存中处理但不是简单的实现以下代码正确地从小文件中删除 M 但它会抛出OutOfMemoryError对于较大的文件如 6MB defn
需要在单个 Facebook 应用程序中添加多个域

我正在尝试在我的 Facebook 应用程序中添加多个域但尚未成功我做了很多研究发现 Facebook 不断改变其设置添加多个域名最初是不可能的但后来他们让它成为可能然后又变得不可用但没有更新如果现在可以完成的话无论如何我
在 Windows 上安装 gokogiri 时找不到错误 libxml2

我正在尝试安装gokogiri https github com moovweb gokogiri在 Windows 8 机器上按照 github 页面中的说明进行操作安装 sudo apt get install libxml2 dev
ofstream::open 什么时候会失败？

我正在尝试在 C 中尝试捕获抛出语句进行文件处理并且我编写了一个虚拟代码来捕获所有错误我的问题是为了检查我是否正确我需要发生错误现在我可以轻松检查infile fail 只需不在目录中创建所需名称的文件即可但我怎样才能检查同样
Java编译器选择错误的重载[重复]

这个问题在这里已经有答案了 Test public void test MyProperties props new MyProperties props setProperty value new Date StringUtils isN
更新实体框架中的数据库架构

我安装了 VS SP1 并使用了实体框架我从现有数据库创建了一个架构并尝试了一些基本操作除了数据库架构更新之外大部分进展顺利我以各种基本方式更改了数据库添加了一个新表删除了一个表向现有表添加新列从现有表中删除一列更改了现有
linux 日期命令中的无效日期错误

在脚本中我使用命令 CURRENT DATE tmp date d CURRENT DATE Y m d 它给出了错误date invalid date Y m d 可能是什么原因我知道变量 CURRENT DATE 有其值 date d
使用所需的优化标志重新构建 Tensorflow

预先感谢您的考虑我刚刚使用以下命令安装了tensorflow 在已安装Ubuntu 16 04和CUDA 8 0的新机器上程序 http www nvidia com object gpu accelerated application

使用所需的优化标志重新构建 Tensorflow

使用所需的优化标志重新构建 Tensorflow 的相关文章

随机推荐

热门标签