单线程影响 TensorFlow Keras 后端的模型准确性和损失

2024-01-03

Question

为什么在 Keras 的 TensorFlow 后端设置线程数，intra_op_parallelism_threads and inter_op_parallelism_threads, 到 1 对模型的准确性和损失产生负面影响？

背景

我正在使用 Keras (2.1.6) 训练 MNIST CNN，并以 TensorFlow (1.7.0) 作为后端。我在 AWS EC2 实例中运行一些训练，发现从 t2.medium 实例切换到 t2.small 后，我的准确性大大下降。发生这种情况时根本没有更改两种实例类型之间的代码。

鉴于 CPU 核心数量从 t2.medium（2 核心）变为 t2.small（1 核心），我假设精度的下降与线程有关。为了测试这一点，我强制 TensorFlow 使用单线程并在本地运行训练。

from keras import backend as K
config = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)

sess = tf.Session(graph=tf.get_default_graph(),config=config)
K.set_session(sess)

在我的本地计算机上，使用单线程运行比运行多线程产生的结果要差得多。

一次单线程训练运行的结果是：

train_loss: 2.303228187561035 train_accuracy: 10.75%

而多线程训练运行的结果是：

train_loss: 0.3670464503765106 train_accuracy: 88.00%

这些结果对我来说没有意义，因为在我看来，无论使用多少线程，运行一定数量的训练周期都应该导致相同数量的计算工作。我的测试结果似乎表明，更多的线程会进行更多的训练，而不仅仅是使用并行性来提高速度。

我浏览了 GitHub 中的 Keras 存储库，但没有找到任何代码让我明白为什么结果会如此不同。

我正在给 Keras 打电话model.fit()训练模型并model.evaluate()以获得损失和准确性。

以下是我的一些超参数：

loss_function: categorical_crossentropy
optimizer: Adadelta
epochs: 12
mini_batch_size: 128
train_size: 600
validate_size: 400

更新 2018 年 6 月 26 日

我想独立于我自己的代码来测试更多线程的准确性的提高，所以我运行了Keras MNIST CNN https://github.com/keras-team/keras/blob/master/examples/mnist_cnn.py并在此基础上做了一些改变喀拉斯常见问题解答 https://keras.io/getting-started/faq/#how-can-i-obtain-reproducible-results-using-keras-during-development关于可重复开发。我的测试代码可以在这里看到gist https://gist.github.com/mistersdevelopment/0b30e4b82bc91f7c1bba5a8bc6e0ba52。要点中两个 Python 文件之间的唯一区别是第 80、90 和 91 行。取消注释这些行会强制 TensorFlow 后端在单个线程上运行。

I ran mnist_cnn_single_threaded.py三次并且mnist_cnn_multi_threaded.py三次。结果可以在同一个中看到gist https://gist.github.com/mistersdevelopment/0b30e4b82bc91f7c1bba5a8bc6e0ba52#file-testing_results-txt。它们与我昨天在本地和 EC2 中运行我自己的模型时发现的结果相符。

测试结果

以下是我根据 NPE 评论的测试结果。使用显式设置但默认运行tf.ConfigProto()产生与根本不设置线程值类似的结果。在下面的图表和表格中，“线程”等于设置两者intra_op_parallelism_threads and inter_op_parallelism_threads到指定值。

Threads   Test Loss     Test Accuracy
1         2.300546171   0.1141
2         0.060040779   0.9806
4         0.060651763   0.9805
6         0.06015457    0.9808
8         0.057530957   0.9819

唯一在准确性和损失方面产生显着差异的情况是将线程显式设置为 1。

更新 2018 年 6 月 27 日

这似乎只是 Keras 的 TensorFlow 后端的问题。我尝试使用 Theano 后端进行测试，使用以下选项强制使用单线程，但我没有注意到准确性/丢失问题。

os.environ['OMP_NUM_THREADS'] = '1'
os.environ['THEANO_FLAGS'] = "device=cpu,force_device=True,openmp=False"

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

单线程影响 TensorFlow Keras 后端的模型准确性和损失的相关文章

如何并行安装/编译 pip 要求（使 -j 等效）

我的 pip 要求中有很多软件包需要安装我想并行处理它们我知道例如如果我想要n并行作业来自make我必须写make j n 是否有满足 pip 要求的等效命令 Thanks 有时 pip 使用 make 来构建依赖项如果在开始之前
如何在仍然使用 unique = True 的同时允许 ModelForm 中的空字段？

目前在models py I have class ModelName models Model rowname models CharField max length 100 blank True unique True 就确保相同的值不
在 opencv 中一次性将旋转和平移结合起来

我有一段用于旋转和平移图像的代码 Point2f pt 0 in rows double angle atan trans c trans b 180 M PI Mat r getRotationMatrix2D pt angle 1 0
字符串中数字的连续相加

我是一名正在学习 python 的新程序员并且在如何完成此任务方面遇到了困难所以本质上我有一个从文件导入的数字字符串需要读取并且需要将第一个数字的总和添加到第二个数字并将其转换为正确的 ascii 字符因此例如如果我正在读取字符
读取大文件并制作字典

我有一个大文件我需要读取它并从中制作字典我希望这一切能够尽可能快然而我的Python代码太慢了这是一个显示问题的最小示例首先制作一些假数据 paste lt seq 20000000 lt seq 2 20000001 gt la
将 Python 字典中的键替换为唯一值

a 0 PtpMotion 1 PtpMotion 2 LinMotion 3 LinMotion 4 LinMotion 5 LinMotion 6 LinMotion 7 LinMotion 8 LinMotion 9 PtpMotio
组内条件计数

我想在之后进行条件计数groupby 例如按列的值分组A 然后计算每组中值出现的频率5出现在列中B 如果我整个过程都这样做DataFrame 只是len df df B 5 所以我希望我能做到df groupby A df B 5 siz
无法启动 Windows 快捷方式

我正在尝试使用 python 启动 Windows 我已经尝试了 os system subprocess call os startfile 等多种方法但总是收到错误消息指出路径不存在我知道路径是正确的因为我尝试在 CMD EXE
Python 中 Matlab 'fscanf' 的等价物是什么？

Matlab函数fscanf 似乎很强大 python 或numpy 中是否有相同的等效项具体来说我想从文件中读取矩阵但我不想迭代每一行来读取矩阵类似的东西来自 matlab 用于读取 2D 1000x1000 矩阵 matrix
使用 python3 查找表情符号的宽度

我尝试使用 python 中的模式打印字母 A def printA length height symbol a for i in range length for i in range height for i in range hei
初始化整数变量以进行比较

我正在学习麻省理工学院的开放课件课程计算机科学和 Python 编程简介 https ocw mit edu courses electrical engineering and computer science 6 0001 introd
XGBoostLibraryNotFound：在候选路径中找不到 XGBoost 库，您是否安装了编译器并在根路径中运行了 build.sh？

我在移动 XGBoost 的 python package 目录时遇到这个问题 Traceback most recent call last File setup py line 19 in LIB PATH libpath find l
Python列表错误还是我错了？

我构建了一个 3 级嵌套列表 run on Python 3 2 3 32 bit on Win 7 L2 list 0 for i in range 2 L3 list L2 for i in range 3 L4 list L3 for
Django Rest框架Json解析

我想解析传入的POSTdjangoviews py 文件中的数据发布数据 number 17386372 data banana apple grapes 这是我尝试读取上述传入数据的方法request views py class Fr
禁用或限制 /o/applications（django rest 框架、oauth2）

我目前正在使用 Django Rest 框架编写 REST API 并使用 oauth2 进行身份验证使用 django oauth toolkit 我对他们俩都很满意他们做的正是我想要的然而我有一个担忧我正在将我的应用程序传递到
使用缓存时计算“页面浏览量”或“点击量”

我有一个叫做show board 在其中除其他外我增加了一个字段Board views每次运行时加 1 以计算页面浏览量问题是当我在该视图上使用 cache page 装饰器时 Board views仅在每次生成新的缓存视图时才会增加
从值数组中计算 sympy 表达式

我正在尝试 sympy 但遇到了一个无法解决的问题使用 scipy 我可以编写一个表达式并计算 x 值数组如下所示 import scipy xvals scipy arange 100 100 0 1 f lambda x x 2 f
在Python中设置Windows命令行终端标题

我在 Windows 计算机上运行某个 Python 脚本的多个实例每个实例都来自不同的目录并使用单独的 shell 窗口不幸的是 Windows 为每个 shell 窗口提供了相同的名称
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
pyodbc 无法正确处理 unicode 数据

我确实使用 pyodbc 成功连接了 MySQL 数据库并且它可以很好地处理 ascii 编码的数据但是当我打印使用 unicode utf8 编码的数据时它引发了错误 UnicodeEncodeError ascii codec c

随机推荐

在 OneDrive 中创建新文件夹

多年来一直使用下面的代码它创建新文件夹并将其命名为下一个工作日的日期在其中添加另一个文件夹名为 VO 代码有两行 fPath 暂停的那个是原来的那个有了这个我可以移动我的文件代码仍然会根据 ThisWorkbook 的位置创建
如何检查 TcpClient 是否已连接？

当我的客户端应用程序关闭套接字甚至终止时我的服务器仍然认为它还活着我什至检查TcpClient Connected http msdn microsoft com en us library system net sockets tcp
TypeError：promise.then(...).then(...).then(...).then(...).catch 不是 Node Js 中的函数 [重复]

这个问题在这里已经有答案了我收到此错误但我不知道如何解决它在 Node js 服务器中我在 Promise 上使用了一些 then 函数最后我放置了一个 catch 函数由于某种原因该函数无法被识别我在教程的很多地方都看到这就
检查值是否已经存在

我有一本字典里面放着我的书 Dictionary
Rails 在操作不起作用之前跳过

我的skip before操作有一些问题 class ApplicationController lt ActionController Base protect from forgery with exception before act
Lambda 上的 AWS SES - 无法（静默）发送电子邮件

我正在尝试使用亚马逊服务 questions tagged amazon ses服务于AWS lambda questions tagged aws lambda以便向经过验证的收件人发送电子邮件我正在跟进this https aws a
OpenCV 是否具有处理 sRGB 色彩空间中非线性的函数？

我想知道 OpenCV 是否有处理 sRGB 颜色空间中非线性的函数假设我想将 JPEG 图像从 sRGB 颜色空间转换为 XYZ 颜色空间正如本条中所规定的维基页面 https en wikipedia org wiki SRGB S
iOS 9 Segue 导致应用程序冻结（未引发崩溃或错误）

我已经在这个应用程序上工作了几个月从我记事起我就从来没有遇到过 segues 的问题调用方面代码不变performSegueWithIdentifier但自从我最近更新了 Xcode 7 和 iOS 9 以来我一直无法解决这个问题
使用 CUDA 并行处理将彩色图像转为灰度图像

我正在尝试解决一个问题我应该将彩色图像更改为灰度图像为此我使用 CUDA 并行方法我在 GPU 上调用的内核代码如下 global void rgba to greyscale const uchar4 const rgbaImag
c# 蓝牙 LE - 写入配置错误 - ValueChanged 从未调用

因此我尝试将我的 C WPF 程序连接到 BLE 设备这是连接到设备的代码 private async Task ConnectToWatcher DeviceInformation deviceInfo try get the dev
当 XSLT for-each 处于循环中时。如何根据其他 XML 值向该 XML 添加属性或节点。使用 XSLT

任何人都可以帮我解决这个问题吗我有一个 XML 并根据某些条件过滤值将过滤后的 xml 存储在变量中在过滤条件时我尝试向过滤后的 xml 添加属性或节点但它对我不起作用输入 XML
Java 中的委托与回调

我对 Java 中的委托和回调术语有一些误解 class MyDriver public static void main String argv MyObject myObj new MyObject definition of Help
节点：通过服务帐户的 Google Analytics 数据

Update 我已经把代码变成了NPM模块 https www npmjs com package ga service acct 我已经通过自己的努力创建了一个服务帐户的 JWT 令牌 https developers google co
组件渲染过早

我正在尝试创建一个 PrivateRoute HOC 来测试用户是否已通过身份验证检查 redux 存储中是否存在 auth 然后再将其发送到实际路由问题是私有路由在我的身份验证出现在 redux 存储中之前完成 console log
k-means 使用从 minhash 生成的签名矩阵

我在文档及其木瓦上使用了 minhash 从这些文档生成签名矩阵我已经验证签名矩阵可以很好地比较已知相似文档例如关于同一运动队的两篇文章或关于同一世界赛事的两篇文章的杰卡德距离从而给出正确的读数我的问题是使用这个签名矩阵来执行
JQuery Mobile 将 2 个元素的宽度设置为 80% 和 20%

我正在使用 JQuery Mobile 并尝试使用设置两个元素的宽度ui grid a如下面的代码所示结果是 2 个元素其宽度等于50 50 我希望我的输入文本宽度是80 我的按钮是20 在同一行怎么能做到这一点呢 div class
如何避免 expr 溢出。 A B C D

我需要计算一个如下所示的表达式 A B C D 其中它们的类型是 signed long long int A B C D 每个数字都可以很大不溢出其类型尽管A B可能会导致溢出同时表达A B C D可以非常小我怎样才能正确计算它
如何使用 AngularJS 访问浏览器控制台中的 $scope 变量？

我想访问我的 scopeChrome 的 JavaScript 控制台中的变量我怎么做我也看不到 scope也不是我的模块的名称myapp在控制台中作为变量在开发人员工具的 HTML 面板中选择一个元素然后在控制台中输入 angul
Rails - 从控制器触发 javascript 事件

我正在考虑实现类似以下的内容并且想知道a 由于我没有想到的某种原因这是否可能是一个非常糟糕的主意 b 如果不是是否有现有的gem可以做到这一点基本上我希望能够对来自 Rails 控制器的 JavaScript 事件进行排队以便在
单线程影响 TensorFlow Keras 后端的模型准确性和损失

Question 为什么在 Keras 的 TensorFlow 后端设置线程数 intra op parallelism threads and inter op parallelism threads 到 1 对模型的准确性和损失产生负

单线程影响 TensorFlow Keras 后端的模型准确性和损失

单线程影响 TensorFlow Keras 后端的模型准确性和损失 的相关文章

随机推荐

热门标签

单线程影响 TensorFlow Keras 后端的模型准确性和损失的相关文章