Tensorflow Inception 多 GPU 训练损失未求和？

2024-04-28

我正在尝试检查多个 GPU（在一台机器上）的 Tensorflow 初始代码。我很困惑，因为据我所知，我们从不同的塔（又名 GPU）中得到了多次损失，但是loss评估的变量似乎只是最后一个塔的变量，而不是所有塔的损失之和：

for step in xrange(FLAGS.max_steps):
  start_time = time.time()
  _, loss_value = sess.run([train_op, loss])
  duration = time.time() - start_time

Where loss最后专门为每个塔定义：

for i in xrange(FLAGS.num_gpus):
  with tf.device('/gpu:%d' % i):
    with tf.name_scope('%s_%d' % (inception.TOWER_NAME, i)) as scope:
      # Force all Variables to reside on the CPU.
      with slim.arg_scope([slim.variables.variable], device='/cpu:0'):
        # Calculate the loss for one tower of the ImageNet model. This
        # function constructs the entire ImageNet model but shares the
        # variables across all towers.
        loss = _tower_loss(images_splits[i], labels_splits[i], num_classes,
                           scope)

有人可以解释一下合并不同塔的损失的步骤在哪里吗？或者我们只是用一个塔的损失来代表另一个塔的损失？

这是代码的链接：https://github.com/tensorflow/models/blob/master/inception/inception/inception_train.py#L336 https://github.com/tensorflow/models/blob/master/inception/inception/inception_train.py#L336

出于监控目的，考虑到所有塔均按预期工作，单个塔的损耗与所有塔损耗的平均值一样具有代表性。这是因为批次和分配到的塔之间没有关系。

But the train_op使用所有塔的梯度，按照line 263 https://github.com/tensorflow/models/blob/master/inception/inception/inception_train.py#L263, 278 https://github.com/tensorflow/models/blob/master/inception/inception/inception_train.py#L278因此，从技术上讲，培训应考虑所有塔的批次。

请注意，平均损失的方差将低于单塔损失的方差，但它们将具有相同的期望。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow Inception 多 GPU 训练损失未求和？的相关文章

Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
Tensorflow：从 TFRecords 文件中提取图像和标签

我有一个 TFRecords 文件其中包含图像及其标签名称大小等我的目标是将标签和图像提取为 numpy 数组我执行以下操作来加载文件 def extract fn data record features Extract fea
Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
在 TensorFlow 中对伯努利随机变量进行采样

给定一个包含伯努利分布均值的一维张量如何使用给定的均值对相应的一维张量进行采样 TensorFlow 似乎只有random normal and random uniform实现的功能我可以使用一些复杂的东西例如 tf ceil tf
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res

随机推荐

使用 VBA 循环遍历工作簿切片器名称

我尝试过谷歌搜索并搜索这个但无法完全理解我想做的就是循环遍历活动工作表上的切片器并删除切片器如果存在目前我那里有 6 个切片机以前我有 ActiveSheet Shapes Range Array Market Segment N
Hibernate Query在系统中运行缓慢，但直接运行时速度很快

我遇到了与本周播客中类似的问题我们有一个使用 Hibernate 和 Sql Server 2005 的 Java 应用程序 Hibernate 正在为我们生成一个查询该查询需要近 20 分钟才能完成如果我们使用 show sql 进
Blend for Visual Studio 2012 - 无设计视图

我有一个普通的 WPF MVVM Light 应用程序我尝试在 Blend 中打开它我第一次在 Windows 8 计算机上使用 Blend for Visual Studio 2012 但是我无法打开设计视图这几乎使 Blend
如何在QTextEdit中自动滚动文本（动画效果）？

我想问一下如何让QTextEdit中的文字滚动达到动画效果动画效果应该类似于视频中所示的效果 https www youtube com watch v MyeuGdXv4XM https www youtube com watch v
Excel公式获取2个字符之间的字符串

我正在尝试使用公式动态提取 Excel 中 2 个字符之间的字符串列中没有文本样本数据为 US Blue Widgets Net UK Green Grass UAE Red Apples 注意数据没有固定长度我尝试使用公式但我认为
如何获取引导程序轮播中当前“活动”图像的 src

我想在每次更改时将活动图像的 src 拉到引导程序轮播中下面是我现在所拥有的适用于第一张图像但在下一张图像触发时不会改变 document ready function galleryCarousel on slide bs caro
将计时器添加到 Windows 窗体应用程序

我想添加一个计时器而不是倒计时它会在什么时候自动开始表单加载开始时间应为 45 分钟一旦结束即达到 0 分钟时表单应终止并显示一条消息我怎样才能做到这一点语言最好是C 更详细一点 private void Form1 Lo
OSGi 应用程序设计 - 我是否滥用服务框架？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案在我们正在开发的应用程序中我有一个供数据提供程序组件实现的通用接口并且我将这些提供程序作为服务连接起来我的一位同事建议最好只创建一项可以
Android 片段：onCreateView 中的容器变量为 null

我有一个仅基于片段的应用程序实际上我只是创建基本内容我只有一个片段直接声明到布局中
从另一个窗口获取 Javascript 错误

我创建了一些测试代码来打开一个新窗口并尝试从父窗口捕获新窗口中的 JavaScript 错误问题是它只适用于 Firefox All of 测试 html code
在 Python 中规范化数字列表

我需要对值列表进行标准化以适应概率分布即在 0 0 和 1 0 之间我明白how标准化但很好奇 Python 是否有一个函数可以自动执行此操作我想从 raw 0 07 0 14 0 07 to normed 0 25 0 50 0
如何将sublime text中的透明图像背景网格更改为不同的颜色

When I get a preview of transparent PNGs in Sublime text I find it hard to see the content if it is white because of the
使用不同颜色的 dc.js 显示原始（有条件）拉丝未拉丝交叉过滤器条

假设我们有以下 crossfilter dc js 应用程序虽然这很好但用户在刷牙时会失去对人群的参考我想要图表x y z and a在刷其他图表时保留基础柱也许是不同的颜色如下所示我相信这可能需要更新dc renderA
AngularJS Datatable：响应式不起作用

我在用着角度数据表 http l lin github io angular datatables archives with 响应表 http l lin github io angular datatables archives wit
jQuery qTip：如何将单个工具提示 div 附加到多个目标 div？

jQuery 的正常行为qTip http craigsworks com projects qtip 插件的作用是为分配的每个工具提示项创建一个新的隐藏 div 有没有办法将单个隐藏的工具提示元素绑定到多个目标以避免混乱 DOM 人为的
使用powershell创建计划任务

我有这个脚本来使用 PowerShell 创建计划任务该任务运行良好但我不知道如何设置和到期日期以最高权限运行和如果任务运行时间更长则停止该任务 taskName TestTask user lt gt password lt
如何从初始化参数中正确设置 Python 类属性

作为一名 Python 程序员我经常声明类似的类 class Foo def init self attr1 attr2 attr3 attr4 attr5 attr6 attr7 attr8 attr9 self attr1 attr1
Facebook API 是否允许自动更改旧帖子的可见性？

换句话说是否有一个 API 允许 Facebook 用户更改其早于指定日期的帖子通过第 3 方应用程序从对列表朋友可见到另一个列表例如仅我还是亲密的朋友人们越来越多地将他们的专业联系人和熟人联系人添加为 Faceboo
使用 appWidgetId 检查主屏幕上是否存在小部件

我在用AlarmManager更新我的小部件如果主屏幕上没有小部件我想停止它但我在检测主屏幕上是否没有小部件时遇到问题每当我尝试使用这种方式获取 AppWidgetIds 时 AppWidgetManager appWidgetMa
Tensorflow Inception 多 GPU 训练损失未求和？

我正在尝试检查多个 GPU 在一台机器上的 Tensorflow 初始代码我很困惑因为据我所知我们从不同的塔又名 GPU 中得到了多次损失但是loss评估的变量似乎只是最后一个塔的变量而不是所有塔的损失之和 for step

Tensorflow Inception 多 GPU 训练损失未求和？

Tensorflow Inception 多 GPU 训练损失未求和？ 的相关文章

随机推荐

热门标签

Tensorflow Inception 多 GPU 训练损失未求和？的相关文章