如何减少 TensorFlow 循环中的内存消耗？

2024-01-01

我在 TensorFlow 中有一个循环，如下所示：

with tf.device("/gpu:1"):
    losses = []

    for target, output in zip(targets, lstm_outputs):
        logits = tf.matmul(W, output) + b
        loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits, target)
        losses.append(loss)

    total_loss = tf.add_n(losses)

为该层分配梯度时出现 OOM 错误，因为每个矩阵乘法都是占用内存的图中的不同操作。有没有办法阻止 TensorFlow 同时分配所有这些操作？

对于 TensorFlow 优化来说，这是一个具有挑战性的图，因为必须保留每一层的激活来聚合单个梯度W。一种可能性是通过实验性的 https://github.com/tensorflow/tensorflow/blob/0249729a26b2cd3bdbbc5880f8d634a56860b0fd/tensorflow/python/ops/gradients.py#L580 aggregation_method调用时的参数optimizer.optimize() https://www.tensorflow.org/versions/r0.7/api_docs/python/train.html#Optimizer.minimize.

例如，您可以尝试以下操作：

optimizer = tf.train.AdagradOptimizer(...)  # Or another optimization algorithm.
train_op = optimizer.minimize(
    total_loss,
    aggregation_method=tf.AggregationMethod.EXPERIMENTAL_ACCUMULATE_N)

此选项急切地聚合经常使用的变量的梯度，而不是将它们全部保留在内存中，直到计算出所有梯度。如果这不起作用，则tf.AggregationMethod.EXPERIMENTAL_TREE可能会工作得更好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何减少 TensorFlow 循环中的内存消耗？的相关文章

Python - 将宽字符字符串从二进制文件转换为 Python unicode 字符串

这是漫长的一天我有点困惑我正在读取一个包含大量宽字符字符串的二进制文件我想将它们转储为 Python unicode 字符串为了解压非字符串数据我使用 struct 模块但我不知道如何对字符串执行相同的操作例如阅读系列一
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break

随机推荐

绝对定位div上的css3高度过渡到溢出自动失败[重复]

这个问题在这里已经有答案了我想这个例子是不言自明的我不知道为什么 div 首先缩小然后弹出到正确的高度这是示例代码 div class block div class abs hover me br Lorem ipsum dolo
Ninject运行时异常频繁发生-System.InvalidOperationException：Collection被修改；枚举操作可能无法执行

我在 Webforms 应用程序中使用 Ninject 2 2 1 0 和 Ninject Web 2 2 0 0 我每天都会收到以下错误报告 System InvalidOperationException Collection was
使用 AccountManager 通过 Google API 进行身份验证

我已经为此苦苦挣扎了几天我正在尝试通过 Android 的身份验证来调用 Google 日历AccountManager 我使用通常的方法检索身份验证令牌 AccountManager manager AccountManager get
是否可以禁用 onclick 而不改变其功能？

我知道禁用的方法onclick元素上的事件是 element onclick null 启用 element onclick function something or element addEventListener click me 这
如何在 Google 跟踪代码管理器中添加 Adsense

我想使用 Google 跟踪代码管理器来投放 Adsense 这样我还可以使用其他来源的其他广告我在网站上找到的答案很少但不足以理解如果可以在 GTM 中使用 Adsense 代码我将不胜感激如果可以如何我也使用DFP 如果我
Phonegap - Android 初始屏幕 - 中心徽标

有人可以建议我如何设置启动屏幕以实现交叉分辨率吗我尝试将 png 文件的大小重新调整为不同的尺寸并将图像放置在 ldpi mdpi hdpi 文件夹中但图像看起来仍然被拉伸压扁具体取决于设备有没有一种方法可以将徽标放置在屏幕中央
UIautomatorviewer 无法创建 java 虚拟机

我开始在 Mac 上使用 Appium 和 Android Studio 当我尝试从命令行启动 uiautomatorviewer 时出现以下错误 Djava ext dirs Users chris gill Library Andro
代码中的“+=(s,e)”是什么意思？

到底是什么 s e 在代码中例子 this currentOperation Completed s e gt this CurrentOperationChanged 这是使用 Lambda 表达式附加事件处理程序的方法例如 butt
在 LESS CSS 中生成随机数？

尝试搜索此内容但考虑到语法这很困难有没有办法在 LESS 中生成随机数我检查了文档但没有看到任何内容但想知道是否有人知道技巧或未记录的解决方案通过 LESS Mixin 进行变化通过使用 LESS mixin 来生成随机数
在较长的序列中查找子序列

我需要在其他大序列中找到一个序列例如 1 3 2 3 存在于 1 3 2 3 4 3 and 5 1 3 2 3 有什么办法可以快速完成IEnumerable或与其他东西与 dlev 类似但这也可以处理 1 1 1 2 Contain
如何访问 Pandas 系列中的最后一个元素

让我们考虑以下数据框 import pandas as pd d col1 1 2 3 col2 3 4 5 df pd DataFrame data d 如果我想访问 pandas 系列中的第一个元素df col1 我可以简单地去df c
LinkedBlockingQueue 具有快速 contains(Object o) 方法？

简而言之我正在编写一个需要BlockingQueue实现既提供 FIFO 添加删除又提供快速contains方法我将其称为 TON LinkedBlockingQueue让我大部分时间都到了那里但看起来它contains方法以线性
如何更改/覆盖 Vuetify js 中禁用字段的默认颜色？

默认情况下 vuetify 对禁用的文本字段项目应用浅灰色阴影我如何将这种颜色覆盖为我想要的颜色目前我正在使用禁用选择器 disabled color 000000 important 这仅有助于更改文本字段文本颜色的颜色我的表单中
C 的 strtok() 和只读字符串文字

char strtok c har s1 const char s2 重复调用此函数将字符串 s1 分解为标记即字符串被分成子字符串每个都以 0 结尾其中 0 替换任何字符包含在字符串 s2 中第一次通话使用要标记为 s1
Android - 如何以编程方式将证书存储在密钥库中？

我正在制作一个金融交易 Android 应用程序它需要 SSL 身份验证我成功地完成了它 Android 和 Tomcat 之间的握手我使用 keytool 和 openSSL 生成服务器和客户端证书 Tomcat 证书格式为 JKS
HTTP_HOST 服务器变量是否始终已定义？

是服务器变量HTTP HOST总是为所有服务器定义或者例如在 IIS 中使用其他名称定义甚至根本没有定义另外该值总是被定义的或者某些主机没有定义该值还有其他方法可以检索该值吗引用手册 HTTP HOST 是 Contents
在多面 ggplot 中自动勾选最大值和最小值

我试图在多面 ggplot 中标记每个 x 轴的最大值和最小值我有几个具有不同 x 尺度和相同 y 尺度的面并且 x 轴刻度标签相互重叠我正在寻找一种方法来标记每个方面的最小值和最大值而不是手动确定每个方面 x 轴的限制和中断使用
如何在 java 正则表达式中转义美元和大括号（即 ${title}）？

即你如何做到这一点 String string Sample string with title to be inserted string replaceAll title title 以下所有情况都会导致错误 string replac
用最少的代码字符创建、排序和打印 100 个随机整数的列表

Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动您可以编写最少的代码来创建排序升序和打印 100 个随机正整数的列表我所说的最少代码量
如何减少 TensorFlow 循环中的内存消耗？

我在 TensorFlow 中有一个循环如下所示 with tf device gpu 1 losses for target output in zip targets lstm outputs logits tf matmul W o

如何减少 TensorFlow 循环中的内存消耗？

如何减少 TensorFlow 循环中的内存消耗？ 的相关文章

随机推荐

热门标签

如何减少 TensorFlow 循环中的内存消耗？的相关文章