TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏

2023-12-22

在 TensorFlow 中，当在 fit_generator 中使用 class_weights 时，会导致训练过程不断消耗越来越多的 CPU RAM，直至耗尽。每个时期之后内存使用量都会逐步增加。请参阅下面的可重现示例。为了保持可重现的示例较小，我减小了数据集的大小和批量大小，这显示了内存增加的趋势。在使用我的实际数据进行训练时，它耗尽了整个 128GB RAM 70 EPOCS。

有人遇到过这个问题或者对此有什么建议吗？我的数据有不平衡的数据，所以我必须使用 class_weights，但我无法用它长时间运行训练。

在下面的代码示例中，如果注释掉类权重，程序将在不耗尽内存的情况下进行训练。

第一张图显示了带有 class_weights 的内存使用情况，而第二张图显示了没有 class_weights 的内存使用情况。

import tensorflow as tf
tf.enable_eager_execution()
import numpy as np

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import CuDNNLSTM, Dense
from tensorflow.keras.optimizers import Adadelta


feature_count = 25
batch_size = 16
look_back = 5
target_groups = 10

def random_data_generator( ):
    x_data_size =(batch_size, look_back, feature_count) # batches, lookback, features
    x_data = np.random.uniform(low=-1.0, high=5, size=x_data_size)

    y_data_size = (batch_size, target_groups)
    Y_data = np.random.randint(low=1, high=21, size=y_data_size)

    return x_data, Y_data

def get_simple_Dataset_generator():        
    while True:
        yield random_data_generator()

def build_model():
    model = Sequential()
    model.add(CuDNNLSTM(feature_count,
                    batch_input_shape=(batch_size,look_back, feature_count),
                    stateful=False))  
    model.add(Dense(target_groups, activation='softmax'))
    optimizer = Adadelta(learning_rate=1.0, epsilon=None) 
    model.compile(loss='categorical_crossentropy', optimizer=optimizer) 
    return model


def run_training():

    model = build_model()
    train_generator = get_simple_Dataset_generator()
    validation_generator = get_simple_Dataset_generator()
    class_weights = {0:2, 1:8, 2:1, 3:4, 4:8, 5:35, 6:30, 7:4, 8:5, 9:3}

    model.fit_generator(generator = train_generator,
            steps_per_epoch=1,
            epochs=1000,            
            verbose=2,
            validation_data=validation_generator,
            validation_steps=20,
            max_queue_size = 10,
            workers = 0, 
            use_multiprocessing = False,
            class_weight = class_weights
            )

if __name__ == '__main__': 
    run_training()

对于任何未来的用户来说，夜间构建中似乎存在一个错误，该错误似乎在后续的夜间构建中得到了修复。更多详细信息请参阅错误报告。

https://github.com/tensorflow/tensorflow/issues/31253 https://github.com/tensorflow/tensorflow/issues/31253

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏的相关文章

如何将张量推送到 TensorFlow 队列并从另一个进程中提取它们？

我有一个 TensorFlow 集群已启动并正在运行我正在尝试使用一个客户端进程将数据入队并将其从另一进程中出队我无法让它工作我做错了什么这是我的推送数据的程序 queue push py import tensorflow as
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
在 keras 中使用条件实现自定义损失函数

我需要一些有关 keras 损失函数的帮助我一直在使用 Tensorflow 后端在 keras 上实现自定义损失函数我已经在 numpy 中实现了自定义损失函数但如果它可以转换为 keras 损失函数那就太好了损失函数采用数据帧
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
TensorFlow 中的 global_step 是什么意思？

在这就是教程代码 https github com tensorflow tensorflow blob master tensorflow examples tutorials mnist mnist py来自 TensorFlow 网站
如何在对象检测 API Tensorflow 中仅检测人体

我在用tensorflow对象检测 API 用于检测对象它在我的 Windows 系统中运行良好我如何对其进行更改以仅检测提到的对象例如我只想检测人类而不是所有对象根据此中的第 1 条评论answer https stackove
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
从图中删除节点或重置整个默认图

使用默认全局图时是否可以在添加节点后将其删除或者将默认图重置为空当我在 IPython 中交互地使用 TF 时我发现自己必须反复重新启动内核如果可能的话我希望能够更轻松地尝试图表更新 11 2 2016 tf reset de
尝试在 Keras 中创建 BLSTM 网络时出现类型错误

我对 Keras 和深度学习有点陌生我目前正在尝试复制这个paper https pdfs semanticscholar org 4afe f0c6039a5d8b647518b6fe05f47a8bd3aeee pdf但是当我编译第二
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
具有高级计算功能的 Keras 自定义层

我想写一些自定义的Keras分层并在层中进行一些高级计算例如使用 Numpy Scikit OpenCV 我知道有一些数学函数keras backend可以对张量进行操作但我需要一些更高级的功能但是我不知道如何正确实现这一点我收到
使用输入管道时如何替换 feed_dict？

假设您有一个已与feed dict到目前为止将数据注入到图表中每隔几个时期我就会通过将任一数据集的一批数据输入到我的图表中来评估训练和测试损失现在出于性能原因我决定使用输入管道看看这个虚拟示例 import tensorflow
ValueError：形状（无，50）和（无，1）在 Tensorflow 和 Colab 中不兼容

我正在使用 LSTM 训练 Tensorflow 模型以进行预测维护对于每个实例我创建一个矩阵 50 4 其中 50 是历史序列的长度 4 是每个记录的特征数量因此为了训练模型我使用例如 55048 50 4 张量和 55048 1
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
无法更改现有 Keras 模型中的激活

我有一个普通的 VGG16 模型relu激活即 def VGG 16 weights path None model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224
在 Tensorflow 对象检测 API 中将图像裁剪到边界框

如何将图像裁剪到 Tensorflow 中的边界框我正在使用Python API 从文档来看 tf image crop to bounding box image offset height offset width target he

随机推荐

WebDriverIO Selenium 将命令行参数从 config.js 文件传递到 Chrome

我需要 chrome 来运行我的 UI 测试的禁用网络安全标志如何使用 wdio config 文件注入任何命令 http webdriver io http webdriver io capabilities browserName c
如何按枚举值对对象进行排序？

我有Workout与一起上课Difficulty财产 enum Difficulty String case easy easy case moderate moderate case hard hard class Workout va
Cloud 9 IDE 中有离线模式吗

我现在工作的地方网络一直断线 Cloud 9 IDE 中是否有离线模式通过该模式我可以提前缓存预下载所有源文件如果网络暂时中断我可以继续工作并在网络恢复时同步更改 Thanks 这是一个重要的用例我们尚未提供此功能并且正在考
为了获得最快的速度，应该按什么顺序列出 CSS 属性？

让我们获取一些 CSS 属性并将它们随机放置在 CSS 文件中 outline伪元素颜色属性背景和边框属性框属性灵活的盒子布局文本属性文本装饰属性字体属性书写模式表属性 Lists动画片如果您想最大限度地提高渲染速度您应该按什么顺序列出
如何从编辑器脚本更新预制件属性并使实例获得更新？

这是后续这个问题 https stackoverflow com questions 38785607 how to edit a monobehaviours properties on a prefab in the unityedit
使用 loc 方法获取 DataFrame 的视图

我正在尝试使用以下方法获取 pandas 数据框的视图loc方法但当我修改原始 DataFrame 时它没有按预期工作我想使用提取 DataFrame 的行切片loc方法以便当对 DataFrame 进行修改时切片会反映更改让我
在 groupby agg 中使用列名列表？

Summary 我有许多带有数据 data cols 和文本 text cols 的列我想通过引用列名列表来执行以下操作但无法弄清楚 df groupby id as index False agg data cols sum text
将 Woocommerce 品牌名称添加到购物车商品名称

我使用 Woocommerce Brands 插件我想在购物车中的每个产品中添加品牌就像它显示变化一样所以产品名称然后尺码 XXX 颜色 XXX 品牌 XXX 我尝试了几种方法但似乎无法使其发挥作用 Update 2 代码增强和
为 ruby on Rails 应用程序创建谷歌站点地图的推荐方法或插件？

我进行了快速的 Google 搜索但没有发现任何超级好的东西可以自动创建和更新 ruby on Rails 应用程序的 Google 站点地图有什么建议么我真的不建议使用控制器并简单地路由到它例如 sitemap xml 因为如果您
我可以在 TypeScript lambda 中访问另一个 this 吗？

在打字稿中我可以写这样的东西 something fadeOut 400 void gt this invokeAnotherMethod 编译时 TypeScript 会自动确保 this 指向我的类而不是所包含的函数 var this
“令牌“模块”上存在语法错误，需要接口”

这段代码给了我错误消息令牌模块上的语法错误预期接口有人知道为什么吗 module TeaThiever The module声明仅在以下情况下有效module info java文件并且必须与 Java 9 或更高版本一起使用
App_Code 中的 Razor @helper 无法访问

In my App code 我有一个名为的辅助函数FormatTelephone string number in Formatter cshtml 我尝试通过以下方式在部分视图中访问它 Formatter FormatTelephone
OpenOCD 一次调试多个设备

我正在尝试在 Eclipse 上使用 openocd 同时调试多个设备我有 2 个 STM32F303 发现板我已将 hla serial 标志设置为正确的板但仍然没有运气单独的板运行正常但是当尝试调试时 Eclipse 说它在最
使用 java 具有价值的可移动条

我想创建一个有价值的酒吧如果我移动圆圈那么该字段中的值应该改变我怎样才能做到这一点这是屏幕截图我怎样才能做到这一点类似这样的东西也可以请在这件事上给予我帮助先感谢您 SpinSlider https stackoverflo
尝试通过防火墙从 github 加载文件的速度慢得令人难以置信。对于解决方法有什么建议吗？

我有点犹豫要不要发布这个因为我不完全确定我在做什么任何帮助都会很棒我使用的计算机上装有防火墙过滤器我可以毫无困难地下载文件然而当我尝试从 Github 克隆文件时计算机就挂起了什么都没发生它在文件夹中创建一个 git 文
调整 HTML5 Canvas 和内容的大小和比例

我正在开发一个应用程序它将绘图界面如 Paint 或 Photoshop 合并为 HTML5 画布元素我希望能够动态调整画布元素及其像素数据的大小以模拟缩放功能我的想法是拥有某种包含画布元素的视口然后我可以调整画布及其在视口内的内
使用套接字时，pcntl_signal 函数未被命中且 CTRL+C 不起作用

我有一个简单的 PHP 脚本我想从终端运行它并且能够处理信号代码该脚本创建 TCP 服务器并处理连接不知道为什么但我无法让信号处理工作
Apache Camel 中的 OnCompletion() 被多次调用

在routeBuilder类中它有很多路由完成所有路由后需要调用testMethod 但目前testMethod 方法被调用很多次 onCompletion bean TestProcessor class testMethod end
查找作者修改的所有当前行

我如何在 git 中确定来自特定作者的所有仍然存在的行举例来说托尼曾参与我的项目我想找到我的开发分支中仍然存在且来自托尼创作的提交的所有行也许只是git blame FILE grep Some Name 或者如果您想递归地责备
TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏

在 TensorFlow 中当在 fit generator 中使用 class weights 时会导致训练过程不断消耗越来越多的 CPU RAM 直至耗尽每个时期之后内存使用量都会逐步增加请参阅下面的可重现示例为了保持可重现的

TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏

TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏 的相关文章

随机推荐

热门标签

TensorFlow - 在 fit_generator 中使用 class_weights 会导致内存泄漏的相关文章