Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？

2024-02-18

我正在尝试使用fit_generator使用自定义生成器来读取对于内存来说太大的数据。我想要训练 125 万行，因此我让生成器一次生成 50,000 行。fit_generator has 25 steps_per_epoch，我认为每个周期会带来 1.25MM。我添加了一个打印语句，以便我可以看到该进程正在执行多少偏移量，并且我发现当它进入第 2 纪元的几步时，它超出了最大值。该文件中总共有 175 万条记录，并且一次它通过了 10 个步骤，它在create_feature_matrix调用（因为它不带入任何行）。

def get_next_data_batch():
    import gc
    nrows = 50000
    skiprows = 0

    while True:
        d = pd.read_csv(file_loc,skiprows=range(1,skiprows),nrows=nrows,index_col=0)
        print(skiprows)
        x,y = create_feature_matrix(d)
        yield x,y
        skiprows = skiprows + nrows
        gc.collect()
get_data = get_next_data_batch()

... set up a Keras NN ...

model.fit_generator(get_next_data_batch(), epochs=100,steps_per_epoch=25,verbose=1,workers=4,callbacks=callbacks_list)

我是否使用了 fit_generator 错误，或者是否需要对我的自定义生成器进行一些更改才能使其正常工作？

No - fit_generator不会重置生成器，它只是继续调用它。为了实现您想要的行为，您可以尝试以下操作：

def get_next_data_batch(nb_of_calls_before_reset=25):
    import gc
    nrows = 50000
    skiprows = 0
    nb_calls = 0

    while True:
        d = pd.read_csv(file_loc,skiprows=range(1,skiprows),nrows=nrows,index_col=0)
        print(skiprows)
        x,y = create_feature_matrix(d)
        yield x,y
        nb_calls += 1
        if nb_calls == nb_of_calls_before_reset:
            skiprows = 0
        else:
            skiprows = skiprows + nrows
        gc.collect()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？的相关文章

水平计数加工织物中的白色簇

我对织物材质进行了处理得到如下图所示的图像原图处理后的图像现在我想找到连续的白色簇的数量如果所有簇都是均匀且完全水平的我将运行一个循环来计算强度的上升和下降以找到簇的数量但事实并非如此如果我通过上述方法取几行的中值平均
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
触发变量中 python 字符串的 f 字符串解析

这个问题来自于处理jupyter magics 但可以用更简单的方式表达给定一个字符串s the key is d key 和一本字典d key val 我们要解析该字符串旧的方法是 format 这会引发错误它不处理字典键 the
如何在 pandas 数据框中导入 tfrecord 文件？

我有一个 tfrecord 文件想将其导入 pandas 数据框或 numpy 数组中我找到了读取 tfrecords 的工具但它们只能在张量流会话中工作这不是我的用例感谢我能得到的任何帮助在 Colab 中你可以输入或者在你
在函数中调用 patsy 时出现命名空间问题

我正在尝试为 statsmodels 公式 API 编写一个包装器这是一个简化版本该函数的作用远不止于此 import statsmodels formula api as smf def wrapper formula data kw
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
带参数和不带参数的 super() 有什么区别？

我遇到了一个使用的代码super 方法有两种不同的方式我不明白逻辑上有什么区别我现在正在学习pygame模块我有一个任务来创建一个类Ball它继承自Sprite这是一个来自pygame模块如果我没记错的话我遇到了这段代码 impo
如何更新反卷积层的权重？

我正在尝试开发一个反卷积层或者准确地说是转置卷积层在前向传递中我进行了完全卷积零填充卷积在向后传递中我进行有效的卷积没有填充的卷积以将错误传递到前一层偏差的梯度很容易计算只需对多余维度进行平均即可问题是我不知道如何更新
WEKA 的重采样过滤器 - 如何解释结果

我目前正在努力解决机器学习问题而我必须处理大量不平衡的数据集也就是说有六个类 1 2 6 不幸的是有例如对于 1 类有 150 个示例实例对于 2 有 90 个实例对于 3 类只有 20 个实例所有其他类都无法训练因为
XPath 语法错误：谓词无效

我有一个像这样的 XML 文件 cat sample xml
Python：Facebook Graph API - 使用 facebook-sdk 的分页请求

我正在尝试向 Facebook 查询不同的信息例如好友列表它工作得很好但当然它只能给出有限数量的结果如何获取下一批结果 import facebook import json ACCESS TOKEN def pp o with
如何获得 GTK 中的默认颜色？

Context 在 GTK 3 中人们可以设置自己的主题甚至默认主题 Adwaita 也提供两种变体浅色和深色当我编写自己的小部件用Python 时我需要获取这些颜色以避免在黑色上绘制黑色或在白色上绘制白色 Question 如
Tensorflow Inception 多 GPU 训练损失未求和？

我正在尝试检查多个 GPU 在一台机器上的 Tensorflow 初始代码我很困惑因为据我所知我们从不同的塔又名 GPU 中得到了多次损失但是loss评估的变量似乎只是最后一个塔的变量而不是所有塔的损失之和 for step
为什么模拟“open”并返回 FileNotFoundError 会引发 AttributeError: __exit__？

通过模拟测试open with a FileNotFoundError raises AttributeError exit 为什么会发生这种情况以及我可以采取什么措施来解决它以下代码打开一个简单的文本文件如果文件丢失它会生成一个默认
Python“str”对象没有属性“read”

Python 3 3 2 导入 json 和 urllib request Json link www google com orderid 100000222 link www google com orderid 100000222 l
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
在 Cartopy 中隐藏高纬度非矩形投影的右侧轴（纬度）标签

我试图使用以下命令隐藏此 Cartopy 地图中的右侧标签又名纬度 right labels False但仅适用于某些值但是可以使用隐藏顶部底部标签top labels False and bottom label False 重现
如何将目录导入为 python 模块

如果有目录 home project aaa 我知道它是一个Python包那么我如何通过知道它的路径来导入这个模块这意味着我希望代码能够正常工作 aaa load module home project aaa 我知道的唯一方法是
Pandas - KeyError：“无法使用单个布尔值来索引 setitem”

我写了以下函数调用它时它会抛出 KeyErrordataset loc 称呼我想了解为什么会发生这种情况以及如何避免这种情况 def ChangeColumnValues dataset columnValues Changes th

随机推荐

android - 从其唯一整数获取资源（字符串）

我想做以下事情我想做一个非常简单的画廊应用程序所以我想选择图像的路径并将其设置为资源我在 String xml 中设置它所以我有另一个类它需要选定的路径来加载其中的所有图像 class ImageHolder public Ima
如何在Hadoop中设置数据块大小？改变它有好处吗？

如果我们可以更改 Hadoop 中的数据块大小请告诉我如何操作更改块大小是否有利如果是请告诉我为什么以及如何更改如果没有请告诉我为什么以及如何您可以随时更改块大小除非dfs blocksize参数在 hdfs site xm
如何在 JavaScript 中获取数组特定索引处的值？

我有一个数组只想获取索引 1 处的元素 var myValues new Array var valueAtIndex1 myValues getValue 1 something like this 如何在 JavaScript 中获取
在终端中构建 Xcode 项目 - 选择另一个 Xcode

我在同一台 Mac 上安装了两个不同的 Xcode 版本 Xcode 4 和 Xcode 5 Xcode 4 位于应用程序文件夹中因此每当我从终端构建任何项目时它自然会使用 Xcode 4 进行编译有没有办法使用 Xcode 5 位
在 VS 2008 中构建 Proxy/Stub dll

我有一个 ATL COM 项目从 VC6 迁移到 VS 2008 如何在 VS2008 上构建 PS DLL VS 2008 中的新 ATL 项目有一个单独的 PS 项目用于构建 PS DLL 但从VC6迁移并没有创建这个项目我尝试在
如何让我的 flutter 应用程序在关闭时在后台运行？

我正在构建一个应用程序我希望它显示在用户的通知栏中并在后台运行即使它关闭也是如此类似于 KWGT Kustom Widget Maker 我尝试过寻找允许这样做的库但我只能找到与 java 相关的库是否有适用于 Dart Flu
如何在运行时运行 php 扩展

我正在尝试在运行时加载 php 扩展由于不鼓励使用 dl 并且它已从 PHP 中删除我正在使用 php 扩展指令但它也不起作用 ini set extension php gmp dll if extension loaded gmp
Nesta CMS 和 Rails3 集成：将博客添加到现有的 Rails 3 应用程序中

我将 Nesta 0 9 8 cms 添加到现有的 Rails 3 0 10 应用程序中我启动并运行了博客但没有启动布局样式表到目前为止我所做的是 1 在rails应用程序主根目录中添加gem nesta gem sass 并运行
检测 URL 标签 example.com/page.php#anycontent

我如何识别这种类型的标签 example com file php inbox or example com another php spam 就像 Gmail 正在检测 inbox spam mycontent 我尝试过 SERVER R
Objective C 中发送消息实际上是异步的吗？

消息的概念通常与异步调用相关 Objective C 也是这样吗即当调用者向被调用者发送消息以对其执行方法时调用者是立即继续还是被阻塞直到被调用者完成执行所请求的方法肯定是被堵住了因为这些消息实际上是用纯 C 语言翻译的 myO
我应该在回复元数据拒绝后重新提交二进制文件吗？

我的申请收到元数据拒绝要求对我的申请进行一些澄清 Information Needed Your iTunes Connect settings indicate that your app serves third party adve
在两个容器之间移动列表元素，并结合自动完成功能

我会以某种方式假设类似的事情已经被问过但找不到任何东西一开始所有学生都在左侧列表中用户可以通过单击箭头将学生移动到右侧列表用户可以将学生移回原始列表如果学生群体太大用户可以使用自动完成功能进行搜索按添加或输入添加会将自动完
Tomcat内部如何处理session？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案根据我的理解 Servlet 容器使用一些 HTTP 协议处理会话例如隐藏表单字段网址重写 Cookies 我很好奇如何阿帕奇雄
获取在 Shiny 中使用 grep 触发的事件（生成的输入）

我已生成输入 1 2 等但我想知道触发了哪个事件有用获取在 Shiny 中触发的事件 https stackoverflow com questions 56770222 get the event which is fired in
任何框架函数有助于查找多个字符串的最长公共起始子字符串？

我有一个字符串列表代表路径和它们都应该有一个共同的开头根路径我需要有一个共同的开始这只是需要组合在一起的几行代码但我有一种挥之不去的感觉每年必须将其组合在一起一百万次并且框架中可能有一个算法可以用于此目的但找不到任何东西
mongodb聚合项目objectId与concat

db test aggregate match themType SuperTest mType in 1 2 project id 1 refTestId 1 avatar concat refTestId avatar 返回 null
ObjC 方法类型编码字符串中的数字是什么？

我正在阅读苹果关于 Objective C 运行时类型编码字符串的文章 https developer apple com library mac documentation Cocoa Conceptual ObjCRuntimeGui
了解 Python 守护线程

我显然误解了有关 Python Thread 对象的守护进程属性的一些基本知识考虑以下 daemonic py import sys threading time class TestThread threading Thread def
如何分析JVM崩溃文件hs_err_pidXYZ.log

在 Eclipse 和 Tomcat wtp 中处理 Web 应用程序时 tomcat 崩溃并创建一个文件 hs err pid20216 log 我尝试使用 eclipse MAT 来分析该文件但 MAT 无法将该文件识别为它可以处理的
Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？

我正在尝试使用fit generator使用自定义生成器来读取对于内存来说太大的数据我想要训练 125 万行因此我让生成器一次生成 50 000 行 fit generator has 25 steps per epoch 我认为每个周

Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？

Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？ 的相关文章

随机推荐

热门标签

Keras 中的 fit_generator 是否应该在每个纪元后重置生成器？的相关文章