在 GPU 上预加载整个数据集以训练 Keras 模型

2024-01-10

我有一个特定的情况，其中网络相对较小，为了收敛和泛化问题，我应该保持较小的批量大小（例如 256），这导致每个时期要处理数百个批量。

不幸的是，在这种情况下，批量、加载和损失计算成为瓶颈（如timeline工具告诉我）。

在 TensorFlow 中，您可以编写如下代码来将数据加载到 GPU 上：

with tf.device('/gpu:0'):
    train_data = tf.constant(train_data_numpy)

但如果我通过了train_data到喀拉斯Model.predict or Model.fit函数，我收到以下错误：

keras/engine/training.pyc in predict(self, x, batch_size, verbose)
   1515         f = self.predict_function
   1516         return self._predict_loop(f, ins,
-> 1517                                   batch_size=batch_size, verbose=verbose)
   1518 
   1519     def train_on_batch(self, x, y,

keras/engine/training.pyc in _predict_loop(self, f, ins, batch_size, verbose)
   1129         if verbose == 1:
   1130             progbar = Progbar(target=samples)
-> 1131         batches = _make_batches(samples, batch_size)
   1132         index_array = np.arange(samples)
   1133         for batch_index, (batch_start, batch_end) in enumerate(batches):

keras/engine/training.pyc in _make_batches(size, batch_size)
    368         A list of tuples of array indices.
    369     """
--> 370     num_batches = int(np.ceil(size / float(batch_size)))
    371     return [(i * batch_size, min(size, (i + 1) * batch_size))
    372             for i in range(0, num_batches)]

AttributeError: 'Dimension' object has no attribute 'ceil'

这是有道理的，因为 Keras 只期望类似 NumPy 的数组和列表。

话虽如此，我也尝试过pyCUDA and cupy数组，因为他们说类似于 NumPy...但是这些会产生以下错误：

keras/engine/training.pyc in predict(self, x, batch_size, verbose)
   1515         f = self.predict_function
   1516         return self._predict_loop(f, ins,
-> 1517                                   batch_size=batch_size, verbose=verbose)
   1518 
   1519     def train_on_batch(self, x, y,

keras/engine/training.pyc in _predict_loop(self, f, ins, batch_size, verbose)
   1139                 ins_batch = _slice_arrays(ins, batch_ids)
   1140 
-> 1141             batch_outs = f(ins_batch)
   1142             if not isinstance(batch_outs, list):
   1143                 batch_outs = [batch_outs]

keras/backend/tensorflow_backend.pyc in __call__(self, inputs)
   2266         updated = session.run(self.outputs + [self.updates_op],
   2267                               feed_dict=feed_dict,
-> 2268                               **self.session_kwargs)
   2269         return updated[:len(self.outputs)]
   2270 

tensorflow/python/client/session.pyc in run(self, fetches, feed_dict, options, run_metadata)
    893     try:
    894       result = self._run(None, fetches, feed_dict, options_ptr,
--> 895                          run_metadata_ptr)
    896       if run_metadata:
    897         proto_data = tf_session.TF_GetBuffer(run_metadata_ptr)

tensorflow/python/client/session.pyc in _run(self, handle, fetches, feed_dict, options, run_metadata)
   1091             feed_handles[subfeed_t] = subfeed_val
   1092           else:
-> 1093             np_val = np.asarray(subfeed_val, dtype=subfeed_dtype)
   1094 
   1095           if (not is_tensor_handle_feed and

numpy/core/numeric.pyc in asarray(a, dtype, order)
    529 
    530     """
--> 531     return array(a, dtype, copy=False, order=order)
    532 
    533 

ValueError: object __array__ method not producing an array

我尝试用谷歌搜索这个问题，但唯一合理的匹配是一些中文博客文章，它基本上建议修补 Keras，这显然是不切实际的。

我想知道在 GPU 上为 Keras 预加载整个数据集的正确方法是什么。

有用的信息：我正在使用 Keras 2.0.6 和 TF 1.3，由于关键的 API 更改，升级到 2.0.8/1.4 堆栈尚不可用，但如果它解决了这个问题，肯定会加快速度。

您不必加载整个数据。您可以使用以下方法逐段摄取数据DataSet https://www.tensorflow.org/api_docs/python/tf/data/Dataset class.

当您的 GPU 处理数字时，Tensorflow 可以负责加载更多数据。您可以按照以下步骤操作。

将数据集转换为 TFRecord 数据集并将其保存到磁盘。
使用 TFRecordDataset 类加载此数据集
将其引入您的 Kerasmodel 中。

您可以检查列出的示例here https://medium.com/@moritzkrger/speeding-up-keras-with-tfrecord-datasets-5464f9836c36.

希望这有帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

在 GPU 上预加载整个数据集以训练 Keras 模型的相关文章

Celery计划任务中的打印语句不会出现在终端中

当我跑步时celery A tasks2 celery worker B我想看到每秒打印芹菜任务目前没有打印任何内容为什么这不起作用 from app import app from celery import Celery from
带括号的上下文管理器

我试图了解新的新内容带括号的上下文管理器Python 3 10 中的功能新功能中的顶部项目here https docs python org 3 10 whatsnew 3 10 html 我的测试示例是尝试编写 with open f
Python 小数.InvalidOperation 错误

当我运行这样的东西时我总是收到此错误 from decimal import getcontext prec 30 b 2 3 Decimal b Error Traceback most recent call last File Te
如何在 Django 管理中以表格格式显示添加模型？

我刚刚开始使用 Django 编写我的第一个应用程序为我的家庭设计的家务图表管理器在本教程中它向您展示了如何添加相关对象 http docs djangoproject com en dev intro tutorial02 cust
引发 RuntimeError(f"目录 '{directory}' 不存在") RuntimeError: 导入 fitz 时目录 'static/' 不存在

当我运行 extract img py 文件时出现此错误 RuntimeError f 目录 directory 不存在运行时错误导入 fitz 时不存在目录 static 我不明白为什么这会给我发回此错误消息我之前看到过关于这个话题
创建一个打开文件并创建字典的函数

我有一个正在处理的文件我想创建一个读取文件并将内容放入字典中的函数然后该字典需要通过 main 函数传递这是主程序它无法改变我所做的一切都必须与主程序配合 def main sunspot dict file str raw in
使用opencv计算深度视差图

我无法使用 opencv 从视差图计算深度我知道两个立体图像中的距离是用以下公式计算的z baseline focal disparity p 但我不知道如何使用地图计算视差我使用的代码如下为我提供了两个图像的视差图 import n
绘制“plot”而不是“scatter”时，图例选择会中断

再会这个问题是后续问题为什么图例选取仅适用于 ax twinx 而不适用于 ax https stackoverflow com q 60167378 9282844 下面提供的最小代码分别绘制了两条曲线ax1 and ax2 ax1 t
Selenium Webdriver - Python - leboncoin - pb 选择带重音的按钮

我正在尝试在以下网站上自动填写表格 https www leboncoin fr https www leboncoin fr 我用 Selenium IDE 录制了一个脚本我有一个通过单击 Se 连接器按钮并填写我的密码和用户名来自动
Pandas Pivot_Table ：非数字值的行计算百分比

这是我在数据框 df 中的数据 Document Name Time SPS2315511 A 1 HOUR SPS2315512 B 1 2 HOUR SPS2315513 C 2 3 HOUR SPS2315514 C 1 HOUR S
Selenium：等到 WebElement 中的文本发生变化

我在用着selenium使用Python 2 7 从网页上的搜索框检索内容搜索框动态检索结果并在框本身中显示结果 from selenium import webdriver from selenium webdriver common
如何使用 python 操作系统更改驱动器？

我正在尝试更改当前目录C to Y 我试过 import os os chdir Y 但我不断收到错误消息提示无法找到驱动器本质上我正在寻找相当于 cd d cmd 中的命令你确定吗Y 确实是有效的驱动器号吗 Try os chdir
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
管理文件字段当前 url 不正确

在 Django 管理中只要有 FileField 编辑页面上就会有一个当前框其中包含指向当前文件的超链接但是此链接会附加到当前页面 url 因此会导致 404 因为不存在这样的页面例如 http 127 0 0 1 8000
如何在matplotlib中基于x轴更改直方图颜色

我有根据 pandas 数据框计算出的直方图我想根据 x 轴值更改颜色例如 If the value is 0 the color should be green If the value is gt 0 the color shoul
有没有任何方法可以使用 openpyxl 获取 .xlsx 工作表中存在的行数和列数？

有没有任何方法可以使用 openpyxl 获取 xlsx 工作表中存在的行数和列数在xlrd中 sheet ncols sheet nrows 将给出列数和行数 openpyxl中有这样的方法吗给定一个变量sheet 可以通过以下方式之
为 Python 2.4 改进“with”语句的直接替换

您能否建议一种方法来编写可在 Python 2 4 中使用的 with 语句的直接替换代码这将是一个 hack 但它可以让我更好地将我的项目移植到 Python 2 4 EDIT 删除了不相关的元类草图只需使用 try finally
向量化 numpy bincount

我有一个 2d numpy 数组 A我要申请np bincount 到矩阵的每一列A生成另一个二维数组B由原始矩阵每列的 bincounts 组成A 我的问题是 np bincount 是一个采用一维数组的函数它不是像这样的数组方法B A
django 组合对两个不同基本模型的查询

我有两个不同的查询集我想将两个查询集合并 q1 tbl nt 123 objects values list id value geometry filter restriction height exclude condition id
Shap - 颜色条不显示在摘要图中

显示summary plot时不显示颜色条 shap summary plot shap values X train 我尝试过改变plot size 当绘图较高时会出现颜色条但它非常小看起来不应该 shap summary plo

随机推荐

模型类型的强类型 ASP.NET Controller.View() 方法

没有强类型 View 方法可以返回 ActionResult 所以假设我有 class Edit ViewPage
在不使用显式密钥文件的情况下从 Google Cloud Function 生成 Cloud Storage 签名 URL

我想创建一个到存储桶的预签名上传 URL 并希望避免显式引用 json 密钥目前我正在尝试使用默认 App Engine 服务帐户来执行此操作我正在尝试跟随这个答案 https stackoverflow com a 64245028
Play Framework @routes.Assets.at 编译错误

我正在使用 Play 2 4 0 并且我一直在尝试按照主页上的教程进行操作 https playframework com https playframework com 这是针对 Play 2 3 的在解决了有关 Ebean ORM 从
如何使用 openpyxl 读取 Excel 单元格值而不是计算它的公式？

我在用openpyxl读取单元格值 Excel addin webservice 更新了此列我用过data only True但它不显示当前单元格值而是显示 Excel 上次读取工作表时存储的值 wbFile openpyxl load
使用 DateInterval 计算两个日期之间的月份，而不在一年内换行

我知道这个话题已经很累了但显然还不够 temp d1 new DateTime date Y m d fromTime 2012 01 01 temp d2 new DateTime date Y m d endTime 2013 02
在 C 中实现 SB 型 riscv 指令

我遇到了一些问题我尝试将 32 位二进制解码为 RISCV 架构集中的 SB 类型指令我已经移动了操作码 imm rs1 rs2 和 rd 值但未能获得正确的 IMM 值例如对于以下 32 位二进制 1111111000000111
运行时获取注解信息

我想知道有没有什么方法可以在运行时获取类的注释信息因为我想获取具体注释的属性 Example class TestMain Field store Store NO private String name private String p
CSS :nth-of-type() 和 :not() 选择器？

我并排浮动了 25 宽的文章我正在添加一个clear both每四个元素之后但是我需要在元素之间插入图形分节符它必须在 ul 为了有效我将分节符下面示例中的第一个 li 项包装成 li 以及 ul li class year
ValueError：预期的 2D 或 3D 输入（获得 1D 输入）PyTorch

class VAE torch nn Module def init self input size hidden sizes batch size super VAE self init self input size input siz
cspack 行为与 msbuild 不同

使用 Visual Studio 2012 Azure SDK 2 1 我试图找出创建 csx 文件夹以在 azure 模拟器中运行的最佳方法我的理解是在打包 Azure 项目之前不会创建 csx 文件夹我可以从 Visual St
无法在 iOS 上使用自定义 @protocol

注意以下是使用启用了自动引用计数 ARC 的 iOS 我认为 ARC 可能与它不起作用有很大关系因为这是根据我通过谷歌找到的示例设置的我正在尝试创建一个协议来通知委托用户从 UITableView 选择的文件名文件列表视图控制器 h
离子搜索栏搜索不适用于 cypress {enter}

我有一个 Ionic 6 应用程序我正在使用 cypress 9 3 1 对其进行测试在我的应用程序中我使用像这样的离子搜索栏
插入...值（SELECT ... FROM ...）

我在尝试着INSERT INTO使用另一个表的输入的表尽管这对于许多数据库引擎来说是完全可行的但我似乎总是很难记住正确的语法SQL当天的发动机 MySQL http en wikipedia org wiki MySQL Oracle
WPF DPI 问题

我开发了一个应用程序在我的计算机上看起来很棒但当我将其安装到具有不同分辨率和 DPI 设置的其他计算机上时它看起来很糟糕控件相互重叠这真是太痛苦了有人对如何避免这种情况有什么建议吗 Windows 无法知道屏幕的本机 DPI 每
Python3 - 无法读取 docx、odt 文件 - UnicodeDecodeError：“utf-8”编解码器无法解码位置 10 中的字节 0xea：无效的连续字节

我正在尝试将大 docx 文件拆分为小文件为此当读取文件时python3 6使用以下代码 with open h docx r as f a f read 它抛出这个错误 Traceback most recent call last
Linux 中的沙箱

我想创建一个 Web 应用程序允许用户上传一些 C 代码并查看其执行结果代码将在服务器上编译用户不受信任这显然会带来巨大的安全隐患所以我需要为应用程序创建某种沙箱在最基本的层面上我想将对文件系统的访问限制为某些指定的目录我
Spring JPA 中的 @Entity 是什么？

具体来说我指的是javax persistence Entity 根据我将鼠标悬停在上面时显示的文档在 VS Code 中它指出指定该类是一个实体该注解适用于实体类对于 Spring JPA 来说类是实体意味着什么 Entit
GetComInterfaceForObject 是否固定对象？

使用 GetComInterfaceForObject 并将返回的 IntPtr 传递给非托管代码是否会阻止托管对象在内存中移动或者 clr 是否以某种方式维护该 ptr 请注意非托管代码将在程序的生命周期内使用它并且我需要确保托管对
在单个测试类中测试接口的多个实现

我需要通过班级级别的测试数据但是Theory and InlineData属性只能用在方法上 public class ContainerTests TestFixture private IContainer container publ
在 GPU 上预加载整个数据集以训练 Keras 模型

我有一个特定的情况其中网络相对较小为了收敛和泛化问题我应该保持较小的批量大小例如 256 这导致每个时期要处理数百个批量不幸的是在这种情况下批量加载和损失计算成为瓶颈如timeline工具告诉我在 TensorFlow

在 GPU 上预加载整个数据集以训练 Keras 模型

在 GPU 上预加载整个数据集以训练 Keras 模型 的相关文章

随机推荐

热门标签

在 GPU 上预加载整个数据集以训练 Keras 模型的相关文章