PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？

2023-12-14

Here x_dat and y_dat只是非常长的一维张量。

class FunctionDataset(Dataset):
    def __init__(self):
        x_dat, y_dat = data_product()

        self.length = len(x_dat)
        self.y_dat = y_dat
        self.x_dat = x_dat

    def __getitem__(self, index):
        sample = self.x_dat[index]
        label = self.y_dat[index]
        return sample, label

    def __len__(self):
        return self.length

...

data_set = FunctionDataset()

...

training_sampler = SubsetRandomSampler(train_indices)
validation_sampler = SubsetRandomSampler(validation_indices)

training_loader = DataLoader(data_set, sampler=training_sampler, batch_size=params['batch_size'], shuffle=False)
validation_loader = DataLoader(data_set, sampler=validation_sampler, batch_size=valid_size, shuffle=False)

我还尝试过固定两个加载器的内存。环境num_workersto > 0 给我进程之间的运行时错误（如 EOF 错误和中断错误）。我得到我的批次：

x_val, target = next(iter(training_loader))

整个数据集适合内存/GPU，但我想模拟这个实验的批次。分析我的流程可以得到以下信息：

16276989 function calls (16254744 primitive calls) in 38.779 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
   1745/1    0.028    0.000   38.780   38.780 {built-in method builtins.exec}
        1    0.052    0.052   38.780   38.780 simple aprox.py:3(<module>)
        1    0.000    0.000   36.900   36.900 simple aprox.py:519(exploreHeatmap)
        1    0.000    0.000   36.900   36.900 simple aprox.py:497(optFromSample)
        1    0.033    0.033   36.900   36.900 simple aprox.py:274(train)
  705/483    0.001    0.000   34.495    0.071 {built-in method builtins.next}
      222    1.525    0.007   34.493    0.155 dataloader.py:311(__next__)
      222    0.851    0.004   12.752    0.057 dataloader.py:314(<listcomp>)
  3016001   11.901    0.000   11.901    0.000 simple aprox.py:176(__getitem__)
       21    0.010    0.000   10.891    0.519 simple aprox.py:413(validationError)
      443    1.380    0.003    9.664    0.022 sampler.py:136(__iter__)
  663/221    2.209    0.003    8.652    0.039 dataloader.py:151(default_collate)
      221    0.070    0.000    6.441    0.029 dataloader.py:187(<listcomp>)
      442    6.369    0.014    6.369    0.014 {built-in method stack}
  3060221    2.799    0.000    5.890    0.000 sampler.py:68(<genexpr>)
  3060000    3.091    0.000    3.091    0.000 tensor.py:382(<lambda>)
      222    0.001    0.000    1.985    0.009 sampler.py:67(__iter__)
      222    1.982    0.009    1.982    0.009 {built-in method randperm}
  663/221    0.002    0.000    1.901    0.009 dataloader.py:192(pin_memory_batch)
      221    0.000    0.000    1.899    0.009 dataloader.py:200(<listcomp>)
....

与我的实验的剩余活动（训练模型和许多其他计算等）相比，建议数据加载器非常慢。出了什么问题以及加快速度的最佳方法是什么？

当检索批次时

x, y = next(iter(training_loader))

实际上，您在每次调用时都会创建一个数据加载器迭代器的新实例（！）参见这个线程了解更多信息。
你应该做的是创建迭代器once（每个纪元）：

training_loader_iter = iter(training_loader)

然后打电话next对于迭代器上的每个批次

for i in range(num_batches_in_epoch):
  x, y = next(training_loader_iter)

我之前遇到过类似的问题，这也使得您在使用多个工作人员时遇到的 EOF 错误消失了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

machinelearning

Iterator

Pytorch

PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？的相关文章

Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
向前和向后迭代

我们有一个双端结构列表例如LinkedList 我需要向前和向后迭代元素例如向前 4 次然后向后 2 次然后向前 5 次在 C 中它将是 iter iter iter 在 Rust 中我只看到 next and rev 这很不
Mobilenet 与 SSD [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010

随机推荐

Windows 上的 Erlang 列表理解乘法给出“\f”

大家好我在 Windows 上运行 Erlang 时遇到一个奇怪的问题我运行的是 16B 和 WinXP 我有以下代码 module test export cost 1 total 1 cost orange gt 5 cost ap
Azure 连接字符串异常“发生与网络相关或实例特定的错误”

尝试使用以下连接字符串连接到 SQL Azure 时服务器 tcp SERVER database windows net 1433 数据库 DBNAME 用户ID USER SERVER 密码 PASSWORD Trusted Conn
在生产 Azure Service Fabric 群集中找不到 libsodium-64.dll

在 Azure Service Fabric 可靠服务中使用 libsodium net 来发挥其所有安全优势在我的本地开发集群上一切都工作正常尽管我必须将 libsodium 64 dll 设置为复制到输出目录不幸的是当部署到
如何从 apply.monthly 函数中提取日期

如果我有一组每日数据我想获取每个月的最小值以及该值发生的日期如果我使用apply monthly函数它给了我最小值但相应的日期是每个月的月底而不是实际发生的日期我怎样才能得到正确的日期 library xts create sa
当传递大的逗号分隔值时，使用自定义 TABLE TYPE 作为参数而不是 SQL“IN”子句是否更好

我有一个存储过程它接受逗号分隔的字符串作为输入有时可能太大大约超过 8000 个字符或更多在这种情况下查询性能有时会下降我认为里面的字符长度有限制IN条款为此有时我会遇到错误现在我需要知道使用自定义表类型作为参数并使用是
R 查询 '$'()

我创建了一个数据框并尝试访问数据框中的列代码如下图 df lt data frame n c A B C mark 1 c 23 25 17 mark 2 c 45 46 50 j lt paste mark 1 sep j f lt d
LUIS 应用程序无法训练 - 应用程序训练失败：l_general：重新训练

我无法再构建和训练我的调度员 LUIS 应用程序如果我尝试运行调度 CLI 来刷新我的调度程序模型例如dispatch refresh dispatch mydispatchfile dispatch 它会挂在训练调度模型上并最终返回
在 Magento 中以编程方式添加面包屑路径？

在 Magento 中当用户直接访问产品页面例如从 Google 时面包屑导航将仅为主页 gt 产品名称即使用户直接从 Google 访问页面我如何在其中添加类别例如关于这一页我想在面包屑中添加婚礼服装和婚礼礼服类
无法将集合与 InExpression 一起使用

我刚刚深入研究了一些 NHibernate 但我在必须编写的一个更复杂对我来说的查询中遇到了麻烦场景是我有一个员工对象其中附加了一系列技能我想传递一个技能列表来查询例如如果我只想要可以烹饪或编码或两者兼而
twitter bootstrap 中水平表单内的内联表单？

在 Twitter Bootstrap 中设计一个看起来像这样的表单请参阅下面的链接而不需要任何自制类的最佳方法是什么是否可以在水平表单内设置内部表单内联如下例所示不要筑巢
如何从 Makefile 设置 MAKEFLAGS，以删除默认的隐式规则

我尝试以下 makefile MAKEFLAGS s MAKEFLAGS r configure 然后当我运行 make 时我收到以下错误好像它想编译 configure 每default隐式规则 usr bin ld usr lib
Spark：解析数据帧同一列中不同格式的日期/时间戳（MM-dd-yyyy HH:mm、MM/dd/yy H:mm）

问题是我有一个数据集其中一列具有两种或多种日期格式一般来说我选择所有值作为字符串类型然后使用to date解析日期但我不知道如何解析具有两种或多种日期格式的列 val DF Seq 02 04 2020 08 02 03 04
如何将代码对象保存到文件中？

如何将代码对象 code 保存到文件中 gt gt gt c code line 1 gt gt gt gt pickle dump c f Traceback most recent call last File code
将 Android 视图附加到布局或从布局分离

我想在 Application 类的派生类的 onCreate 方法中创建一个 WebView 然后在调用活动 onCreate 时将其附加到主布局并在调用 onDestroyed 时将其分离因此每次创建销毁 Activity 时
Hadoop MapReduce 中为 Java 类型提供可写包装类的原因是什么？

在我看来一个org apache hadoop io serializer Serialization可以编写为直接以与包装类将类型序列化为相同的格式来序列化 java 类型这样 Mappers 和Reducers 就不必处理包装类没
SQL Server：按字符串连接分组

我有个问题我知道以前有人问过这个问题我查看了相关问题但无法让我的 SQL 脚本运行这是我的查询 SELECT T1 PART ID T2 ID T2 DESCRIPTION FROM TEMP T1 INNER JOIN TEMP2
React Suspend 后的组件未加载？

我必须用 suspense 和react lazy 来分解我的一些路线以确保我的捆绑文件不是荒谬的但是这样做之后我的第一个悬念括号之后的路线就不再起作用了在以下示例中链接 1 6 的路由工作正常没有问题并且可以正确渲染但是 S
附加到之前打开的 puppeteer 驱动程序

是否可以重新连接到现有的木偶操作者打开 puppeteer chrome 浏览器节点脚本结束而不关闭浏览器新脚本将附加并使用同一浏览器继续对于那些偶然发现这一点的人以下是我如何使其工作的示例 const puppeteer req
如何检测 Angular 何时将元素附加到 DOM？

有一个组件
PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？

Here x dat and y dat只是非常长的一维张量 class FunctionDataset Dataset def init self x dat y dat data product self length len x da

PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？

PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？ 的相关文章

随机推荐

热门标签

PyTorch next(iter(training_loader)) 非常慢，简单的数据，num_workers 不行吗？的相关文章