PyTorch：如何使用 DataLoaders 自定义数据集

2024-03-13

如何利用torch.utils.data.Dataset and torch.utils.data.DataLoader根据您自己的数据（不仅仅是torchvision.datasets)?

有没有办法使用内置的DataLoaders他们使用的TorchVisionDatasets用于任何数据集？

是的，这是可能的。只需自己创建对象，例如

import torch.utils.data as data_utils

train = data_utils.TensorDataset(features, targets)
train_loader = data_utils.DataLoader(train, batch_size=50, shuffle=True)

where features and targets是张量。features必须是二维的，即每行代表一个训练样本的矩阵，并且targets可能是一维或二维，具体取决于您是尝试预测标量还是向量。

EDIT: 回应@sarthak的问题

基本上是的。如果你创建一个类型的对象TensorData，然后构造函数研究特征张量的第一个维度（实际上称为data_tensor）和目标张量（称为target_tensor) 具有相同的长度：

assert data_tensor.size(0) == target_tensor.size(0)

但是，如果您随后想将这些数据输入神经网络，那么您需要小心。虽然卷积层对像您这样的数据起作用，但（我认为）所有其他类型的层都希望数据以矩阵形式给出。因此，如果您遇到这样的问题，那么一个简单的解决方案就是转换您的 4D 数据集（以某种张量形式给出，例如FloatTensor) 使用以下方法转化为矩阵view。对于您的 5000xnxnx3 数据集，这将如下所示：

2d_dataset = 4d_dataset.view(5000, -1)

（价值-1告诉 PyTorch 自动计算出第二维的长度。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

PyTorch：如何使用 DataLoaders 自定义数据集的相关文章

保存散点图动画

我一直在尝试使用 matplotlib 保存动画散点图并且我希望它不需要完全不同的代码来查看动画图形和保存副本该图完美显示了保存完成后的所有数据点这段代码是修改后的版本Giggi s https stackoverflow com a
为什么 localhost:5000 在 Flask 中不起作用？

我正在使用 Flask 应用程序工厂模式并且有这个 run py 文件 from app import create app app create app if name main app run host localhost debug
嵌套列表递归python的序列

给定一些数字 n 我想生成一个大小为 n 的列表其中以下示例显示列表中的第 n 个元素应该如何对于 n 0 返回对于 n 1 返回对于 n 2 返回对于 n 3 返回基本上它采用先前的列表并将它们附加到新列表中我尝试过以下方
python 和回文

我最近写了一个循环的方法 usr share dict words并使用我的返回回文列表ispalindrome x 方法这是一些代码有什么问题吗它只会停止 10 分钟然后返回文件中所有单词的列表 def reverse a ret
您可以使用 Openpyxl 将全名拆分为名字和姓氏吗？

我有一个 Excel 文件我一直在尝试使用 openpyxl 将列全名拆分为两个单独的名字和姓氏列例如我有 from openpyxl import Workbook load workbook wb load workboo p
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
matplotlib pyplot：子图大小

如果我绘制如下所示的单个图它将具有 x y 大小 import matplotlib pyplot as plt plt plot 1 2 1 2 但是如果我在同一行中绘制 3 个子图则每个子图的大小均为 x 3 y fig ax p
比较两个类似列表的对象的内容的最佳方法是什么？

例如当我必须比较两个类似数组的对象的内容时lists tuples or collection deques 不考虑对象的类型我使用 list an arrayish list another arrayish 有没有更惯用更快更好
如何在使用 python 下载时优雅地超时

我正在循环下载大量文件其中包含以下代码 try urllib urlretrieve url2download destination on local filesystem except KeyboardInterrupt break
将画布的鼠标坐标转换为地理坐标

我正在尝试使用 Python Tkinter 创建包含意大利所有城市的地图Canvas 我在网上找到了一张意大利地图的图片其中突出显示了一些城市并将其插入到我的Canvas 之后我使用一个函数来确定 2 个突出显示的城市的画布坐标 i
使用循环计算 Python 字典中元素的有效方法

我有一个值列表我希望在循环期间计算每个类的元素数量即 1 2 3 4 5 mylist 1 1 1 1 1 1 2 3 2 2 2 2 3 3 4 5 5 5 5 mydict dict for index in mylist mydi
如何删除在 Matplotlib 中使用鼠标悬停事件创建的绘图线？

我在带有鼠标悬停事件的图中创建了一条垂直线和一条水平线这些线旨在帮助用户选择在图中单击的位置我的问题是当鼠标移动到绘图上时之前绘制的线条不会消失有人可以解释我该怎么做吗我在 OnOver 函数内绘制绘图后使用了 ax lines
将 python 代码写入 python 文件的最佳方法是什么？

我想编写一个脚本 generate script py 生成另一个python脚本 file generated py 到目前为止我已经创建了generate script py import os filepath os getcwd d
如何使用高复制数据存储

好的我已经看过了video http www google com events io 2011 sessions more 9s please under the covers of the high replication datas
Python 类：通过传递值实现单例还是非单例？

我有一个 Python 3 类目前是使用 a 定义的单例 singleton装饰器但有时需要not成为单身人士问题是否可以在从类实例化对象时执行类似于传递参数的操作并且该参数确定该类是否是单例我试图找到一种替代方法来复制类并使其
从纪元到相对日期的秒数

我正在处理自纪元以来的日期并且已经得到了例如 date 6928727 56235 我想将其转换为另一种相对格式以便我能够将其转换为与纪元相关的格式使用 time gmtime date 它返回 year 1970 mon 3 da
在 Django 查询中与父级一起获取子级数据

我有两个模型产品和产品包产品包有一个产品型号的外键我如何访问包含产品包的所有产品的列表 class Product models Model title models CharField verbose name Product Tit
使用 python 提取 MP3 URL 的 ID3 标签并进行部分下载

我需要提取远程 mp3 文件的 ID3 标签和元数据我写了几行可以获取本地文件的ID3标签 from mutagen mp3 import MP3 import urllib2 audio MP3 Whistle mp3 songtitl
如何使用 Python 从 Azure Functions 中的辅助线程重定向日志

我正在使用 Azure 函数运行启动多个线程的 Python 脚本出于性能原因一切都按预期工作但 Azure Functions 日志中仅显示来自 main 线程的信息日志我在 main 中启动的辅助线程中使用的所有日志都不会出
使用 PyDrive 将图像上传到 Google Drive

我有一个关于 PyDrive 的愚蠢问题我尝试使用 FastAPI 制作一个 REST API 它将使用 PyDrive 将图像上传到 Google Drive 这是我的代码 from fastapi import FastAPI Fil

随机推荐

仅对单个类禁用 Linq to SQL 类中的自动复数化

我有一个带有不规则复数的表名复数与单数相同有没有办法禁用该单个表的自动复数 Account DB Accounts 同时保留其他表的功能您需要禁用 LINQ to SQL 设计器的复数表名称为此请导航至工具 gt 选项 gt 数
使用本地 WSDL 文件生成 Metro 客户端

我之前使用 wsimport 生成了 Metro 客户端但在这种情况下 WSDL 是通过 https 访问的我的命令看起来像这样 wsimport https service net services Service wsdl d C
Ubuntu：按 Super+L 时不要锁定屏幕 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Whenever I press Super L or Win L on my Ubuntu 14 04 Desktop the scre
按值字母顺序对 Javascript 对象进行排序

我有一个 JS 对象如下 var obj 00 11 22 33 44 55 AddressB 66 77 88 99 AA BB AddressA 55 44 33 22 11 00 AddressC AA BB CC DD EE FF
Apache Kafka 主题名称限制有哪些？

我刚刚尝试创建一个 Kafka 主题 user created 并在 Kafka 日志中看到此错误 Invalid character in value part of property 我用谷歌搜索发现在邮件列表中人们正在谈论弃用 a
React Native 后台计时器永远不会停止

我正在构建一个应用程序它有一个计时器可以在计时器处于活动状态时请求地理位置对于我正在使用的计时器反应本机背景计时器 https github com ocetnik react native background timer 这是可行
调用 sp_rename 时使用变量

我尝试制作一个存储过程它将删除主键重命名设置主键的列名创建新的主键我正在努力解决第 2 点我正在尝试将列重命名为sp rename将参数传递给存储过程如下所示 EXEC sp rename SCHEMA TABLE ID Id
为什么我运行 python manage.py runserver 时有两个进程

wenzhixue 80384 0 4 1 1 2464788 22584 s001 S 10 37AM 0 01 06 usr bin python manage py runserver 0 0 0 0 8000 wenzhixue 8
如何处理大量浮点数据？

我们有一个二进制文件其中包含大量float数据约80MB 我们需要在 Java 应用程序中处理它数据来自医疗扫描仪一个文件包含来自一个文件的数据Rotation One Rotation包含 960Views One View包含
为构建器配置 lombok

我想避免多个构造函数所以我想使用建造者设计模式 https en wikipedia org wiki Builder pattern 通过使用lombok https projectlombok org setup maven图书馆它
Tensorflow tf.data.Dataset.cache似乎没有达到预期的效果

我正在尝试按照以下方法提高我的模型训练性能使用 tf data API 获得更好的性能 https www tensorflow org guide data performance指导方针然而我观察到使用的性能 cache 如果与没有
将键、值对添加到新字典中

我当前的字典中有一个现有的键值对列表称为total list 我想检查我的列表看看每个的长度是否Key 1 in total list 我想将该键及其值对添加到新字典中这是我想出的代码 total list 104370544 31
导入 SMOTE 引发 AttributeError：模块“sklearn.metrics._dist_metrics”没有属性“DistanceMetric32”

Running from imblearn over sampling import SMOTE会引发以下错误 AttributeError Traceback most recent call last d A OneDrive UBC
ggplot：向现有分组箱线图添加新数据

我用 ggplot2 创建了一个分组箱线图现在我想通过以下方式向现有绘图添加附加数据我每个月都有one 最佳值应显示为点并且这些点应通过线连接这是期望的状态我如何将这些点和线添加到我的绘图中我可以将连接线放在箱线图后面吗这是
IIS SSL 错误“ssl_error_rx_record_too_long”

我使用以下 SSL 命令创建了一个证书 makecert r pe n CN www yourserver com b 01 01 2000 e 01 01 2036 eku 1 3 6 1 5 5 7 3 1 ss my sr local
我在哪里可以了解“shell:”URI？

我刚刚意识到有一个shell URI 但每个搜索引擎似乎都认为shell and shell是同一件事我唯一发现的是你可以输入shell startup直接在资源管理器中 XP 和 7 测试过可以看到明显的效果这已经很好了因为没有
强制 JTable 在仍处于编辑模式时将数据“提交”到模型

我有一个 JTable 如下因此当 JTable 仍处于编辑模式时在 Dividend 列处有键盘光标闪烁直接单击确定不会将数据提交到表模型中单击确定仅关闭对话框我需要明确按 ENTER 键以便将数据提交到表模型中当
SNMP：创建自定义 OID

我需要自定义 OID 来监控我的一些软件状态但我就是不明白如何在Windows XP系统中创建自定义OID 如 1 3 6 1 4 1 30891 100 103 我需要其中一些人在那里写一些信息并在需要时阅读它但我不知道如何在系统中
Java/LWJGL：OpenGL 中的 Z 轴表现得像左手坐标系

最近我寻求帮助 https stackoverflow com q 18836484 1530508关于 OpenGL 中的 3D 相机旋转这个答案 https stackoverflow com a 18836618 1530508接
PyTorch：如何使用 DataLoaders 自定义数据集

如何利用torch utils data Dataset and torch utils data DataLoader根据您自己的数据不仅仅是torchvision datasets 有没有办法使用内置的DataLoaders他们使用的

PyTorch：如何使用 DataLoaders 自定义数据集

PyTorch：如何使用 DataLoaders 自定义数据集 的相关文章

随机推荐

热门标签

PyTorch：如何使用 DataLoaders 自定义数据集的相关文章