使用Pytorch DataLoader快捷封装训练数据、测试数据的X与Y

2023-11-05

DataSet的用法可以参考：pytorch 构造读取数据的工具类 Dataset 与 DataLoader （pytorch Data学习一）

DataLoader的封装方法可以参考：Pytorch DataLoader一次性封装多种数据集（pytorch Data学习六）

这里博主提供的是一个工具，整个封装流程是：

构造DataSet用以定义数据集x与y的模板
使用sklearn.datasets.make_regression生成回归任务的数据
使用pytorch的Tensor格式封装产生的数据
将Tensor格式数据封装如DataSet
将DataSet封装入DataLoader

示例代码

from torch.utils.data import Dataset
import torch


class DatasetXY(Dataset):
    def __init__(self, x, y):
        self._x = x
        self._y = y
        self._len = len(x)

    def __getitem__(self, item):  # 每次循环的时候返回的值
        return self._x[item], self._y[item]

    def __len__(self):
        return self._len


def load_data(samples=1000, n_features=10, split_train_size: float = 0.3):
    """用来生成回归任务的训练、测试数据"""
    from sklearn.datasets import make_regression
    from sklearn.model_selection import train_test_split
    from torch.utils.data import DataLoader
    # 使用sklearn生成回归任务数据
    data_x, data_y = make_regression(n_samples=samples, n_features=n_features)
    x_train, x_test, y_train, y_test = train_test_split(data_x, data_y, train_size=split_train_size, random_state=0)
    # 封装为dataloader
    train_loader = DataLoader(DatasetXY(torch.Tensor(x_train).float(), torch.Tensor(y_train).float()),
                              batch_size=10, shuffle=False, drop_last=True, num_workers=0)
    test_loader = DataLoader(DatasetXY(torch.Tensor(x_test).float(), torch.Tensor(y_test).float()),
                             batch_size=10, shuffle=False, drop_last=True, num_workers=0)
    return train_loader, test_loader


def main():
    train_loader, test_loader = load_data()
    for train_x, train_y in train_loader:
        print("打印训练数据：")
        print("train_x:", train_x)
        print('train_y:', train_y)
        break
    for test_x, test_y in test_loader:
        print("打印训练数据：")
        print("test_x:", test_x)
        print('test_y:', test_y)
        break


if __name__ == '__main__':
    main()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pytorch神经网络

Pytorch

使用Pytorch DataLoader快捷封装训练数据、测试数据的X与Y 的相关文章

pytorch - “conv1d”在哪里实现？

我想看看 conv1d 模块是如何实现的https pytorch org docs stable modules torch nn modules conv html Conv1d https pytorch org docs stabl
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
在pytorch中使用tensorboard，但得到空白页面？

我在pytorch 1 3 1中使用tensorboard 并且我在张量板的 pytorch 文档 https pytorch org docs stable tensorboard html 运行后tensorboard logdir r
pytorch grad 在 .backward() 之后为 None

我刚刚安装火炬 1 0 0 on Python 3 7 2 macOS 并尝试tutorial https pytorch org tutorials beginner blitz autograd tutorial html sphx g
torch-1.1.0-cp37-cp37m-win_amd64.whl 在此平台上不受支持的滚轮

我在开发 RNN 时需要使用 pyTorch 每当我尝试安装它时我都会收到一条错误消息指出 torch 1 1 0 cp37 cp37m win amd32 whl 在此平台上不受支持 pip3安装https download pyto
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
对 FastAI 中的数据应用图像增强转换时出错

我正在尝试复制这个 Kaggle 笔记本https www kaggle com tanlikesmath diabetic retinopathy with resnet50 oversampling https www kaggle c
PyTorch LSTM 中的“隐藏”和“输出”有什么区别？

我无法理解 PyTorch 的 LSTM 模块以及类似的 RNN 和 GRU 的文档关于输出它说输出输出 h n c n 输出 seq len batch hidden size num directions 包含RNN最后一层的

随机推荐

虚拟化KVM

什么是虚拟化在计算机技术中虚拟化是一种资源管理技术是将计算机的各种实体资源 CPU 内存磁盘空间网络适配器等予以抽象转换后呈现出来并可供分割组合为一个或多个计算机配置环境并重新分割重新组合已达到最大化合理利用物理资源的
程序的运行结构

一程序的运行结构有三种 1 顺序结构 2 分支结构 3 循环结构二分支结构根据代码的成立与否选择执行方向包括 if 判断条件代码块 if else语句一定会执行一个语句或者是if里面的或者是else里面的 switch 整
Leetcode每日一题：589. N 叉树的前序遍历

前序遍历二叉树的要点就是根左右在这里遍历的是n叉树因此先访问根节点然后再遍历根节点的每个孩子就可以了递归解法 Definition for a Node class Node def init self val None child
Qt学习笔记：2018年8月记录

1 Qt 设置背景图片注意事项使用stylesheet设置背景图片还是有一些要注意的如果是在mainwindow和dialog中直接右键change style sheet在add resource中选择background imag
The method getContextPath() from the type HttpServletRequest refers to the missing type

问题描述每个JSP页面中的 request getContextPath 下方出现了红色的波浪线提示的错误信息是 The method getContextPath from the type HttpServletRequest re
微信小程序页面监听右上角退出，判断小程序进入后台时就实现页面跳转

功能需求在小程序中某一个页面没有进入后台的功能如果点击右上角退出按钮默认小程序进入后台点击再次进入本页面但是因为功能需要在小程序进入后台时再次进入需要跳转到首页实现方法在app js onHide 生命周期中监听进入后台的
项目启动报错: This is very likely to create a memory leak. Stack trace of thread 解决方案

问题发现 The web application ROOT appears to have started a thread named UIC STATISTIC THREAD but has failed to stop it This
深度学习AI编译器-LLVM简介

1 什么是LLVM LLVM的命名最早来源于底层语言虚拟机 Low Level Virtual Machine 的缩写它是一个用于建立编译器的基础框架以C 编写创建此工程的目的是对于任意的编程语言利用该基础框架构建一个包括编译时
STM32 进阶教程 5 - 内联函数

前言在计算机科学中内联函数有时称作在线函数或编译时期展开函数是一种编程语言结构用来建议编译器对一些特殊函数进行内联扩展有时称作在线扩展也就是说建议编译器将指定的函数体插入并取代每一处调用该函数的地方上下文从而节省了每次调用
用matlab生成规定维度的随机不重复矩阵

这几天用到一个小功能要生成随机不重复的整数矩阵而且要求行和列数写了个很好用的函数分享一下先上效果以1为下界 10为上界生成5行1列的随机矩阵s 以10为下界 100为上界生成5行3列的随机矩阵s 想要直接用的可以去我资源界面
天龙八部网单服务器修改爆率,【天龙八部3】网单一键安装服务端+GM工具+GM刷装备+视频教程电脑单机版游戏...

天龙八部3 网单一键安装服务端 GM工具 GM刷装备视频教程电脑单机版游戏资源介绍支持系统 WINXP WIN7 WIN8 WIN10 32 64位支持网络单机次更新后为正常开出宝宝繁殖为单人繁殖修改宝宝为打满12技能还
基于yolov5的火焰识别

基于yolov5的火焰识别 1 准备工作 yolov5项目下载下载yolov5项目代码其链接为 yolov5项目地址并且在PC机上配置环境即正常按照requirements安装依赖包而后根据自身需要下载相应的权重文件 yolov5
如何查看和修改Windows远程桌面端口

如何查看和修改Windows远程桌面端口一查看Windows远程桌面端口 1 查看远程桌面服务TermService进程PID 选择开始 gt 运行输入 cmd 打开命令行窗口执行 tasklist svc find Ter 如果
ununtu HI3559A学习笔记

刚装上ubuntu18 04没有为wifi适配器原因没有驱动网卡mediatek mt7630e 解决来源 https blog csdn net zw chen article details 78355047 内容 Mediat
全面了解一致性哈希算法及PHP代码实现

在设计一个分布式系统的架构时为了提高系统的负载能力需要把不同的数据分发到不同的服务节点上因此这里就需要一种分发的机制其实就是一种算法来实现这种功能这里我们就用到了Consistent Hashing算法在正式介绍Consist
开发者，为什么需要构建知识图谱

作者简介安晓辉 10多年开发经验曾任软件开发工程师项目经理研发经理技术总监等岗位著有 Qt Quick核心编程 Qt on Android核心编程你好哇程序员等书籍斜杠青年技术专家职业规划师图书作者在行西安首批行
Set集合转为List集合常见的方式

将 Set 转为 List 可以有多种方法以下是两种常见的实现方式使用构造方法可以使用 List 的构造方法 ArrayList Collection
使用matlab通过遗传算法实现多元函数极值计算

这里是对一个二元函数求解极大值问题如果你希望求解更多元函数需要添加额外的基因例如z 在pop数组中添加第三列染色体的第三列基因设置新的评判标准函数 fitness 如果你希望提高运算精度可以尝试增大种群规模优秀基因出现概率更高
flowable(四) - 使用flowable-modeler-ui 定义流程

步骤地址 Flowable Modeler http localhost 8080 flowable modeler Flowable Task http localhost 8080 flowable task Flowable Adm
使用Pytorch DataLoader快捷封装训练数据、测试数据的X与Y

DataSet的用法可以参考 pytorch 构造读取数据的工具类 Dataset 与 DataLoader pytorch Data学习一 DataLoader的封装方法可以参考 Pytorch DataLoader一次性封装多种数据集

使用Pytorch DataLoader快捷封装训练数据、测试数据的X与Y

示例代码

使用Pytorch DataLoader快捷封装训练数据、测试数据的X与Y 的相关文章

随机推荐

热门标签