自定义数据集和数据加载器

2024-01-31

我是 pytorch 的新手。 我有一个大数据集,由两个 txt 文件组成,一个用于数据,另一个用于目标数据。 在训练文件中,每行是长度为 340 的列表,在目标中,每行是长度为 136 的列表。

我想问我如何定义我的数据集,以便我可以使用 Dataloader 加载我的数据来训练 pytorch 模型?

我很感激你的回答


Dataset from torch.utils.data是表示数据集的抽象类。您的自定义数据集应继承 Dataset 并重写以下方法:

__len__()这样 len(dataset) 返回数据集的大小。
__getitem__()支持索引,以便 dataset[i] 可用于获取第 i 个样本

例如编写自定义数据集
我已经为您编写了一个通用的自定义数据加载器作为您的问题陈述。
这里 data.txt 有数据,label.txt 有标签。

import torch
from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self):
        
       
        with open('data.txt', 'r') as f:
                self.data_info = f.readlines()
        
        with open('label.txt', 'r') as f:
                self.label_info = f.readlines()        


    def __getitem__(self, index):
        
        single_data = self.data_info[index].rstrip('\n')
        

        single_label = self.label_info[index].rstrip('\n')

        return ( single_data , single_label)

    def __len__(self):
        return len(self.data_info)
# Testing 
d = CustomDataset()
print(d[1]) # should output data along with label

这将是您案例的基础,但必须进行一些与您的案例相匹配的更改。

注意:您必须根据您的数据集进行必要的更改

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

自定义数据集和数据加载器 的相关文章

随机推荐

  • django如何在FilteredSelectMultiple中显示用户全名

    我正在尝试使用 FilteredSelectMultiple 小部件来显示用户列表 目前它仅显示用户名 我尝试覆盖 label from instance 如下所示 但它似乎不起作用 它如何显示用户的全名 class UserMultipl
  • 如何在 Xcode 中查找并替换选定内容?

    在 Xcode 现在这似乎再次起作用了 至少在 Xcode 4 4 1 中是这样 当查找 替换栏出现在编辑器顶部时 按住键盘上的选项键会出现 替换所选内容 而不是 全部替换 我很高兴 因为这是一个令人烦恼的遗漏
  • 如何使用 PHP 检查远程文件是否存在?

    我能找到的最好的 一个if fclose fopen输入东西 使页面加载非常慢 基本上我想做的是 我有一个网站列表 我想在它们旁边显示它们的图标 但是 如果网站没有 我想用另一张图像替换它 而不是显示损坏的图像 您可以通过CURLOPT N
  • STL 中的双端队列到底是什么?

    我正在研究 STL 容器并试图弄清楚它们到底是什么 即使用的数据结构 以及deque阻止了我 我一开始以为这是一个双链表 可以在常数时间内从两端插入和删除 但我很困扰做出的承诺 http en cppreference com w cpp
  • avc: 拒绝 { read } for name="/" dev="rootfs" ino=1 scontext=u:r:untrusted_app

    我无法在这里找到我尝试创建的 Android 文件管理器应用程序上读 写问题的解决方案 在真实设备上运行时 我无法从 SD 卡中删除文件 谁能指导我 我做错了什么以及如何修复权限 我已添加读 写权限AndroidManifest xml
  • 错误代码:1055 与 sql_mode=only_full_group_by 不兼容

    我在切换到 Lahman SQL 棒球数据库的离线版本时遇到问题 我正在使用嵌入 EDX 课程的终端 此命令在 Web 终端上运行良好 SELECT concat m nameFirst concat m nameLast as Playe
  • 查找严格位于 X 个列表中的 N 个中的元素

    我有 N 个列表 并且想知道哪些元素严格出现在这些列表的 X 个中 我知道如果我有两个列表 那就相当简单了 lst a 1 2 3 lst b 1 2 5 overlap list set a set b 如果我有 5 个列表 并且想知道哪
  • 使用 BouncyCastle 使用密码加密私钥

    我是 BouncyCastle 的新手 我有一个使用以下代码生成的私钥 final CertAndKeyGen keypair new CertAndKeyGen RSA SHA1WithRSA null keypair generate
  • ADO.NET TableAdapter 参数

    我有一个查询 希望通过包含 IN 子句的 ASP NET TableAdapter 运行 该子句通过参数接收其值 我的问题是 如何指定这个参数 我想把条件语句写成这样 AND b group category id in ParamList
  • Inno Setup 在appendChild msxml 中崩溃

    我想在 Inno Setup 中修改 xml 文件 但安装程序崩溃了 我尝试了不同的方法 结果得到了有问题的示例代码 procedure testXml var xmlDocLocal nodeLocal Variant begin try
  • 如何锁定具有相同 id 的对象?

    我有以下代码 public void Update Foo foo lock locker UpdateFirstPart foo First UpdateSecondPart foo Second UpdateThirdPart foo
  • 根据python中的条件添加前导零

    我有一个包含 500 万行的数据框 假设数据框如下所示 gt gt gt df pd DataFrame data Random 86 7639103627 96 32 1469476501 split gt gt gt df Random
  • 正则表达式匹配英国邮政编码的前半部分

    我需要一个正则表达式来匹配英国邮政编码的前半部分 并且可能只能传入一半或完整的邮政编码 这里有一个匹配完整邮政编码的好方法 英国邮政编码正则表达式 综合 https stackoverflow com questions 164979 uk
  • 聚合物后退按钮不适用于哈希路由

    赞 后退按钮有时不适用于我的聚合物项目 当我按下后退按钮时page变量是当前页面的钢 我需要按两次或三次按钮才能使其工作 例如我转到 rules页面来自 home但它不会回到 home一旦我第二次或第三次按后退按钮 它就会返回主页 这是我的
  • 如何以管理员权限从 Windows 服务运行程序

    我创建了一个在 Windows 启动时运行程序的 Windows 服务 但使用此解决方案 该程序无需管理员权限即可运行 但是 如果我通过单击 开始 菜单上的程序快捷方式来运行该程序 它将以管理员权限运行 我使用这段代码来运行该程序 Appl
  • 从 RAILS_ROOT 外部运行 rake 任务

    我的 RAILS ROOT 是 usr local www application 如果我从 RAILS ROOT 中运行 rake db migrate RAILS ENV 生产 它就可以正常工作 但是我似乎找不到从 RAILS ROOT
  • 钛金 Android 屏幕方向

    我用 Titanium 制作了一个 Android 应用程序 设备旋转时屏幕也会旋转 如何在 Android 应用程序中停止窗口 屏幕方向 Use android screenOrientation portrait 在 Android M
  • ionic 2 ion-select - 以编程方式关闭选择框

    我正在从事 ionic2 项目 我使用离子选择元件 我搜索一种在选择任何项目时以编程方式关闭选择框的方法 而不是等待用户按 确定
  • 处理无效的 XML 十六进制字符

    我尝试通过网络发送 XML 文档 但收到以下异常 MY LONG EMAIL STRING was specified for the Body element amp gt System ArgumentException x2 hexa
  • 自定义数据集和数据加载器

    我是 pytorch 的新手 我有一个大数据集 由两个 txt 文件组成 一个用于数据 另一个用于目标数据 在训练文件中 每行是长度为 340 的列表 在目标中 每行是长度为 136 的列表 我想问我如何定义我的数据集 以便我可以使用 Da