使用可变批量大小加载数据？

2023-12-28

我目前正在研究基于补丁的超分辨率。大多数论文将图像分割成更小的补丁，然后使用这些补丁作为模型的输入。我能够使用自定义数据加载器创建补丁。代码如下：

import torch.utils.data as data
from torchvision.transforms import CenterCrop, ToTensor, Compose, ToPILImage, Resize, RandomHorizontalFlip, RandomVerticalFlip
from os import listdir
from os.path import join
from PIL import Image
import random
import os
import numpy as np
import torch

def is_image_file(filename):
    return any(filename.endswith(extension) for extension in [".png", ".jpg", ".jpeg", ".bmp"])

class TrainDatasetFromFolder(data.Dataset):
    def __init__(self, dataset_dir, patch_size, is_gray, stride):
        super(TrainDatasetFromFolder, self).__init__()
        self.imageHrfilenames = []
        self.imageHrfilenames.extend(join(dataset_dir, x)
                                     for x in sorted(listdir(dataset_dir)) if is_image_file(x))
        self.is_gray = is_gray
        self.patchSize = patch_size
        self.stride = stride

    def _load_file(self, index):
        filename = self.imageHrfilenames[index]
        hr = Image.open(self.imageHrfilenames[index])
        downsizes = (1, 0.7, 0.45)
        downsize = 2
        w_ = int(hr.width * downsizes[downsize])
        h_ = int(hr.height * downsizes[downsize])
        aug = Compose([Resize([h_, w_], interpolation=Image.BICUBIC),
                       RandomHorizontalFlip(),
                       RandomVerticalFlip()])

        hr = aug(hr)
        rv = random.randint(0, 4)
        hr = hr.rotate(90*rv, expand=1)
        filename = os.path.splitext(os.path.split(filename)[-1])[0]
        return hr, filename

    def _patching(self, img):

        img = ToTensor()(img)
        LR_ = Compose([ToPILImage(), Resize(self.patchSize//2, interpolation=Image.BICUBIC), ToTensor()])

        HR_p, LR_p = [], []
        for i in range(0, img.shape[1] - self.patchSize, self.stride):
            for j in range(0, img.shape[2] - self.patchSize, self.stride):
                temp = img[:, i:i + self.patchSize, j:j + self.patchSize]
                HR_p += [temp]
                LR_p += [LR_(temp)]

        return torch.stack(LR_p),torch.stack(HR_p)

    def __getitem__(self, index):
        HR_, filename = self._load_file(index)
        LR_p, HR_p = self._patching(HR_)
        return LR_p, HR_p

    def __len__(self):
        return len(self.imageHrfilenames)

假设批量大小为 1，它获取图像并给出 size 的输出[x,3,patchsize,patchsize]。当批量大小为 2 时，我将有两个不同大小的输出[x,3,patchsize,patchsize]（例如图像 1 可能给出[50,3,patchsize,patchsize]，图像2可能给出[75,3,patchsize,patchsize]）。为了处理这个问题，需要一个自定义的整理函数来沿着维度 0 堆叠这两个输出。整理函数如下：

def my_collate(batch):
    data = torch.cat([item[0] for item in batch],dim = 0)
    target = torch.cat([item[1] for item in batch],dim = 0)

    return [data, target]

这个整理函数沿着 x 连接（从上面的例子中，我终于得到[125,3,patchsize,pathsize]。出于训练目的，我需要使用 25 的小批量大小来训练模型。是否有任何方法或函数可以用来直接获得大小的输出[25 , 3, patchsize, pathsize]直接从数据加载器使用必要数量的图像作为数据加载器的输入？

以下代码片段可满足您的目的。

首先，我们定义一个 ToyDataset，它接受张量列表（tensors) of variable length in dimension 0。这与数据集返回的样本类似。

import torch
from torch.utils.data import Dataset
from torch.utils.data.sampler import RandomSampler

class ToyDataset(Dataset):
    def __init__(self, tensors):
        self.tensors = tensors

    def __getitem__(self, index):
        return self.tensors[index]

    def __len__(self):
        return len(tensors)

其次，我们定义一个自定义数据加载器。创建数据集和数据加载器的常见 Pytorch 二分法大致如下：dataset，您可以向其传递索引，它会从数据集中返回关联的样本。有一个sampler产生一个索引，有不同的策略来绘制索引，从而产生不同的采样器。采样器由batch_sampler一次绘制多个索引（与batch_size指定的数量相同）。有一个dataloader它结合了采样器和数据集，让您可以迭代数据集，重要的是数据加载器还拥有一个函数（collate_fn），它指定如何组合使用来自batch_sampler的索引从数据集中检索的多个样本。对于您的用例，通常的 PyTorch 二分法效果不佳，因为我们需要绘制索引，直到与索引关联的对象超过我们期望的累积大小，而不是绘制固定数量的索引。这意味着我们需要立即检查对象并使用这些知识来决定是否返回批次或保留绘图索引。这就是下面的自定义数据加载器的作用：

class CustomLoader(object):

    def __init__(self, dataset, my_bsz, drop_last=True):
        self.ds = dataset
        self.my_bsz = my_bsz
        self.drop_last = drop_last
        self.sampler = RandomSampler(dataset)

    def __iter__(self):
        batch = torch.Tensor()
        for idx in self.sampler:
            batch = torch.cat([batch, self.ds[idx]])
            while batch.size(0) >= self.my_bsz:
                if batch.size(0) == self.my_bsz:
                    yield batch
                    batch = torch.Tensor()
                else:
                    return_batch, batch = batch.split([self.my_bsz,batch.size(0)-self.my_bsz])
                    yield return_batch
        if batch.size(0) > 0 and not self.drop_last:
            yield batch

在这里，我们迭代数据集，在绘制索引并加载关联对象后，我们将其连接到我们之前绘制的张量（batch）。我们继续这样做，直到达到所需的尺寸，这样我们就可以切割并生产一批。我们保留行batch，我们没有屈服。因为可能会出现单个实例超过所需的batch_size的情况，所以我们使用while loop.

您可以修改这个最小CustomDataloader以 PyTorch 数据加载器的风格添加更多功能。也不需要使用 RandomSampler 来绘制索引，其他的也同样可以工作。如果您的数据很大，通过使用列表并跟踪其张量的累积长度，也可以避免重复的连接。

这是一个示例，演示了它的工作原理：

patch_size = 5
channels = 3
dim0sizes = torch.LongTensor(100).random_(1, 100)
data = torch.randn(size=(dim0sizes.sum(), channels, patch_size, patch_size))
tensors = torch.split(data, list(dim0sizes))

ds = ToyDataset(tensors)
dl = CustomLoader(ds, my_bsz=250, drop_last=False)
for i in dl:
    print(i.size(0))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用可变批量大小加载数据？的相关文章

ValueError：超出整数字符串转换的限制（4300）

gt gt gt import sys gt gt gt sys set int max str digits 4300 Illustrative this is the default gt gt gt int 2 5432 Traceb
softmax_cross_entropy_with_logits 的 PyTorch 等效项

我想知道 TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy with logits TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy
如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM
带圆角的 Seaborn 条形图

我正在尝试绘制一些条形图但想控制角的圆度我尝试按照堆栈问题中提供的答案进行操作Matplotlib 中带圆角的条形图 https stackoverflow com questions 58425392 bar chart with r
安装 gstreamer 对 opencv python 包的支持

我已经从源代码构建了自己的 opencv python 包 import cv2 print cv2 version 打印 3 4 5 现在我面临的问题是关于 opencv 的 VideoCapture 类中的 gstreamer 的使用
如何在日志中查看MySqlHook结果

我在用MySqlHook建立连接气流数据库并且我正在执行一些查询但我需要在某处查看查询的结果比如说日志我怎样才能看到这是示例代码 t1 MySqlOperator task id basic mysql mysql conn id
Pipenv-Error：ModuleNotFoundError：没有名为“pip._internal”的模块[重复]

这个问题在这里已经有答案了今天我通过安装了 Pipenv pip install pipenv 正如文档中提到的我进入测试目录并使用创建了一个新的虚拟环境 pipenv shell 并尝试通过安装包 pipenv install nu
地图与星图的性能？

我试图对两个序列进行纯Python 没有外部依赖逐元素比较我的第一个解决方案是 list map operator eq seq1 seq2 然后我发现starmap函数来自itertools 这看起来和我很相似但事实证明在最坏的情
urllib.error.URLError:

Python 3 4 2 当我在脚本中运行 urllib request urlopen url 时出现了一个奇怪的错误如果我直接在 Python 解释器中运行它它可以正常工作但当我通过 bash shell Linux 在脚本内运
如何在 Visual Studio 代码中的奇点/docker 图像中使用 python 解释器

我希望能够在 Visual Studio 代码的奇点图像中使用 python 解释器似乎将 VSCODE 指向 python 解释器的所有选项都涉及直接路径但在图像中使用 python 需要一个命令 singularity exec p
在 while 循环中更改 tkinter 画布中的图像

我的完整代码是here https gist github com ItsBerry de245ba70376cb07f4dbe2d25c223f5f 我正在尝试使用 tkinter 的画布创建一个小游戏让人们练习学习高音谱号上的音符最
为什么开始按钮不执行计数器功能

from tkinter import import tkinter as tk 创建计数器 def a def counter label label counter 0 def count global counter counter
Matlab：掩码/创建一个知道其原点且具有一定半径的圆形 roi

只是一个简单的问题我有一张图像并且提取了某个点特征我知道每个帧中该点的坐标说 x1 和 y1 我需要一个圆形 ROI 形式该点在图像上具有我选择的半径我尝试了 impoly 和 roipoly 当我知道图像中的要点时不知道如
仅打印字符串中的元音

我是Python新手我正在尝试打印字符串中的所有元音因此如果有人输入嘿一切都好吗所有元音都需要打印但我不知道怎么做所以这不是计算元音而是打印元音现在我已经得到了这个 sentence input Enter your s
将 Python 3 的“范围”“向后移植”到 Python 2 是一个坏主意吗？

我的一门课程要求用 Python 完成作业作为练习我一直使用如下脚本确保我的程序可以在 Python 2 和 Python 3 中运行 bin bash Run some PyUnit tests python2 test py pyt
如何在Python的Try/Catch块中捕获所有异常？

我正在编写 python 代码来在 linux 环境中安装我的程序所需的所有库包因此 linux 可能包含 python 2 7 或 2 6 或两者都包含所以我开发了一个 try and except 块代码将在 linux 中安装
Matplotlib 在 Ubuntu 18.04 上引发 MemoryError，但在 Windows 10 上则不会

我正在 Ubuntu 机器上为 Windows 用户开发软件它能做什么对数千张图像进行物体检测并将结果与一些测量数据进行比较示波器数据 200MB 5000 万个数据值最后绘制并保存结果在此步骤之后程序将前进到下一个数据集
python 3+ 的缓冲函数

我试图使用 vtk show 打开一个 vtk 窗口但是每次我这样做时我的 Ipython 控制台都会崩溃显然这是因为 Ipython 无法显示外部窗口而这正是 vtk show 所做的我在谷歌上搜索了一个解决方案但它是为 py
为什么 pip 已经是最新的了却要求我升级？

我全新安装了 python 3 7 1 64 位并使用最新的 pyCharm 作为我的 IDE 我在这台机器上没有安装其他 python 我去安装 numpy 并收到以下消息 venv C Users John PycharmProjec
为什么当循环数变大时，设置的打印值会被排序？

它是python 3 8 当输入10时打印是随机的但是当输入900时打印的顺序与 print sorted s 相同 import random s set for i in range int input loop nums n v

随机推荐

是否可以告诉自动映射器在运行时忽略映射？

我正在使用 Entity Framework 6 和 Automapper 将实体映射到 dtos 我有这个型号 public class PersonDto public int Id get set public string Name
MathJax 方程换行

嘿如果包含的元素具有固定大小有谁知道让 MathJax 自动换行方程的好方法 MathJax v2 0 现在包括针对长显示方程的自动可选换行它是由linebreaks的部分HTML CSS您的配置块请参阅MathJax 文档 h
在 TypeScript 中解构对象时重命名剩余属性变量

EDIT 我在github上开了一个与此相关的问题 https github com Microsoft TypeScript issues 21265 https github com Microsoft TypeScript issue
PostgreSQL 从 9.1 升级到 9.4 后性能下降

将 Postgres 9 1 升级到 9 4 后我的性能变得非常慢下面是两个查询的示例它们的运行速度明显慢得多注意我意识到这些查询可能可以被重写以更有效地工作但是我主要担心的是升级到较新版本的 Postgres 后它们的运行速
差异化包装

升级应用程序时 Test ServiceFabricApplicationPackage命令会对版本号未更改的每个代码包抛出错误这表示内容已更改即使代码未更改我知道有一个功能可以创建部分包但我无法使用它我的问题是如何检查代码包内
如何在其他工作表的应用程序脚本中请求或获得谷歌电子表格访问权限？

我正在为我的自定义函数编写 A 电子表格的应用程序脚本并尝试使用从那里获取 B 电子表格中的值openUrl 然而我得到了ERROR当我使用自定义函数时在电子表格中在谷歌文档中它说如果您的自定义函数抛出错误消息 You do no
使用powershell在其他域上查找“网络用户”？

我想做的是 net user user1 DOMAIN 但是我想为计算机未加入但可以访问的域执行此操作用户分布在 DOMAIN1 和 DOMAIN2 中我运行它的计算机已加入 DOMAIN1 但会在 DOMAIN2 上查找用户这可以
在 mongodb 的嵌套数组中插入数据[重复]

这个问题在这里已经有答案了可能的重复 MongoDB 更新嵌套数组中的字段 https stackoverflow com questions 9611833 mongodb updating fields in nested array
Safari 中的垂直居中

我在 Safari 中使用 margin auto 0 时遇到垂直居中问题在嵌套在带有 display inline flex 的 div 内的 div 上它在 Firefox Chrome Opera 中工作得很好但在 Safari
Travis CI 失败，因为无法接受许可证约束布局

在我写这个问题之前我已经搜索过同样的问题他们确实有导出许可证因为仍然使用 alpha 版本的约束布局但现在android已经发布了约束布局的稳定版本我尝试了很多设置但仍然失败我最新的 travis yml language an
Django - 显示图像字段

我刚刚开始使用 Django 还没有找到很多关于如何显示的信息imageField 所以我做了这个模型 py class Car models Model name models CharField max length 255 pric
如何判断闭合路径是否包含给定点？

在 Android 中我有一个 Path 对象我碰巧知道它定义了一条闭合路径并且我需要弄清楚给定点是否包含在路径中我所希望的是类似的东西路径 contains int x int y 但这似乎不存在我寻找这个的具体原因是因为我在
如何使用 signalr 将 json 对象发送到 .net 服务器

我正在开发一个 Angular 应用程序我必须使用 netcore 服务器和 signalR 将数据从角度形式发送到外部服务器我可以使用信号集线器在 Angular 客户端和控制器之间建立连接但我很困惑如何将 json 对象从客户端发
在 bash 中选择不同的可执行文件

当我想跑步的时候make为了生成一些可执行文件它总是使用 Sunmake位于在 usr local bin make而不是 GNU make 可以在以下位置找到 usr sfw bin gmake 我如何告诉操作系统使用 GNU mak
TkInter：了解解除绑定功能

TkInter 是否unbind http effbot org tkinterbook widget htm Tkinter Widget unbind method函数阻止应用它的小部件将更多事件绑定到小部件澄清假设我在程序的早期将
Python 中以下代码有什么问题？

我试图对一个字段实施约束但它不会导致约束验证而是允许保存记录而不显示任何约束消息 def check contact number self cr uid ids context None for rec in self browse
在 AOSP Android 6.0 上更新 WebView

我正在开发基于 AOSP Android 6 0 Marshmallow 的设备我想将标准 Android webview 更新到最新版本以使用最新的 JavaScript 为此我更换了external chromium webview
使 JButton 在 JTable 内可单击

这是我想做的事情的屏幕截图发生的情况是 JButton 显示正确但当我单击它时没有任何反应经过一番搜索我发现Object由返回table getValueAt 是一个字符串而不是 JButton 这是代码 tblResult new
是否有“纯粹适用的任一”的标准名称或实现？

我经常发现我所谓的纯粹应用性的用处Either i e Either与Applicative只要我们不实现一个实例就可用Monad实例也是如此 newtype AEither e a AEither unAEither Either e
使用可变批量大小加载数据？

我目前正在研究基于补丁的超分辨率大多数论文将图像分割成更小的补丁然后使用这些补丁作为模型的输入我能够使用自定义数据加载器创建补丁代码如下 import torch utils data as data from torchvisio

使用可变批量大小加载数据？

使用可变批量大小加载数据？ 的相关文章

随机推荐

热门标签

使用可变批量大小加载数据？的相关文章