在图像批次中随机打乱补丁

2024-06-25

我正在尝试创建一个transform打乱批次中每个图像的补丁。我的目标是以与其他转换相同的方式使用它torchvision:

trans = transforms.Compose([
            transforms.CenterCrop(224),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]),
            ShufflePatches(patch_size=(16,16)) # our new transform
        ])

更具体地说，输入是BxCxHxW张量。我想将批次中的每个图像分割成大小为 patch_size 的不重叠的补丁，将它们打乱，然后重新组合成单个图像。

给定图像（大小224x224):

Using ShufflePatches(patch_size=(112,112))我想生成输出图像：

我认为解决方案与torch.unfold and torch.fold，但没能取得进一步的进展。

任何帮助，将不胜感激！

Indeed unfold and fold https://stackoverflow.com/a/53972525/1714410在这种情况下似乎合适。

import torch
import torch.nn.functional as nnf

class ShufflePatches(object):
  def __init__(self, patch_size):
    self.ps = patch_size

  def __call__(self, x):
    # divide the batch of images into non-overlapping patches
    u = nnf.unfold(x, kernel_size=self.ps, stride=self.ps, padding=0)
    # permute the patches of each image in the batch
    pu = torch.cat([b_[:, torch.randperm(b_.shape[-1])][None,...] for b_ in u], dim=0)
    # fold the permuted patches back together
    f = nnf.fold(pu, x.shape[-2:], kernel_size=self.ps, stride=self.ps, padding=0)
    return f

Here's an example with patch size=16:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

deeplearning

ComputerVision

Pytorch

torchvision

在图像批次中随机打乱补丁的相关文章

Django：NoReverseMatch at /'myapp'不是注册的命名空间

我在模板渲染期间遇到此错误我想做的是允许用户上传 csv 然后将数据处理到模型中第 109 行出错 myapp 不是已注册的命名空间这是我的第 109 行代码
使用不带引号的块样式的 Python YAML 转储

如何使用 PyYAML 加载和转储 YAML 以便它尽可能地使用原始样式我有 Python 来加载和转储 YAML 数据例如 import sys import yaml def represent dictorder self dat
如何在redis中使用python删除排序集中的项目

如何使用 python 删除排序集中大于某个值的项目 key foo pipe redis master conn pipeline pipe zadd key 1 a pipe zadd key 2 b pipe zadd key 3 c
如何将 typeshed 与 mypy 一起使用？

我克隆了typeshed https github com python typeshed但我不知道如何告诉 mypy 使用它包含的类型提示我在 mypy help 中没有看到任何选项 mypy 存储库确实包含对 typeshed 存储库
Django表单中的隐藏字段不在cleaned_data中

我有这个表格 class CollaboratorForm forms Form user forms CharField label Username max length 100 canvas forms IntegerField wi
我如何知道Python的unicode函数识别的所有支持的编码

Python 有一个unicode将字节流转换为 unicode 字符串的内置函数我只是希望我能查询所有可用的encoding在我的系统上但如何这个问题的原因是有人使用 MAC OS X 向我发送了一封内容编码为 iso 2022
并行执行按位运算的代码

我有这段代码通过将该 AU 矩阵的每个字节 8 个元素打包到 A 中来减少内存消耗从而使 100k 200k 矩阵占用更少的空间正如您所期望的这段代码需要永远运行我也计划将行数增加到 200k 我正在一个非常强大的实例 CPU 和
映射 2 个数据帧并替换目标数据帧中匹配值的标头

我有一个数据框 df1 SAP Name SAP Class SAP Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2 Name Fi Class Avi 5 Rison 6 Slesh
为什么 scikit-learn SVM.SVC() 非常慢？

我尝试使用SVM分类器来训练大约10万个样本的数据但我发现它非常慢甚至两个小时后也没有任何反应当数据集有大约 1k 个样本时我可以立即得到结果我还尝试了 SGDClassifier 和朴素贝叶斯速度相当快几分钟内就得到了结果
使用 pytherejs 嵌入小部件：错误的视角和相机观察

我在用pythreejs可视化一些 3D 模型在 Jupyter 笔记本上可视化模型时一切都按预期进行但是当尝试将小部件嵌入 HTML 文档时我面临两个问题看起来相机在加载时正在查看 0 0 0 而不是预期的那样一旦您与小部件交
Plotly：如何在堆叠条形图顶部显示值的总和以及各个条形值？

我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
如何在 Google App Engine (Python) 中定义配置变量/常量？

我是 python GAE 的新手想知道如何快速定义和使用全局设置变量所以说你 git 克隆我的 GAE 应用程序然后打开config yaml 添加更改设置应用程序就全部连接起来如下所示 config yaml or whate
在Python中将月份和年份的列合并为季度和年份的列

我有一个数据框 df Month 1 8 Year 2015 2020 df pd DataFrame data df df 想要将其转变为新列期望的输出 df Month 1 8 Year 2015 2020 Quarter Q1201
识别文本中的多个类别和相关情感

如果您有一个文本语料库如何识别所有类别来自预定义类别列表以及与之相关的情绪正面负面写作我将在 Python 中执行此操作但现阶段我不一定要寻找特定于语言的解决方案让我们用一个例子来看看这个问题试图澄清我的问题如果我有一整
如何循环遍历列表中除最后一项之外的所有项？ [复制]

这个问题在这里已经有答案了 Using a for循环如何循环遍历列表中除最后一项之外的所有项我想遍历一个列表检查每个项目与后面的项目我可以在不使用索引的情况下做到这一点吗 for x in y 1 If y是一个生成器那么上面的
Spacy-nightly (spacy 2.0) 问题“thinc.extra.MaxViolation 大小错误”

显然成功安装了 spacy nightly spacy nightly 2 0 0a14 和英语模型 en core web sm 后我在尝试运行它时仍然收到错误消息 import spacy nlp spacy load en core
如何使用 opencv python 根据检测到的物体的位置生成其热图

我需要根据对象的位置生成其热图示例视频帧中检测到的绿色球如果它长时间停留在某个位置那么该位置应该是红色的并且球在短时间内经过的帧中的位置必须是蓝色的这样我就需要生成热图提前致谢那么你在这里可以做的是 1 首先定义一个热图作为
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
为什么变量 1 += 变量 2 比变量 1 = 变量 1 + 变量 2 快得多？

我继承了一些 Python 代码用于创建巨大的表最多 19 列宽 5000 行花了九秒用于在屏幕上绘制表格我注意到每一行都是使用以下代码添加的 sTable sTable n GetRow where sTable是一个字符串我将
VSCode IntelliSense 认为 Python 'function()' 类存在

VSCode IntelliSense 正在完成一个名为的 Python 类function 这似乎不存在例如这似乎是有效的代码 def foo value return function value foo 0 But functio

随机推荐

创建 DOMElement Objective C 的位图

我有一个 Webkit DOMElement 例如一个 div 现在我想要它的渲染 NSImage 或 NSBitmapImageRep 它就像 DOMElement 的屏幕截图公共 API 选择 NSView cacheDisplayI
使 PXButton 显示为铅笔图标

我想在我的页面上放置一个按钮允许重定向到自定义处理页面但该按钮必须是铅笔图标例如在控件上使用AllowEdit True 时我有以下 asp net
Java BigDecimal 区别

我想看看是否有人可以解释为什么以下代码适用于 valueOf 而不适用于其他代码 import java math BigDecimal public class Change public static void main String
XCode 4.2 停止界面生成器自动缩放

每当我更改所选控件时有什么方法可以阻止 XCode 4 中的 IB 缩放以尝试填充屏幕尝试在 1440x900 笔记本电脑屏幕上开发 iPad 故事板让我抓狂这使得在屏幕上放置大块几乎是不可能的有谁知道一些隐藏的偏好迫使 XCode
如何在 matplotlib 中对齐刻度标签？

我正在尝试使用 matplotlib 构建信息图并且想要左对齐所有 y 轴的刻度标签我想将所有刻度标签移至左侧我希望它们都从与以下相同的 x 位置开始District of Columbia 我尝试使用Axes set ytickla
python中的有效年份函数

这是 udacity com 网络开发课程他们要求编写一个有效年份的程序 1900 年到 2020 年之间的任何年份都是有效年份现在当我提交以下代码时它给出了此错误不正确您的提交未返回输入 1920 的正确结果您的提交通过了
如何从异步调用返回响应？

如何从函数返回响应结果foo发出异步请求我试图从回调中返回值并将结果分配给函数内的局部变量并返回该变量但这些方法都没有实际返回响应它们都返回undefined或者无论变量的初始值如何result is 接受回调的异步函数示例使用
测试内联表单集清理方法

我有一个 Django 项目有 2 个模型一个Structure and Bracket 括号具有结构的外键即一对多一个结构有多个括号我创建了一个TabularInline对于管理站点这样结构上就会有一个括号表我添加了一个自定
下面的 C 程序的输出是什么？ [复制]

这个问题在这里已经有答案了 char getString char str Will I be printed return str int main printf s getString getchar 输出不应该是我会被打印吗相反
RcppEigen 包“#pragma clang Diagnostic pop”警告

我在尝试使用时遇到一些问题RcppEigen包裹我使用了发布的示例here http gallery rcpp org articles eigen eigenvalues 该函数有效但 R 生成了一系列类似的警告示例如下 In fi
C++中return语句后可以执行代码吗？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我是一名java程序员刚刚接触C
Ember.js 中按钮的绑定启用状态

我刚刚开始接触 Ember js 但我遇到了一些我确信我不理解的东西我有一个选定的对象控制器它有一个 Ember Object 内容即当前选择的模型该模型有一个属性 isDirty 基本上我希望仅当对象脏且需要保存时才启用表单上的保
是否可以在 UITabBarController 内显示 SFSafariViewController？

我要加载SFSafariViewController位于选项卡内部因此选项卡栏位于整个 Safari 视图的底部这可能吗我尝试了这个但没有运气 self tabBarController presentViewController s
jsp ${pageContext.request.contextPath} 未收到请求

目前我有一个 jsp 项目其中我的欢迎页面是一个 servlet
Django X-CSRFToken 已设置但仍然收到 403 禁止

我开发了一个 Django 文件上传 API 它接收来自客户端的发布数据并将数据保存为文件根据Django CSRF 手册 https docs djangoproject com en 1 8 ref csrf HTTP 请求标头应使用
HTTP 缓存的授权检查

我有如下列出的 Web API 方法用于REST服务这是为了获取库存审核员的所有用户信息只有授权的 Inventory Auditor 用户才能访问此资源 RoutePrefix api users public class User
为 REST Spring HATEOAS 控制器定义资源组装器

我正在尝试将 HATEOAS 链接添加到由 Spring REST 控制器提供服务的 JSON 资源我发现我应该使用资源汇编器如下所述https github com spring projects spring hateoas htt
是否可以复制 Azure 网站？

我想将现有的共享模式开发网站复制到另一个测试共享模式网站这可能吗我知道可以使用 T SQL 命令通过 SQL Azure DB 来完成此操作此刻我 1 创建新网站 2 跨 Dev Azure 网站的 FTP 来测试 Az
posix 和 linux 特定函数的 C++ 包装器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案您知道有什么好的库将 posix 和 linux 函数和结构例如套接字或文件描述符包装到 C 类中
在图像批次中随机打乱补丁

我正在尝试创建一个transform打乱批次中每个图像的补丁我的目标是以与其他转换相同的方式使用它torchvision trans transforms Compose transforms CenterCrop 224 transfo

在图像批次中随机打乱补丁

在图像批次中随机打乱补丁 的相关文章

随机推荐

热门标签

在图像批次中随机打乱补丁的相关文章