如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？

2024-03-06

我已经从 MNIST 数据集中下载了一些示例图像.jpg格式。现在我正在加载这些图像来测试我的预训练模型。

# transforms to apply to the data
trans = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])

# MNIST dataset
test_dataset = dataset.ImageFolder(root=DATA_PATH, transform=trans)

# Data loader
test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

Here DATA_PATH包含一个带有示例图像的子文件夹。

这是我的网络定义

# Convolutional neural network (two convolutional layers)
class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.network2D = nn.Sequential(
           nn.Conv2d(1, 32, kernel_size=5, stride=1, padding=2),
           nn.ReLU(),
           nn.MaxPool2d(kernel_size=2, stride=2),
           nn.Conv2d(32, 64, kernel_size=5, stride=1, padding=2),
           nn.ReLU(),
           nn.MaxPool2d(kernel_size=2, stride=2))
        self.network1D = nn.Sequential(
           nn.Dropout(),
           nn.Linear(7 * 7 * 64, 1000),
           nn.Linear(1000, 10))

    def forward(self, x):
        out = self.network2D(x)
        out = out.reshape(out.size(0), -1)
        out = self.network1D(out)
        return out

这是我的推理部分

# Test the model
model = torch.load("mnist_weights_5.pth.tar")
model.eval()

for images, labels in test_loader:
   outputs = model(images.cuda())

当我运行此代码时，出现以下错误：

RuntimeError: Given groups=1, weight of size [32, 1, 5, 5], expected input[1, 3, 28, 28] to have 1 channels, but got 3 channels instead

据我所知，图像以 3 通道 (RGB) 的形式加载。那么我如何将它们转换为单通道dataloader?

更新：我变了transforms包括Grayscale option

trans = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,)), transforms.Grayscale(num_output_channels=1)])

但现在我得到这个错误

TypeError: img should be PIL Image. Got <class 'torch.Tensor'>

使用时ImageFolder类并且没有自定义加载器，pytorch 使用 PIL 加载图像并将其转换为 RGB。如果 torchvision 图像后端是 PIL，则默认加载器：

def pil_loader(path):
    with open(path, 'rb') as f:
        img = Image.open(f)
        return img.convert('RGB')

您可以使用torchvision 的灰度变换中的函数。它将 3 通道 RGB 图像转换为 1 通道灰度图像。了解更多相关信息，请访问here https://pytorch.org/docs/stable/torchvision/transforms.html#torchvision.transforms.Grayscale

示例代码如下，

import torchvision as tv
import numpy as np
import torch.utils.data as data
dataDir         = 'D:\\general\\ML_DL\\datasets\\CIFAR'
trainTransform  = tv.transforms.Compose([tv.transforms.Grayscale(num_output_channels=1),
                                    tv.transforms.ToTensor(), 
                                    tv.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
trainSet        = tv.datasets.CIFAR10(dataDir, train=True, download=False, transform=trainTransform)
dataloader      = data.DataLoader(trainSet, batch_size=1, shuffle=False, num_workers=0)
images, labels  = iter(dataloader).next()
print (images.size())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？的相关文章

使用 Flask-restful RequestParser 进行嵌套验证

使用烧瓶宁静 http flask restful readthedocs org 微框架我在构建一个RequestParser这将验证嵌套资源假设预期的 JSON 资源格式为 a list obj1 1 obj2 2 obj3 3 o
Python lambda 函数没有在 for 循环中正确调用[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 中的 Tkinter 制作一个计算器我使用 for 循环来绘制按钮并且尝试使用 lambda 函数以便仅在按下按钮时调用按钮的操作而不是在程序启动时立即调用然而当我尝试这
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
是否可以将名为“None”的值添加到枚举类型？

我可以将名为 None 的值添加到枚举中吗例如 from enum import Enum class Color Enum None 0 represent no color at all red 1 green 2 blue 3 co
MySQL 的 read_sql() 非常慢

我将 MySQL 与 pandas 和 sqlalchemy 一起使用然而它的速度非常慢对于一个包含 1100 万行的表一个简单的查询需要 11 分钟以上才能完成哪些行动可以改善这种表现提到的表没有主键并且仅由一列索引 fro
如何在代码中停止 autopep8 未安装消息

我是一名新的 Python 程序员使用 Mac 版本的 VS Code 1 45 1 创建 Django 项目我安装了 Python 和 Django 扩展每次我保存 Django 文件时代码都会弹出此窗口 Formatter au
通过 pyodbc 连接到 Azure SQL 数据库

我使用 pyodbc 连接到本地 SQL 数据库该数据库工作正常 SQLSERVERLOCAL Driver SQL Server Native Client 11 0 Server localdb v11 0 integrated se
python中的语音识别持续时间设置问题

我有一个 Wav 格式的音频文件我想转录我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
导入错误：无法导入名称 urandom

我正在构建一个新的 Linux 环境并在 Python 上看到以下错误 python c import random Traceback most recent call last File
__subclasses__ 没有显示任何内容

我正在实现一个从适当的子类返回对象的函数如果我搬家SubClass from base py 没有出现子类 subclasses 它们必须在同一个文件中吗也许我从来没有直接导入subclass py对Python隐藏子类我能做些什么
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
NumPy 数组不可 JSON 序列化

创建 NumPy 数组并将其保存为 Django 上下文变量后加载网页时收到以下错误 array 0 239 479 717 952 1192 1432 1667 dtype int64 is not JSON serializable
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
如何克服 numpy.unique 的 MemoryError

我正在使用 Numpy 版本 1 11 1 并且必须处理一个二维数组 my arr shape 25000 25000 所有值都是整数我需要一个唯一的数组值列表使用时lst np unique my arr 我正进入状态 Traceb
使用 JSON 可序列化枚举自动生成棉花糖模式

创建与我的模型相同的棉花糖模式的日子已经一去不复返了我发现这个优秀的答案 https stackoverflow com a 42892443 4097322这解释了我如何使用简单的装饰器从 SQA 模型自动生成模式因此我实现了它并替换
是否可以使用 Python 中的密码安全地加密然后解密数据？

我在 python 程序中有一些数据我想在使用密码写入文件之前对其进行加密然后在使用它之前读取并解密它我正在寻找一些可以根据密码进行加密和解密的安全对称算法这个问题 https stackoverflow com questions
使用 boto3 将 csv 文件保存到 s3

我正在尝试写入 CSV 文件并将其保存到 s3 中的特定文件夹存在这是我的代码 from io import BytesIO import pandas as pd import boto3 s3 boto3 resource s3 d
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
应用程序的外观 - Py2exe / wxPython

所以我的问题是我的应用程序的外观和感觉因为它看起来像一个旧的外观应用程序它是一个 wxPython 应用程序在 python 上它运行良好并且看起来不错但是当我使用 py2exe 将其转换为 exe 时外观很糟糕现在我知道如果你
用于获取有关 SVN 存储库信息的 Python 库？

我正在寻找一个可以从 SVN 存储库中提取至少以下信息的库 not工作副本修订号及其作者和提交消息每个修订版中的更改添加删除修改文件有Python库可以做到这一点吗对于作者和提交消息我可以解析 db revprops 0

随机推荐

有没有办法用反射“覆盖”方法？

不使用继承而仅使用反射是否可以动态更改 C 中方法的代码就像是 nameSpaceA Foo method1 aDelegate 我无法更改编辑 Foo 类 namespace nameSpaceA class Foo private
如何在 php 中查找、增加和替换？

我有以下形式的字符串 d d 我想在第二个数字上加 1 既然我的解释已经很清楚了那我举几个例子 1234567 2 应变为 1234567 3 1234 10 应变为 1234 11 这是我的第一次尝试 new preg replace
en_US.UTF-8 语言环境的 Windows 等效项是什么？

如果我想在 Windows 上进行以下工作正确的区域设置是什么以及如何检测它是否实际存在这段代码是否通用或者只是我的系统 https stackoverflow com questions 4324385 does this code
为什么 free() 函数不将内存返回给操作系统？

当我在Linux上使用top终端程序时我看不到free的结果我的期望是免费地图和列表我可以在顶部看到内存使用情况 Linux 函数或 proc meminfo变得比过去小睡眠开始了程序退出但当程序结束时内存的使用量只会变
Grails 监视文件在 Vagrant 虚拟机内运行的 Docker 容器中不起作用

我有一个相当嵌套的结构 MacOSX 工作站运行 Vagrant VirtualBox 虚拟机ubuntu trusty64运行一个 Docker 容器正在运行我的应用程序是用 Grails 编写的每层都以共享上一层文件系统的一部分的方
如何使用 Redux Toolkit（使用 TypeScript）解决类型“AsyncThunkAction”中缺少属性“类型”的问题？

我正在使用 Redux Toolkit 和下面的 thunk slice 我认为我可以通过等待 thunk 承诺解决来在本地处理它们而不是在状态中设置错误使用此处提供的示例 https redux toolkit js org api
如何使用 content-security-policy 元标记允许混合内容（http 和 https）？

我强行https访问我的网站但某些内容必须加载过来http 例如视频内容不能通过https 但浏览器阻止请求因为mixed contents policy 经过几个小时的搜索我发现我可以使用内容安全策略但我不知道如何允许混合内容你不
Azure 子文件夹博客

我正在尝试弄清楚如何是否可以将博客添加到现有天蓝色网站上的子文件夹中 BlogEngine 似乎是一个不错的选择因为它是用 net 编写的而且根据我的阅读它很容易在 azure 上设置为独立站点我现在遇到的问题是如何将我的子文件夹
如何将 JSON 数据发送到 Action 方法？

我正在发布到服务器 Net 但在将数组传递到控制器操作时遇到问题我尝试了几乎所有可能的组合但没有运气然而其中有一个令我困惑如果我执行此请求 var dataArray some plain object another plain
创建 GridView 时“必须在与 DependencyObject 相同的线程上创建 DependencySource”

我的线程有问题当我想将 GridView 设置为 ListView 作为另一个线程中的视图时它会显示一条消息必须在与 DependencyObject 相同的线程上创建 DependencySource Create grid vie
序列化和反序列化 Django Enum 字段以接受数字和文本表示

我正在尝试创建一个枚举字段 https github com 5monkeys django enumfield在 Django 中在 GET 请求时将返回枚举的文本表示形式在 POST 或 PATCH 请求时将在保存之前将文本表示形式
如何使用比较器签名创建 NSSortDescriptor？

我可以创建一个不区分大小写的字符串排序描述符如下所示 let titleSort NSSortDescriptor key title ascending true selector selector NSString localized
如何在 ASP.net Core WebAPI 中启用 CORS

我正在尝试做什么我有一个托管在 Azure 免费计划上的后端 ASP Net Core Web API 在 Net Core中添加默认安全标头 https github com killerrin Portfolio Backend 我还
是否有返回当前项目名称的 git 命令？

git 是否有内置命令用于显示当前远程项目的名称现在我正在使用这个 git remote v head n1 awk print 2 sed s sed s git 但似乎会有一个内置的等效项我一直在寻找相同的信息来自定义我的 shel
SPARQL递归祖先查询

我被 SPARQL 中的递归查询困住了我无法理解它我想获得一个实例的所有祖先 a a hasParent b b hasParent c c hasParent d 所以结果将是 b c and d 如果实例是 a 有什么想法如何构造父
表存储（模拟器）插入失败，并显示“请求输入之一无效”。

我有一个导入过程它从旧源获取数据并将其放入表存储中这使我可以重新初始化表存储并根据需要重新开始它在更新到 10 月份的 Azure SDK for NET VS2012 之前就可以正常工作现在插入一些实体后它会失败似乎有所不同
如何从 lxml 错误中获取更多信息？

因为我无法使用 XSL IDE 所以我使用 lxml 编写了一个超级简单的 Python 脚本通过给定的 XSL 转换来转换给定的 XML 文件并将结果写入文件如下有删节 p XMLParser huge tree True xml
页面属性中的 AEM 页面图像不应用 sling:resourceType

使用 Adob e Experience Manager 5 6 1 AEM 以前称为 CQ5 我尝试创建一个类似于页面属性中的图像选项卡的新选项卡它将被命名为标志我基本上只是复制图像选项卡来创建徽标选项卡并重命名路径以反映
有没有办法以编程方式将值保存到 web.config appSettings 而不破坏注释和格式？

此代码可以工作但它会破坏 Web config 中的注释和格式有没有一种方法可以写入 Web config 且不会破坏格式 var webConfig WebConfigurationManager OpenWebConfigurati
如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？

我已经从 MNIST 数据集中下载了一些示例图像 jpg格式现在我正在加载这些图像来测试我的预训练模型 transforms to apply to the data trans transforms Compose transforms

如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？

如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？ 的相关文章

随机推荐

热门标签

如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？的相关文章