Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配

2023-12-15

自十一月以来我一直在自学这一点，任何对此的帮助都将非常感激，谢谢您的关注，因为我似乎在兜圈子。我正在尝试使用与 Mnist 数据集一起使用的 Pytorch CNN 示例。现在我正在尝试修改CNN以进行面部关键点识别。我使用的 Kaggle 数据集 (CSV) 包含 7048 个训练图像和关键点（每张脸 15 个关键点）和 1783 个测试图像。我分割训练数据集并将图像转换为 jpeg，为关键点（形状 15、2）制作单独的文件。我已经制作了数据集和数据加载器，可以迭代并显示图像并绘制关键点。当我运行 CNN 时，我收到此错误。

> Net(
  (conv1): Conv2d(1, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
  (conv2): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
  (conv2_drop): Dropout2d(p=0.5)
  (fc1): Linear(in_features=589824, out_features=100, bias=True)
  (fc2): Linear(in_features=100, out_features=30, bias=True)
)
Data and target shape:  torch.Size([64, 96, 96])   torch.Size([64, 15, 2])
Data and target shape:  torch.Size([64, 1, 96, 96])   torch.Size([64, 15, 2])

Traceback (most recent call last):
  File "/home/keith/PycharmProjects/FacialLandMarks/WorkOut.py", line 416, in <module>
    main()
  File "/home/keith/PycharmProjects/FacialLandMarks/WorkOut.py", line 412, in main
    train(args, model, device, train_loader, optimizer, epoch)
  File "/home/keith/PycharmProjects/FacialLandMarks/WorkOut.py", line 324, in train
    loss = F.nll_loss(output, target)
  File "/home/keith/Desktop/PycharmProjects/fkp/FacialLandMarks/lib/python3.6/site-packages/torch/nn/functional.py", line 1788, in nll_loss
    .format(input.size(0), target.size(0)))
ValueError: Expected input batch_size (4) to match target batch_size (64).

Process finished with exit code 1

这是我读过的一些链接，我无法找出问题所在但可能会帮助别人。

https://github.com/pytorch/pytorch/issues/11762 如何修改此 PyTorch 卷积神经网络以接受 64 x 64 图像并正确输出预测？pytorch-卷积神经网络-接受-a-64-x-64-imPytorch 验证模型错误：预期输入batch_size (3) 与目标batch_size (4) 匹配模型错误预期输入批量大小 3 与目标 ba 匹配

这是我的代码：

    class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=5, stride=1, padding=(2, 2))
        self.conv2 = nn.Conv2d(32, 64, kernel_size=5, stride=1, padding=(2, 2))
        self.conv2_drop = nn.Dropout2d()
        self.fc1 = nn.Linear(64 * 96 * 96, 100)
        self.fc2 = nn.Linear(100, 30)  # 30 is x and y key points

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, 64 * 96 * 96)
        # x = x.view(x.size(0), -1)
        # x = x.view(x.size()[0], 30, -1)
        x = F.relu(self.fc1(x))
        x = F.dropout(x, training=self.training)
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)


def train(args, model, device, train_loader, optimizer, epoch):
    model.train()
    for batch_idx, batch in enumerate(train_loader):
        data = batch['image']
        target = batch['key_points']
        print('Data and target shape: ', data.shape, ' ', target.shape)
        data, target = data.to(device), target.to(device)
        optimizer.zero_grad()
        data = data.unsqueeze(1).float()

        print('Data and target shape: ', data.shape, ' ', target.shape)

        output = model(data)
        loss = F.nll_loss(output, target)
        loss.backward()
        optimizer.step()
        if batch_idx % args.log_interval == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                100. * batch_idx / len(train_loader), loss.item()))


# def test(args, model, device, test_loader):
#     model.eval()
#     test_loss = 0
#     correct = 0
#     with torch.no_grad():
#         for data, target in test_loader:
#             data, target = data.to(device), target.to(device)
#             output = model(data)
#             test_loss += F.nll_loss(output, target, reduction='sum').item() # sum up batch loss
#             pred = output.max(1, keepdim=True)[1] # get the index of the max log-probability
#             correct += pred.eq(target.view_as(pred)).sum().item()
#
#     test_loss /= len(test_loader.dataset)
#     print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
#         test_loss, correct, len(test_loader.dataset),
#         100. * correct / len(test_loader.dataset)))



def main():
    # Training settings
    parser = argparse.ArgumentParser(description='Project')
    parser.add_argument('--batch-size', type=int, default=64, metavar='N',
                        help='input batch size for training (default: 64)')
    parser.add_argument('--test-batch-size', type=int, default=1000, metavar='N',
                        help='input batch size for testing (default: 1000)')
    parser.add_argument('--epochs', type=int, default=10, metavar='N',   # ========  epoch
                        help='number of epochs to train (default: 10)')
    parser.add_argument('--lr', type=float, default=0.01, metavar='LR',
                        help='learning rate (default: 0.01)')
    parser.add_argument('--momentum', type=float, default=0.5, metavar='M',
                        help='SGD momentum (default: 0.5)')
    parser.add_argument('--no-cuda', action='store_true', default=False,
                        help='disables CUDA training')
    parser.add_argument('--seed', type=int, default=1, metavar='S',
                        help='random seed (default: 1)')
    parser.add_argument('--log-interval', type=int, default=10, metavar='N',
                        help='how many batches to wait before logging training status')
    args = parser.parse_args()
    use_cuda = not args.no_cuda and torch.cuda.is_available()

    torch.manual_seed(args.seed)

    device = torch.device("cuda" if use_cuda else "cpu")

    kwargs = {'num_workers': 1, 'pin_memory': True} if use_cuda else {}
    train_data_set = FaceKeyPointDataSet(csv_file='faces/Kep_points_and_id.csv',
                                         root_dir='faces/',
                                         transform=transforms.Compose([
                                             # Rescale(96),
                                             ToTensor()
                                         ]))

    train_loader = DataLoader(train_data_set, batch_size=args.batch_size,
                              shuffle=True)

    print('Number of samples: ', len(train_data_set))
    print('Number of train_loader: ', len(train_loader))

    model = Net().to(device)
    print(model)
    optimizer = optim.SGD(model.parameters(), lr=args.lr, momentum=args.momentum)

    for epoch in range(1, args.epochs + 1):
        train(args, model, device, train_loader, optimizer, epoch)
        # test(args, model, device, test_loader)

if __name__ == '__main__':
    main()

要了解出了什么问题，您可以在前进的每一步之后打印形状：

# Input data
torch.Size([64, 1, 96, 96])
x = F.relu(F.max_pool2d(self.conv1(x), 2))
torch.Size([64, 32, 48, 48])
x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
torch.Size([64, 64, 24, 24])
x = x.view(-1, 64 * 96 * 96)
torch.Size([4, 589824])
x = F.relu(self.fc1(x))
torch.Size([4, 100])
x = F.dropout(x, training=self.training)
torch.Size([4, 100])
x = self.fc2(x)
torch.Size([4, 30])
return F.log_softmax(x, dim=1)    
torch.Size([4, 30])

Your maxpool2d层减少了特征图的高度和宽度。
“观点”应该是x = x.view(-1, 64 * 24 * 24)
第一个线性层的大小：self.fc1 = nn.Linear(64 * 24 * 24, 100)

这会给你的output = model(data)最终形状为torch.Size([64, 30])

但这段代码在计算负对数似然损失时仍然会面临一个问题：

输入预计包含每个班级的分数。输入必须是大小为（小批量，C）的 2D 张量。该标准期望一个类索引（0 到 C-1）作为大小为 1D 张量的每个值的目标小批量

其中类索引只是标签：

代表一个类的值。例如：

0 - 0 级、1 - 1 级、

由于最后一个 nn 层输出超过 30 个类别的 softmax，我假设这是您想要分类的输出类别，所以目标的转换：

target = target.view(64, -1) # gives 64X30 ie, 30 values per channel
loss = F.nll_loss(x, torch.max(t, 1)[1]) # takes max amongst the 30 values as class label

这是当目标是超过 30 个类别的概率分布时，如果不是，可以在此之前进行 soft-max。因此，30 个值中的最大值将代表最高概率 - 因此该类正是您的输出所代表的，因此您可以计算两个值之间的 nll。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配的相关文章

tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
sklearn DeprecationWarning 数组的真值

从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Python grpc protobuf 存根生成问题：--grpc_out: protoc-gen-grpc: 插件失败，状态代码 1

正如问题所说我从源代码编译了 grpc 并且也做了sudo pip install grpcio 但是那which grpc python plugin不返回任何内容这是一个问题因为route guide的grpc python示例
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
使用 Pymongo 从 Windows 连接到 AWS 实例上的 MongoDB

此行反复抛出错误 client MongoClient ec2 12 345 67 89 us east 2 compute amazonaws com 27017 ssl True ssl keyfile C mongo pem 由于显而
Flask 中的 import 和 extends 有什么区别？

我正在阅读 Flask Web 开发在例4 3中 extends base html import bootstrap wtf html as wtf 我想知道 extends 和 import 有什么区别我认为它们在用法上很相似在什
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
在python中安装scipy模块时出错

我正在尝试使用 pip 在 python 中安装 scipy 模块它显示以下错误 Command c users sony appdata local programs python python35 32 python exe u c
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词

随机推荐

使用 C++11 的 CUDA 6.0 的 CMake 脚本

我正在为我的 CUDA 6 0 Boost 1 55 0 OpenCV 2 4 9 项目开发 64 位 Mac OSX 10 9 使用 makefile 进行编译但由于我最终将在 64 位 Windows 8 1 上测试它我想我熟悉
Delphi中使用SetupDiGetClassDevs进行串口枚举

我正在尝试枚举 COM 端口的友好名称当 USB 串行设备在运行时连接和断开时端口可能会动态变化基于中描述的可能方法这个问题我正在尝试使用 SetupDiGetClassDevs 方法 I found 这个示例代码但它是为旧版本
X.509 安全 Web 服务的 Java 客户端

我有使用 X 509 证书保护的远程 Web 服务我生成了 Web 服务客户端内容使用 jax ws 但需要配置 if 以用于证书的使用我应该如何进行我想我应该在本地受信任的密钥库中注册证书他们设置如下 System setPro
利用浏览器缓存第 3 方 JS

我已经在我的 httpd conf 上设置了 Expiry ExpiresActive On ExpiresDefault access plus 1 month ExpiresByType image gif access plus 1
使用WITH时语法中出现SQL错误[重复]

这个问题在这里已经有答案了我想使用带有WITH 子句的SQL 查询但出现语法错误我正在使用 MySQL 版本 5 6 28 这是一个简单的代码示例 WITH alias test AS SELECT id title FROM tip
自定义字体显示在 iOS 模拟器上，但不显示在 Storyboard 上

我的自定义字体在模拟器上运行时工作正常但是有什么方法可以在我工作时在故事板本身中查看自定义字体吗我的文本与默认字体的大小不匹配所以我有继续编译和运行代码并通过一遍又一遍的尝试和错误来确定正确的大小我看到了一些关于此的问题但它只是
如何读取webhooks发送的数据？

我有最新的 woocommerce 插件并且必须为我的 URL 之一设置一个 webhook 但我无法在 REQUEST 中读取它也无法在 input file get contents php input webhookContent
如何获取当前光标作为Texture2D Unity C#

我有一个问题我想获取当前光标并将其作为Unity中的texture2D获取当我说当前光标时我的意思是用户当前拥有的光标例如如果用户将光标更改为猫我希望在 Unity 中拥有相同的猫光标这就是为什么我不只是在线搜索默认光标的原
java.lang.ClassCastException：com.sun.xml.bind.v2.runtime.JAXBContextImpl 无法转换为 com.sun.xml.bind.api.JAXBRIContext

我创建了一个 jaxws Web 服务我完全遵循了url 服务非常完美没有任何错误但是当请求命中时服务器出现错误 SEVERE caught throwable java lang ClassCastException com sun
如何让子进程在父进程退出后终止？

假设我有一个进程恰好生成一个子进程现在当父进程由于某种原因退出时正常或异常通过kill C 断言失败或其他任何原因我希望子进程终止如何正确地做到这一点 stackoverflow 上的一些类似问题之前问过当父进程退出时如何
进行文件上传并转到另一个PHP页面

所以我有 4 页它们很简单 index php 有效
如何在android 2.1中比较系统日期和mydate？

在我的 Android 应用程序中我从数据库中获取日期和时间但我无法将日期格式的日期从数据库获取到我的应用程序中日期为字符串格式因此我无法将系统日期与数据库日期进行比较如果我将系统日期转换为字符串那么我无法在重复的情况下将日
平滑凹凸不平的圆

我正在检测圆形物体的边缘并获得凹凸不平的不规则边缘是否可以平滑边缘以使形状更均匀例如在下面的代码中我生成了一个凹凸不平的圆圈左是否有一种平滑或移动平均函数可以用来获得或近似平滑圆右最好使用某种参数我可以控制因
如何扫描 LAN 网络中的设备

我想在 LAN 网络中进行扫描以查找链接的设备我正在 IOS 中为 IPAD 开发一个应用程序我该怎么做因为这些是移动设备所以我假设您想要在无线网络上查找设备理论上由于 wifi 使用共享介质进行通信因此您可以被动侦听流经网络
使用 bash 迭代文件（和目录）名称

我试图编写一个 bash 脚本来计算本地目录的文件数和目录数这是我的第一次尝试 bin bash files 0 dir 0 for file in ls do if d file then dir dir 1 else files fi
应用程序必须遵循 iOS 数据存储指南，/documents 中没有任何内容，但仍有一些 kb 发送到 iCloud

我的应用程序因以下原因被拒绝您的应用程序未按要求遵循 iOS 数据存储指南根据应用程序商店审查指南您的应用程序将 4 0 MB 的数据备份到每个用户的 iCloud 空间发射请务必为所有设置不备份属性非由用户生成或修改的数据
如何从闭包内部调用实例方法？

我正在尝试访问 a 中的实例方法map调用不幸的是我对实例对象的引用被重新定义为 Window 我不确定如何获取我的实例方法 class Test constructor an array gt f gt an array map val
.htaccess 301 将一个子域重定向到另一个子域，用于多个 TLD

我想更改我网站的子域并希望使我对 301 用户使用的 RewriteRules 更加简单因为目前我必须有多个规则来涵盖各种可能性有没有一种方法可以通过一条规则来执行以下操作 subold domain com gt subnew do
根据范围选择更改流程图数据数组的最佳方法是什么？

我正在使用 AngularJSflot and slider要显示一些图表并根据范围选择数据可视化应该在流程图中发生变化我的问题是根据范围选择可视化数据的最佳方法是什么我是否需要在每次选择范围时添加删除图表数据或者是否有更好的方
Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配

自十一月以来我一直在自学这一点任何对此的帮助都将非常感激谢谢您的关注因为我似乎在兜圈子我正在尝试使用与 Mnist 数据集一起使用的 Pytorch CNN 示例现在我正在尝试修改CNN以进行面部关键点识别我使用的 Kaggle

Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配

Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配 的相关文章

随机推荐

热门标签

Pytorch CNN 错误：预期输入batch_size (4) 与目标batch_size (64) 匹配的相关文章