李宏毅深度学习作业3 CNN

2023-11-14

在这里插入图片描述

通过CNN卷积神经网络对食物图片进行分类
在这里插入图片描述
训练集与验证集中图片格式为 ‘[类别]_[编号].jpg’

#Import 需要的套件
import os
import numpy as np
import cv2
import torch
import torch.nn as nn
import torchvision.transforms as transforms
import pandas as pd
from torch.utils.data import DataLoader, Dataset
import time

#Read image 利用 OpenCV (cv2) 讀入照片並存放在 numpy array 中
#label是一个布尔变量，代表需不需要回传y值
def readfile(path, label):
# label 是一個 boolean variable，代表需不需要回傳 y 值
image_dir = sorted(os.listdir(path))
# 先创建数组
# 图像大小为128X128，有RGB三个通道
x = np.zeros((len(image_dir), 128, 128, 3), dtype=np.uint8)
#y是标签
y = np.zeros((len(image_dir)), dtype=np.uint8)
for i, file in enumerate(image_dir):
img = cv2.imread(os.path.join(path, file))
#更改尺寸到128*128
x[i, :, :] = cv2.resize(img,(128, 128))
#将label读入y中
if label:
# 训练集图像命名方式为"类别该类第几张图片.jpg
# 这里是从图片名称中取出其类别
y[i] = int(file.split("")[0])
if label:
return x, y
else:
return x
调用函数读取
#分別將 training set、validation set、testing set 用 readfile 函式讀進來
workspace_dir = ‘./food-11’
print(“Reading data”)
train_x, train_y = readfile(os.path.join(workspace_dir, “training”), True)
print(“Size of training data = {}”.format(len(train_x)))
val_x, val_y = readfile(os.path.join(workspace_dir, “validation”), True)
print(“Size of validation data = {}”.format(len(val_x)))
test_x = readfile(os.path.join(workspace_dir, “testing”), False)
print(“Size of Testing data = {}”.format(len(test_x)))

Out:
Reading data
Size of training data = 9866
Size of validation data = 3430
Size of Testing data = 3347

Dataset
在 Pytorch 中，我們可以利用 torch.utils.data 的 Dataset 及 DataLoader 來"包裝" data，使後續的 training 及 testing 更為方便。
Dataset 需要 overload 兩個函數：len 及 getitem
len 必須要回傳 dataset 的大小，而 getitem 則定義了當程式利用 [ ] 取值時，dataset 應該要怎麼回傳資料。
實際上我們並不會直接使用到這兩個函數，但是使用 DataLoader 在 enumerate Dataset 時會使用到，沒有實做的話會在程式運行階段出現 error。
这里还对图片进行了数据增强。transforms表示对图片的预处理方式。、

#training 时，通过随机旋转、水平翻转图片来进行数据增强（data augmentation）
train_transform = transforms.Compose([
transforms.ToPILImage(),
transforms.RandomHorizontalFlip(), #隨機將圖片水平翻轉
transforms.RandomRotation(15), #隨機旋轉圖片
transforms.ToTensor(), #將圖片轉成 Tensor，並把數值normalize到[0,1](data normalization)
])
#testing 時不需做 data augmentation
test_transform = transforms.Compose([
transforms.ToPILImage(),
transforms.ToTensor(),
])
class ImgDataset(Dataset):
def init(self, x, y=None, transform=None):
self.x = x
# label 需要是 LongTensor 型
self.y = y
if y is not None:
self.y = torch.LongTensor(y)
self.transform = transform
def len(self):
return len(self.x)
def getitem(self, index):
X = self.x[index]
if self.transform is not None:
X = self.transform(X)
if self.y is not None:
Y = self.y[index]
return X, Y
else:
return X

batch_size = 128
train_set = ImgDataset(train_x, train_y, train_transform)
val_set = ImgDataset(val_x, val_y, test_transform)
train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True)
val_loader = DataLoader(val_set, batch_size=batch_size, shuffle=False)

定义模型
先是一个卷积神经网络，再是一个全连接的前向传播神经网络。

卷积神经网络的一级卷积层由卷积层cov+批标准化batchnorm+激活函数ReLU+最大池化MaxPool构成。

class Classifier(nn.Module):
def init(self):
super(Classifier, self).init()
#torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)
#torch.nn.MaxPool2d(kernel_size, stride, padding)
#input 維度 [3, 128, 128]
self.cnn = nn.Sequential(
nn.Conv2d(3, 64, 3, 1, 1),
#彩色图片为红绿蓝三个通道，有64个不同的核，不同的核可以提取不一样的特征，一个核输出一个通道，所以做完一次卷积之后有64个通道，核大小3*3，步长 1，周边填充0的长度为1

[64, 128, 128]

        nn.BatchNorm2d(64),
        nn.ReLU(),
        nn.MaxPool2d(2, 2, 0),      # [64, 64, 64]

#做完一次卷积之后，图片大小为128128，通道为64（输出通道数都是可以设置的）；池化之后图片大小为6464
nn.Conv2d(64, 128, 3, 1, 1), # [128, 64, 64]
nn.BatchNorm2d(128),
nn.ReLU(),
nn.MaxPool2d(2, 2, 0), # [128, 32, 32]
#做完二次卷积之后，图片大小为6464，通道为128；池化之后图片大小为3232
nn.Conv2d(128, 256, 3, 1, 1), # [256, 32, 32]
nn.BatchNorm2d(256),
nn.ReLU(),
nn.MaxPool2d(2, 2, 0), # [256, 16, 16]
#做完三卷积之后，图片大小为3232，通道为256；池化之后图片大小为1616
nn.Conv2d(256, 512, 3, 1, 1), # [512, 16, 16]
nn.BatchNorm2d(512),
nn.ReLU(),
nn.MaxPool2d(2, 2, 0), # [512, 8, 8]
#做完四卷积之后，图片大小为1616，通道为512；池化之后图片大小为88
nn.Conv2d(512, 512, 3, 1, 1), # [512, 8, 8]
nn.BatchNorm2d(512),
nn.ReLU(),
nn.MaxPool2d(2, 2, 0), # [512, 4, 4]
)
#做完五卷积之后，图片大小为88，通道为512；池化之后图片大小为44
self.fc = nn.Sequential(
nn.Linear(51244, 1024),
nn.ReLU(),
nn.Linear(1024, 512),
nn.ReLU(),
nn.Linear(512, 11)
)
#四次卷积之后图片大小为44，通道为512，flatten之后为512 4 * 4，送入全链接层。
#最后是11个分类
def forward(self, x):
out = self.cnn(x)
out = out.view(out.size()[0], -1)# 摊平成1维
return self.fc(out)

在train set 上训练，参考val set上的结果调参
train set和val set中的数据都有标签，我们先在train set上训练模型，并对比模型在train set和val set上预测的正确率。
如果模型在val set上的正确率不高，说明模型的泛化性能不好。
需要调整cnn的参数
使用训练集training set进行训练，并使用验证集validation set来选择最好的参数。
如果遇到out of memory的报错，应该调小上面的batch_size = 128。

model = Classifier().cuda() #用cuda加速
loss = nn.CrossEntropyLoss() # 因為是 classification task，所以 loss 使用 CrossEntropyLoss
optimizer = torch.optim.Adam(model.parameters(), lr=0.001) # optimizer 使用 Adam
num_epoch = 30 #迭代次数

for epoch in range(num_epoch):
epoch_start_time = time.time()
train_acc = 0.0
train_loss = 0.0
val_acc = 0.0
val_loss = 0.0

model.train() # 確保 model 是在 train model (開啟 Dropout 等...)
for i, data in enumerate(train_loader):
    optimizer.zero_grad() # 用 optimizer 將 model 參數的 gradient 歸零
    train_pred = model(data[0].cuda()) # 利用 model 得到預測的機率分佈 這邊實際上就是去呼叫 model 的 forward 函數
    batch_loss = loss(train_pred, data[1].cuda()) # 計算 loss （注意 prediction 跟 label 必須同時在 CPU 或是 GPU 上）
    batch_loss.backward() # 利用 back propagation 算出每個參數的 gradient
    optimizer.step() # 以 optimizer 用 gradient 更新參數值

    train_acc += np.sum(np.argmax(train_pred.cpu().data.numpy(), axis=1) == data[1].numpy())
    train_loss += batch_loss.item()
 #验证集val
model.eval()
with torch.no_grad():
    for i, data in enumerate(val_loader):
        val_pred = model(data[0].cuda())
        batch_loss = loss(val_pred, data[1].cuda())

        val_acc += np.sum(np.argmax(val_pred.cpu().data.numpy(), axis=1) == data[1].numpy())
        val_loss += batch_loss.item()

    #將結果 print 出來
    print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f | Val Acc: %3.6f loss: %3.6f' % \
        (epoch + 1, num_epoch, time.time()-epoch_start_time, \
         train_acc/train_set.__len__(), train_loss/train_set.__len__(), val_acc/val_set.__len__(),val_loss/val_set.__len__()))

Out：
[001/030] 30.54 sec(s) Train Acc: 0.219542 Loss: 0.018593 | Val Acc: 0.223032 loss: 0.017266
[002/030] 30.32 sec(s) Train Acc: 0.323333 Loss: 0.015177 | Val Acc: 0.309621 loss: 0.015568
[003/030] 30.32 sec(s) Train Acc: 0.387188 Loss: 0.013808 | Val Acc: 0.377843 loss: 0.014594
[004/030] 30.36 sec(s) Train Acc: 0.443037 Loss: 0.012711 | Val Acc: 0.431778 loss: 0.012918
[005/030] 30.42 sec(s) Train Acc: 0.472431 Loss: 0.012017 | Val Acc: 0.211953 loss: 0.022984
[006/030] 30.44 sec(s) Train Acc: 0.502331 Loss: 0.011441 | Val Acc: 0.432945 loss: 0.013718
[007/030] 30.51 sec(s) Train Acc: 0.519562 Loss: 0.010774 | Val Acc: 0.358892 loss: 0.016559
[008/030] 30.51 sec(s) Train Acc: 0.550172 Loss: 0.010292 | Val Acc: 0.449271 loss: 0.013144
[009/030] 30.52 sec(s) Train Acc: 0.577336 Loss: 0.009582 | Val Acc: 0.427697 loss: 0.013619
[010/030] 30.57 sec(s) Train Acc: 0.597405 Loss: 0.009059 | Val Acc: 0.484548 loss: 0.012584
[011/030] 30.60 sec(s) Train Acc: 0.621224 Loss: 0.008519 | Val Acc: 0.505831 loss: 0.012606
[012/030] 30.59 sec(s) Train Acc: 0.647983 Loss: 0.007928 | Val Acc: 0.262974 loss: 0.028745
[013/030] 30.61 sec(s) Train Acc: 0.654875 Loss: 0.007988 | Val Acc: 0.560350 loss: 0.010429
[014/030] 30.62 sec(s) Train Acc: 0.667241 Loss: 0.007576 | Val Acc: 0.466472 loss: 0.013659
[015/030] 30.67 sec(s) Train Acc: 0.692581 Loss: 0.006917 | Val Acc: 0.568222 loss: 0.010538
[016/030] 30.69 sec(s) Train Acc: 0.701196 Loss: 0.006740 | Val Acc: 0.468805 loss: 0.014866
[017/030] 30.70 sec(s) Train Acc: 0.717920 Loss: 0.006458 | Val Acc: 0.495044 loss: 0.014071
[018/030] 30.70 sec(s) Train Acc: 0.733732 Loss: 0.006045 | Val Acc: 0.610787 loss: 0.009511
[019/030] 30.66 sec(s) Train Acc: 0.742347 Loss: 0.005843 | Val Acc: 0.611370 loss: 0.009757
[020/030] 30.65 sec(s) Train Acc: 0.741942 Loss: 0.005834 | Val Acc: 0.619534 loss: 0.009403
[021/030] 30.76 sec(s) Train Acc: 0.757653 Loss: 0.005436 | Val Acc: 0.648980 loss: 0.009385
[022/030] 30.75 sec(s) Train Acc: 0.777721 Loss: 0.005044 | Val Acc: 0.602915 loss: 0.010735
[023/030] 30.70 sec(s) Train Acc: 0.787046 Loss: 0.004846 | Val Acc: 0.633236 loss: 0.009841
[024/030] 30.67 sec(s) Train Acc: 0.785830 Loss: 0.004880 | Val Acc: 0.518950 loss: 0.014643
[025/030] 30.65 sec(s) Train Acc: 0.792621 Loss: 0.004609 | Val Acc: 0.644898 loss: 0.009813
[026/030] 30.71 sec(s) Train Acc: 0.816136 Loss: 0.004233 | Val Acc: 0.616327 loss: 0.011062
[027/030] 30.71 sec(s) Train Acc: 0.826373 Loss: 0.003974 | Val Acc: 0.593878 loss: 0.012730
[028/030] 30.66 sec(s) Train Acc: 0.819785 Loss: 0.004078 | Val Acc: 0.647813 loss: 0.009875
[029/030] 30.71 sec(s) Train Acc: 0.847456 Loss: 0.003512 | Val Acc: 0.596501 loss: 0.013376
[030/030] 30.64 sec(s) Train Acc: 0.849078 Loss: 0.003442 | Val Acc: 0.613703 loss: 0.010566
得到好的参数后，我们使用training set和validation set共同训练（数据量变多，模型效果更好）
在总的训练集上训练
在确保val set，train set上正确率都不错后
将两个训练集合为一个总的训练集
这里优化的就是权重w了

train_val_x = np.concatenate((train_x, val_x), axis=0) # 将train_x和val_x拼接起来
train_val_y = np.concatenate((train_y, val_y), axis=0)# 将train_y和val_y拼接起来
train_val_set = ImgDataset(train_val_x, train_val_y, train_transform)
train_val_loader = DataLoader(train_val_set, batch_size=batch_size, shuffle=True)

model_best = Classifier().cuda()# cuda加速
loss = nn.CrossEntropyLoss() # 因為是 classification task，所以 loss 使用 CrossEntropyLoss
optimizer = torch.optim.Adam(model_best.parameters(), lr=0.001) # optimizer 使用 Adam
num_epoch = 30

for epoch in range(num_epoch):
epoch_start_time = time.time()
train_acc = 0.0
train_loss = 0.0

model_best.train()
for i, data in enumerate(train_val_loader):
    optimizer.zero_grad()
    train_pred = model_best(data[0].cuda())
    batch_loss = loss(train_pred, data[1].cuda())
    batch_loss.backward()
    optimizer.step()

    train_acc += np.sum(np.argmax(train_pred.cpu().data.numpy(), axis=1) == data[1].numpy())
    train_loss += batch_loss.item()

    #將結果 print 出來
print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f' % \
  (epoch + 1, num_epoch, time.time()-epoch_start_time, \
  train_acc/train_val_set.__len__(), train_loss/train_val_set.__len__()))

Testing
利用剛剛 train 好的 model 進行 prediction
Pytorch中的 model.train() 和 model.eval() 模式

model.train() ：启用 BatchNormalization 和 Dropout
model.eval() ：不启用 BatchNormalization 和 Dropout

test_set = ImgDataset(test_x, transform=test_transform)
test_loader = DataLoader(test_set, batch_size=batch_size, shuffle=False)

model_best.eval()
prediction = []
with torch.no_grad():
for i, data in enumerate(test_loader):
test_pred = model_best(data.cuda())
test_label = np.argmax(test_pred.cpu().data.numpy(), axis=1)
for y in test_label:
prediction.append(y)

#將結果寫入 csv 檔
with open(“predict.csv”, ‘w’) as f:
f.write(‘Id,Category\n’)
for i, y in enumerate(prediction):
f.write(’{},{}\n’.format(i, y))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

李宏毅深度学习作业3 CNN 的相关文章

Netty聊天系统（1）通过自定义协议实现客户端与服务器端通信

1 自定义实现客户端与服务器端通信的协议 1 1 通信协议的设计自定义的通信协议需要哪些内容 1 魔数第一个字段一般是魔数一般固定的几个字节一个PNG图片的编码中有固定数量固定内容的字节用于表示这是一个PNG图片 Java的Cla
百度搜索抓取真实url

现在的百度搜索url都是加密的不是真实url 比如搜索豆瓣复制链接地址得到的url如下 https www baidu com link url vsdsl04PUGwYT udMGNDBSgQ4D62grmcfm8fM4LVjYLVV
vue初始化项目出现 npm ERR fatal unable to access ‘httpsgithub.comnhnraphael.git‘ OpenSSL SSL_read

vue初始化项目出现npm ERR fatal unable to access https github com nhn raphael git OpenSSL SSL read 错误解决方法没有安装预编译插件我的项目是用sass
GM（1,1）灰色预测模型——详细过程与python实现

文章目录前言一灰色模型的建模步骤及原理 1 灰色模型的基本概念 2 灰色模型的建模步骤二模型建立 1 确定原始数据 2 累加数列和邻均值等权数列 3 建立关于t 的白化形式一阶一元微分方程 GM 1 1 三模型求解 1 利用矩阵

随机推荐

Ubuntu的Firefox浏览器无法播放视频

一 flash插件 sudo apt get install flashplugin installer 二视频解码器由于 ubuntu restrcited extras 软件包在 multiverse 仓库中因此你应验证系统上已启
EClipse执行程序，提示：your project contains error(s),please fix them before running your application。

今天电脑重新安装了Eclipse系统 JDK ADT SDK 然后打开1年多前编辑好的工程项目结果总是会弹出错误框提示信息为 Your project contains error s please fix them before ru
RabbitMQ的持久化面试

交换机的持久化交换机的持久化其实就是相当于将交换机的属性在服务器内部保存当MQ的服务器发生意外或关闭之后重启RabbitMQ时不需要重新手动或执行代码去建立交换机交换机会自动建立相当于一直存在其是在声明交换器的时候将 dura
sklearn与分类算法

导读众所周知 Scikit learn 以前称为 scikits learn 是一个用于 Python 编程语言的免费软件机器学习库它具有各种分类回归和聚类算法包括支持向量机随机森林梯度增强 k means 和 DBSCAN 旨
Golang 数据结构 —— 字典

Golang 数据结构字典字典存储 key value 对 Go提供了非常方便的实现内置的map类型本文增强内置的map类型添加便捷的操作用于获取或改变其内容创建ItemDictionary泛型并发安全的能够生成任何具体类型
linux配置svn 版本管理之创建仓储和权限管理

1 安装 yum install subversion 2 配置 2 1 创建仓库我们这里在 home下建立一个名为svn的仓库 repository 以后所有代码都放在这个下面创建成功后在svn下面多了几个文件夹 root local
拉链表的设计与实现

一什么是拉链表针对订单表订单商品表流水表这些表中的数据是比较多的如果使用全量的方式会造成大量的数据冗余浪费磁盘空间所以这种表一般使用增量的方式每日采集新增的数据在这注意一点针对订单表如果单纯的按照订单产生时间增量
前台想后台传数组与解析

var info JSON stringify ids ajax type POST url url data ids info flowId flowId flowName flowName name name html html dat
多数据源的配置

一 yml的数据源配置配置两个数据源一个叫master主数据源一个是slave从数据源默认是主数据源从数据源需要做切换 datasource master driver class name com microsoft sqlser
2023年苹果IOS开发者证书申请（已实测准确）

一创建苹果开发者账号苹果开发者官网 https developer apple com 注册苹果账号apple id 开启双重认证需在一台IOS手机 iPad操作在App Store下载Apple Developer APP 进行注
怎么关闭csv的科学计数法

一问题背景身份证号码订单号这些都是很长的字符串在csv文件中经常以科学计数法出现要取消科学计数法二解决方案笔者的方案最终是以xls格式保存下来如果大家需要以csv文件格式保存那么笔者的解决方案是无效的而且有必要了解一点
外网SSH远程连接linux服务器，看这一篇就够了

文章目录视频教程 1 Linux CentOS安装cpolar 2 创建TCP隧道 3 随机地址公网远程连接 4 固定TCP地址 5 使用固定公网TCP地址SSH远程转载自内网穿透工具的文章无公网IP SSH远程连接Linux Cen
Django：四、Djiango如何连接使用MySQL数据库

一安装数据库第三方插件安装下载mysql第三方插件 pip install mysqlclient 二创建MySQL数据库 ORM可以帮助我们做两件事创建修改删除数据库中的表不用写SQL语句但无法创建数据库操作表中的数据
踩坑解决：web Server Traceback(most recent call last)builtins. Attributeerror: int object has no attribut

解决方法尝试将Twisted 版本重新安装成 18 9 0 卸载Twisted命令 pip uninstall Twisted 安装指定版本Twisted pip install Twisted 18 9
centos7 合并pdf命令

格式命令行要合并文件合并后的文件名 pdfunite pdf all pdf pdfunite 1 pdf 2 pdf all pdf
已解决ERROR: No matching distribution found for gradio==3.23

已解决stderr ERROR Could not find a version that satisfies the requirement gradio 3 23 ERROR No matching distribution found
C/C++就业方向与技能需求整理-实习篇

前言本文主要面向计算机类本科生同时想要寻求偏向C 相关的职业提供就业方向参考以及需要学习的技能以下资料来自牛客网更于 2022 4 1 网络研发实习生岗位职责 1 通过软件开发实现数据中心网络和骨干网络的管理和运维自动化确保网络
安装centos7报错：/dev/root does not exist 问题处理过程

最近自己做练习的一台实体机服务器硬盘坏了想着换了重新装一下结果就是碰壁折腾了好几天一直以为是写U盘的工具有问题报的错也是奇怪提示 dev root does not exist 并且前面出现n排同样的警告 Warning dra
用Java写一个公司员工管理系统!

用Java写一个公司员工管理系统今天看CSDN发现写管理系统的文章不少我在这里也给大家用java写一篇当然这里只是最简单的那种qwq 核心功能对员工各项信息的管理采用属性文件资源文件支持中文简体和英文目录第一步创建一个记
李宏毅深度学习作业3 CNN

通过CNN卷积神经网络对食物图片进行分类训练集与验证集中图片格式为类别编号 jpg Import 需要的套件 import os import numpy as np import cv2 import torch import to

李宏毅 深度学习作业3 CNN

[64, 128, 128]

李宏毅 深度学习作业3 CNN 的相关文章

随机推荐

热门标签

李宏毅深度学习作业3 CNN

李宏毅深度学习作业3 CNN 的相关文章