跟李沐学AI——动手学深度学习 PyTorch版——学习笔记pycharm版本（第四天——10、11、12、13、14）2023.3.1

2023-11-19

前言

这是沐神的第十节课。是讲多层感知机的，需要掌握牢固。以后会经常写的

代码讲解

跳过从零开始实现，直接进入简单代码的讲解

# 导入包
import torch
from torch import nn
from d2l import torch as d2l  # 这个包是沐神自己写的，里面的方法前面都有讲过

net = nn.Sequential(nn.Flatten(),  # 把图片展平，将输入数据展平，这里只保留第0维度
                    nn.Linear(784, 256),  # 第一层
                    nn.ReLU(),  # 激活
                    nn.Linear(256, 10))  # 第二层

def init_weights(m):  # 初始化参数
    if type(m) == nn.Linear:  # 如果是Liner则。。。。。（因为后面有的不是Liner）
        nn.init.normal_(m.weight, std=0.01)  # m.weight未初始化之前是0

net.apply(init_weights)   # 网络的每一层的权值都进行初始化

batch_size, lr, num_epochs = 256, 0.1, 10  # 一些超参数
loss = nn.CrossEntropyLoss(reduction='none') # 交叉熵损失函数
trainer = torch.optim.SGD(net.parameters(), lr=lr)  # 训练器，也就是优化器，选择随机梯度下降

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)  # 前面有讲过，是yeild小批量

d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)  # 开始训练
d2l.plt.show()  # 显示训练进程

在这里插入图片描述

第11课的内容

训练误差：模型在训练数据上的误差
泛化误差：模型在新数据上的误差

训练数据集：训练模型（比如平时做的习题）
验证数据集：验证模型好坏（比如平时的考试）
测试数据集：只用一次的数据集（比如高考）
K-则交叉验证：当数据集不大的时候使用
过拟合、欠拟合
在这里插入图片描述
数据复杂度：样本个数、每个样本的元素个数、时空结构、多样性

第12课的内容

正则化：限制w的权重，防止过拟拟合

第13课的内容

丢弃法：dropout

import torch
from torch import nn
from d2l import torch as d2l

def dropout_layer(X, dropout):
    assert 0 <= dropout <= 1  # assert:在不满足条件下，可以直接报错
    # 在本情况中，所有元素都被丢弃
    if dropout == 1:
        return torch.zeros_like(X)  # 像x的shape一样的都是0的元素
    # 在本情况中，所有元素都被保留
    if dropout == 0:
        return X
    mask = (torch.rand(X.shape) > dropout).float()
    return mask * X / (1.0 - dropout)  # 没有dropout的数据变大

num_inputs, num_outputs, num_hiddens1, num_hiddens2 = 784, 10, 256, 256

dropout1, dropout2 = 0.2, 0.5

class Net(nn.Module):
    def __init__(self, num_inputs, num_outputs, num_hiddens1, num_hiddens2,
                 is_training = True):
        super(Net, self).__init__()
        self.num_inputs = num_inputs
        self.training = is_training
        self.lin1 = nn.Linear(num_inputs, num_hiddens1)
        self.lin2 = nn.Linear(num_hiddens1, num_hiddens2)
        self.lin3 = nn.Linear(num_hiddens2, num_outputs)
        self.relu = nn.ReLU()

    def forward(self, X):
        H1 = self.relu(self.lin1(X.reshape((-1, self.num_inputs))))
        # 只有在训练模型时才使用dropout
        if self.training == True:
            # 在第一个全连接层之后添加一个dropout层
            H1 = dropout_layer(H1, dropout1)
        H2 = self.relu(self.lin2(H1))
        if self.training == True:
            # 在第二个全连接层之后添加一个dropout层
            H2 = dropout_layer(H2, dropout2)
        out = self.lin3(H2)
        return out


net = Net(num_inputs, num_outputs, num_hiddens1, num_hiddens2)

num_epochs, lr, batch_size = 10, 0.5, 256
loss = nn.CrossEntropyLoss(reduction='none')
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
trainer = torch.optim.SGD(net.parameters(), lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)
d2l.plt.show()

第14课的内容

数值稳定性
将每层的输出和梯度都看做随机变量，让他们的均值和方差保持一致

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

人工智能

Pytorch

跟李沐学AI——动手学深度学习 PyTorch版——学习笔记pycharm版本（第四天——10、11、12、13、14）2023.3.1 的相关文章

在 Pytorch 中执行优化时如何对变量应用界限？

我正在尝试使用 Pytorch 进行非凸优化试图最大化我的目标因此在 SGD 中最小化我想限制因变量 x gt 0 并且 x 值的总和小于 1000 我认为我已经以斜坡惩罚的形式正确实施了惩罚但我正在努力解决 x 变量的边界问题在
Pytorch 数据加载器：错误的文件描述符和 EOF > 0

问题描述在使用由自定义数据集制作的 Pytorch 数据加载器进行神经网络训练期间我遇到了奇怪的行为数据加载器设置为workers 4 pin memory False 大多数时候训练都顺利完成有时训练会随机停止并出现以下错误
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
二维数组的按行 numpy.isin [重复]

这个问题在这里已经有答案了我有两个数组 A np array 3 1 4 1 1 4 B np array 0 1 5 2 4 5 2 3 5 是否可以使用numpy isin二维数组按行排列我想检查一下是否A i j is in B
我可以使用逻辑索引或索引列表对张量进行切片吗？

我正在尝试使用列上的逻辑索引对 PyTorch 张量进行切片我想要与索引向量中的 1 值相对应的列切片和逻辑索引都是可能的但是它们可以一起吗如果是这样怎么办我的尝试不断抛出无用的错误类型错误使用 ByteTensor 类型的
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in

随机推荐

小白学协程笔记2-c语言实现协程-2021-2-10

文章目录前言一 c语言中协程切换方式二使用setjmp 和 longjmp实现协程切换 1 setjmp和longjmp函数简介 2 协程实现三使用switch case实现协程切换 1 switch case小技巧 2 协程实
SQL题目练习---三表联查

一数据库中有三张如下所示的表学生表教师表成绩表查出橘右京老师的学生所有分数按照成绩倒序排列分析 1 本质是一个三表联查问题 SQL语句为 select from A inner join 表B on 表A 列1 表B 列2 i
【小程序】封装弹出框+选择器组件：选择器选择

效果用的库 usingComponents van popup vant weapp popup index van cell vant weapp cell index van cell group vant weapp cell gr
算法训练营第六天（7.17）

目录 unordered map LeeCode242 Valid Anagram 梦的开始 LeeCode1 Two Sum unordered set LeeCode349 Intersection of Two Arrays LeeC
$state, $stateParams 传递参数?

附图 state方法 go reload get state属性 current params state事件 stateChangeError stateChangeStart stateChangeSuccess stateNotFou
App\led\led.h(6): warning: #1295-D: Deprecated declaration LED_Init - give arg types

如图所示操作即可如图所示操作即可如图所示操作即可
【机器学习】十大算法之一 “朴素贝叶斯”

作者主页爱笑的男孩的博客 CSDN博客深度学习活动 python领域博主爱笑的男孩擅长深度学习活动 python 等方面的知识爱笑的男孩关注算法 python 计算机视觉图像处理深度学习 pytorch 神经网络 ope
Ubuntu openKylin 安装open VMware tool 工具

修改source添加 cat etc apt sources list deb http archive build openkylin top openkylin yangtze main cross pty deb http archi
Oracle19c配置OGG进行单用户数据同步测试

目录 19c单实例配置GoldenGate 并进行用户数据同步测试一数据库操作 1 开启数据库附加日志 2 开启数据库归档模式 3 开启goldengate同步 4 创建goldengate管理用户 5 集成捕获所需权限授权 6 创建测
java判断指定路径文件夹是否存在,若不存在则创建新的文件夹,存在则删除

isFile 判断是否是文件也许可能是文件或者目录 exists 判断是否存在可能不存在两个不一样的概念 isDirectory 是检查一个对象是否是文件夹返回值是boolean类型的如果是则返回true 否则返回false 调
DGA域名可以是色情网站域名

恶意域名指传播蠕虫病毒和特洛伊木马或是进行诈骗色情内容传播等不法行为的网站域名恶意域名指传播蠕虫病毒和特洛伊木马或是进行诈骗色情内容传播等不法行为的网站域名本文面临能够的挑战就是恶意网站经营者所使用的各种技术近年来 FFSN
git lfs原理和使用

如果我们用git管理的项目中出现了一些大文件同时若其数量比较多而且更新又比较频繁那么当首次clone该项目时就会不可避免地将这些大文件的当前版本和历史所有版本的文件都下载下来虽然你很可能用不到这些历史文件但是却不得不为它们所占用
一般数据库服务器物理机配置,ironic部署物理机

原标题 ironic部署物理机 ironic是openstack的帐篷项目之一主要用来部署和管理裸机提供统一接口方便nova同时管理裸机和虚机 ironic的概念架构图如图1所示本文以tecs3 0为例介绍ironic部署裸机的流
border之border-style用法

border style border style 属性用于设置元素所有边框的样式或者单独地为各边设置边框样式 border style兼容性很好基本所有浏览器都兼容 border style拥有一下属性值值描述 none 定义无边
【RuoYi-Vue-Plus】问题笔记 02 - Knife4j

文章目录前言问题一文档页面空白问题二文档参数无法显示问题原因解决方案前言今天遇到一个很 sao 不得常一见匹的问题所以必须要把这部血泪史记录一下注因为是开发中的项目所以适当打码不影响问题描述首先描述
STM32入门——uKeil5 MDK 的使用（基于固件库）

文章目录 1 Keil uVision5 MDK 是什么 2 建立一个标准库函数工程 2 1 前期准备 2 2 建立工程 2 3 建立组文件夹 2 4 添加文件 2 4 配置魔术棒选项卡 2 5 建立 main 函数 1 Keil uV
scala 学习笔记

Scala Scala 和 java 关系语言特点 Scala是一门以Java虚拟机 JVM 为运行环境并将面向对象和函数式编程的最佳特性结合在一起的静态类型编程语言静态语言需要提前编译的如 Java c c 等动态语言如 js Sc
吴昊品游戏核心算法 Round 10 —— 吴昊教你下围棋（利用递归来解决吃子的问题）...

如图所示此即为日本动漫棋魂中的千年佐为也就是SAI 众所周知围棋的规则相比于中国象棋国际象棋等等都简单许多真是因为更简单的规则才诞生了更复杂的逻辑目前的围棋AI还很不行最NB的应该是日本人做出的后又经过众多中国的围棋爱好者
STM32使用HAL库，整体结构和函数原理介绍

按照杨桃电子的说法学习编程程序就是学习使用外设然后需要在icode文件夹中创建对应的 c和 h文件分三步来操作 1 学会编写板级驱动程序 2 学会在板级驱动程序中调用HAL库中的功能函数 3 学会在main 主函数中调用板级驱动程序
跟李沐学AI——动手学深度学习 PyTorch版——学习笔记pycharm版本（第四天——10、11、12、13、14）2023.3.1

前言这是沐神的第十节课是讲多层感知机的需要掌握牢固以后会经常写的代码讲解跳过从零开始实现直接进入简单代码的讲解导入包 import torch from torch import nn from d2l import tor