softmax回归

2023-11-12

softmax回归

线性回归不同，softmax回归的输出单元从⼀个变成了多个，且引⼊了softmax运算使输出更适合离散值的预测和训练
softmax回归跟线性回归⼀样将输⼊特征与权重做线性叠加。
它将logistic 激活函数推广到C类(C是神经网络模型的输出),而不仅仅是两类,是一种多分类器,如果C = 2,那么Softmax实际上变回了 logistic 回归。
与线性回归的⼀个主要不同在于，
softmax回归输入为向量
softmax回归的输出值个数等于标签⾥的类别数。
逻辑回归使用的是sigmoid函数，将w x + b \mathbf wx+bwx+b 的值映射到(0, 1)的区间，输出的结果为样本标签等于1的概率值；而softmax回归采用的是softmax函数，将w x + b \mathbf wx+bwx+b的值映射到[0, 1]的区间，输出的结果为一个向量，向量里的值为样本属于每个标签的概率值。

在这里插入图片描述

在这里插入图片描述

既然分类问题需要得到离散的预测输出，⼀个简单的办法是将输出值oi当作预测类别是i的置信度，并将值最⼤的输出所对应的类作为预测输出，即输出argmaxi oi。

在这里插入图片描述

数据形状不变

![在这里插入图片描述](https://img-blog.csdnimg.cn/1839f17d71724f798fdd2553cbac5cdb.png)
y = torch.tensor([0, 2])
y_hat = torch.tensor([[0.1, 0.3, 0.6], [0.3, 0.2, 0.5]])
y_hat[[0, 1], y]

y_hat[[0, 1], y] 通过下标取值

先读取数据

输入为向量

import torch
from IPython import display
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

因为我们的数据集有10个类别，所以网络输出维度为10。原始数据集中的每个样本都是(28 \times 28)的图像。在本节中，我们将展平每个图像，把它们看作长度为784的向量。因此，权重将构成一个(784 \times 10)的矩阵，偏置将构成一个(1 \times 10)的行向量。与线性回归一样，我们将使用正态分布初始化我们的权重W，偏置初始化为0。

num_inputs = 784
num_outputs = 10

W = torch.normal(0, 0.01, size=(num_inputs, num_outputs), requires_grad=True)
b = torch.zeros(num_outputs, requires_grad=True)

定义模型

注意，将数据传递到模型之前，我们使用reshape函数将每张原始图像展平为向量。下面的代码定义了输入如何通过网络映射到输出

def net(X):
    return softmax(torch.matmul(X.reshape((-1, W.shape[0])), W) + b)

W.shape[0] 向量长度
-1 :batchsize

定义损失函数

在这里插入图片描述

def cross_entropy(y_hat, y):
    return - torch.log(y_hat[range(len(y_hat)), y])

cross_entropy(y_hat, y)

range(len(y_hat) :长度为len(y_hat)的向量
y_hat[range(len(y_hat)), y] ：对应标号的预测值
y_hat ：预测值，2*3
y: 真实值，长为2的向量
cross_entropy(y_hat, y) ：长为2的向量

分类精度

当预测与标签分类y一致时，即是正确的。分类精度即正确预测数量与总预测数量之比。虽然直接优化精度可能很困难（因为精度的计算不可导），但精度通常是我们最关心的性能衡量标准，我们在训练分类器时几乎总会关注它。
如果y_hat是矩阵，那么假定第二个维度存储每个类的预测分数。我们使用argmax获得每行中最大元素的索引来获得预测类别。然后我们将预测类别与真实y元素进行比较。由于等式运算符“==”对数据类型很敏感，因此我们将y_hat的数据类型转换为与y的数据类型一致。结果是一个包含0（错）和1（对）的张量。最后，我们求和会得到正确预测的数量。

def accuracy(y_hat, y):  #@save
    """计算预测正确的数量"""
    if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:
        y_hat = y_hat.argmax(axis=1)
    cmp = y_hat.type(y.dtype) == y
    return float(cmp.type(y.dtype).sum())

y_hat:预测值
y:真实值
y_hat.argmax(axis=1) ：每一行中最大的值，预测分类的类别，我们使用argmax获得每行中最大元素的索引来获得预测类别
y_hat.type(y.dtype)：y_hat的数据类型转换为与y的数据类型一致
cmp.type(y.dtype)：转换为与y的数据类型一致
cmp.type(y.dtype).sum()：求和
float(cmp.type(y.dtype).sum())：转化为浮点数

accuracy(y_hat, y) / len(y)

类精度即正确预测数量与总预测数量之比

同样，对于任意数据迭代器data_iter可访问的数据集，我们可以评估在任意模型net的精度。

def evaluate_accuracy(net, data_iter):  #@save
    """计算在指定数据集上模型的精度"""
    if isinstance(net, torch.nn.Module):
        net.eval()  # 将模型设置为评估模式,不计算梯度
    metric = Accumulator(2)  # 正确预测数、预测总数，累加器
    with torch.no_grad():
        for X, y in data_iter:
            metric.add(accuracy(net(X), y), y.numel())
    return metric[0] / metric[1]

net(X) :预测值
accuracy(net(X), y) 预测正确的样本数
y.numel()：样本的总数
metric[0]：分类正确的样本数
metric[1]：总样本数

优化算法训练模型

def train_epoch_ch3(net, train_iter, loss, updater):  #@save
    """训练模型一个迭代周期（定义见第3章）"""
    # 将模型设置为训练模式
    if isinstance(net, torch.nn.Module):
        net.train()
    # 训练损失总和、训练准确度总和、样本数
    metric = Accumulator(3)
    for X, y in train_iter:
        # 计算梯度并更新参数
        y_hat = net(X)
        l = loss(y_hat, y)
        if isinstance(updater, torch.optim.Optimizer):
            # 使用PyTorch内置的优化器和损失函数
            updater.zero_grad()
            l.mean().backward()
            updater.step()
        else:
            # 使用定制的优化器和损失函数
            l.sum().backward()
            updater(X.shape[0])
        metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())
    # 返回训练损失和训练精度
    return metric[0] / metric[2], metric[1] / metric[2]

class Animator:  #@save
    """在动画中绘制数据"""
    def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,
                 ylim=None, xscale='linear', yscale='linear',
                 fmts=('-', 'm--', 'g-.', 'r:'), nrows=1, ncols=1,
                 figsize=(3.5, 2.5)):
        # 增量地绘制多条线
        if legend is None:
            legend = []
        d2l.use_svg_display()
        self.fig, self.axes = d2l.plt.subplots(nrows, ncols, figsize=figsize)
        if nrows * ncols == 1:
            self.axes = [self.axes, ]
        # 使用lambda函数捕获参数
        self.config_axes = lambda: d2l.set_axes(
            self.axes[0], xlabel, ylabel, xlim, ylim, xscale, yscale, legend)
        self.X, self.Y, self.fmts = None, None, fmts

    def add(self, x, y):
        # 向图表中添加多个数据点
        if not hasattr(y, "__len__"):
            y = [y]
        n = len(y)
        if not hasattr(x, "__len__"):
            x = [x] * n
        if not self.X:
            self.X = [[] for _ in range(n)]
        if not self.Y:
            self.Y = [[] for _ in range(n)]
        for i, (a, b) in enumerate(zip(x, y)):
            if a is not None and b is not None:
                self.X[i].append(a)
                self.Y[i].append(b)
        self.axes[0].cla()
        for x, y, fmt in zip(self.X, self.Y, self.fmts):
            self.axes[0].plot(x, y, fmt)
        self.config_axes()
        display.display(self.fig)
        display.clear_output(wait=True)

def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater):  #@save
    """训练模型（定义见第3章）"""
    animator = Animator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0.3, 0.9],
                        legend=['train loss', 'train acc', 'test acc'])
    for epoch in range(num_epochs):
        train_metrics = train_epoch_ch3(net, train_iter, loss, updater)
        test_acc = evaluate_accuracy(net, test_iter)
        animator.add(epoch + 1, train_metrics + (test_acc,))
    train_loss, train_acc = train_metrics
    assert train_loss < 0.5, train_loss
    assert train_acc <= 1 and train_acc > 0.7, train_acc
    assert test_acc <= 1 and test_acc > 0.7, test_acc

lr = 0.1

def updater(batch_size):
    return d2l.sgd([W, b], lr, batch_size)

num_epochs = 10
train_ch3(net, train_iter, test_iter, cross_entropy, num_epochs, updater)

Fashion-MNIST数据集，并设置数据迭代器的批量大小为256。

import torch
from IPython import display
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

num_inputs = 784
num_outputs = 10

W = torch.normal(0, 0.01, size=(num_inputs, num_outputs), requires_grad=True)
b = torch.zeros(num_outputs, requires_grad=True)

def net(X):
    return softmax(torch.matmul(X.reshape((-1, W.shape[0])), W) + b)

交叉熵采用真实标签的预测概率的负对数似然。
损失函数
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

softmax回归的相关文章

Windows 中的 Python 多处理池奇怪行为

Python 多处理池在 Linux 和 Windows 之间有不同的行为当按工作人员数量运行方法映射时在 Linux 中它会在您作为参数提供的特定函数的范围内运行该进程但在 Windows 中每个工作进程都在父进程的范围内运行
使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
TemplateSyntaxError：“settings_tags”不是有效的标签库

当我尝试运行此测试用例时出现此错误这是在我的 django 应用程序的tests py 中编写的 def test accounts register self self url http royalflag com pk accoun
如何进行重定向并保留查询字符串？

我想进行重定向并保留查询字符串就像是self redirect加上发送的查询参数那可能吗 newurl my new route urllib urlencode self request params self redirect ne
如何检查给定的数字是否是2的幂？

下面的代码不适用于某些输入 a i set 1 while i lt 10000 a add i i lt lt 1 N int input if N in a print True else print False 我最初的想法是检查每个
pandas DataFrame 中行的高效成对比较

我目前正在处理一个较小的数据集大约 900 万行不幸的是大多数条目都是字符串即使强制类别框架在内存中也只有几 GB 我想做的是将每一行与其他行进行比较并对内容进行直接比较例如给定 A B C D 0 cat blue old
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
如何使用 Python 在表单中选择选项？

我想知道如何以格式如下的形式选择选项 td align left td
Plotly：如何设置文本格式（下划线、粗体、斜体）

使用注释时我尝试在绘图中为文本添加下划线我使用添加注释 import plotly graph objects as go g go FigureWidget make subplots rows 1 cols 1 g update l
Python：处理图像并保存到文件流

我需要使用 python 处理图像应用过滤器和其他转换然后使用 HTTP 将其提供给用户现在我正在使用 BaseHTTPServer 和 PIL 问题是 PIL 无法直接写入文件流因此我必须写入临时文件然后读取该文件以便将其发
使用 Popen 打开进程并获取 PID

我正在开发一个漂亮的小功能 def startProcess name path Starts a process in the background and writes a PID file returns integer pid Ch
Pandas 根据条件替换数据框值

我有一个主数据框 df Colour Item Price Blue Car 40 Red Car 30 Green Truck 50 Green Bike 30 然后我有一个价格修正数据框 df pc Colour Item Price
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
从 SUDS 中的 SOAP 响应中提取 Cookie

我必须使用具有多种服务的 API 所有这些都需要来自下面的身份验证的 JSESSION cookie 然而当我调用下一个服务时它不会保留 cookie 因此会拒绝它们 from suds client import Client url
如何在 Jupyter Notebook 中选择 conda 环境

我安装了 Anaconda 5 3 和 Python 3 7 根环境之后我使用 Python 3 6 创建了一个新环境 py36 我激活了新环境activate py36 conda env list表明环境是活跃的但是当我启动 Jup
如何使用 QAbstractTableModel（模型/视图）将数据设置到 QComboBox？

我希望能够设置itemData of a combobox当使用填充时QAbstractTableModel 但是我只能从模型返回一个字符串data method 通常当不使用模型时可以像这样执行 Set text and data
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
如何将另一整列作为参数传递给 pandas fillna()

我想用另一列中的值填充一列中的缺失值使用fillna方法我读到循环遍历每一行将是非常糟糕的做法最好一次完成所有事情但我不知道如何使用fillna 之前的数据 Day Cat1 Cat2 1 cat mouse 2 dog eleph
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的
python：日志记录：我们可以向记录器添加多个过滤器吗？考虑哪一个

我试图了解 Python 日志记录中的多个过滤器一个在配置中定义另一个在代码中定义如何工作我正在开发一个 Django 项目下面是我在 settings py 中的记录器配置我的目标是switch on and switch o

随机推荐

chrome浏览器fitler中的XHR作用是什么

chrome浏览器fitler中的XHR作用是什么记录ajax中的请求什么是 AJAX AJAX 异步 JavaScript 和 XML AJAX 是一种用于创建快速动态网页的技术通过在后台与服务器进行少量数据交换 AJAX 可以使网
SpringBoot集成LayuiAdmin的简单使用

SpringBoot LayuiAdmin的简单使用分享一下SpringBoot集成LayuiAdmin的一些心得体会刚开始网上找了半天没找到集成教程鼓捣了一阵只好自己上手了快速开始 1 准备一份LayuiAdmin 源码压缩包解压
js——修改对象里面的属性名

代码 var e avatar uploads 20230816 b30044ba6735c83bdea9d43b85c4ae15 jpeg mobile code 111 nickname 小土豆 e aaa e avatar delet
Elasticsearch 跨集群复制（CCR）的使用

什么是 Elasticsearch 的跨集群复制 CCR Cross Cluster Replication 跨集群复制是 Elasticsearch v6 5 发布的一个新的特性这个特性可以让你将一个集群的索引数据同步复制到远程的另外一
学习太极创客 — MQTT 第二章（八）ESP8266 MQTT 用户密码认证

视频链接 https www bilibili com video BV1fK4y1L72n spm id from 333 999 0 0 vd source b91967c499b23106586d7aa35af46413 资料链接 h
java上传视频文件到服务器,java视频上传到远程服务器

java视频上传到远程服务器内容精选换一换该步骤必须在root用户下执行若以普通系统用户登录需要执行su切换到root用户下执行后续操作 ssh keygen t rsa过程中需要可选输入保存的文件名默认为在 root ss
C#学习笔记委托

定义委托有时候可能想要将一个方法传递给另一个方法在C 中使用函数指针来实现在JavaScript中由于函数也是对象所以直接可以在参数列表中传递而在C 中需要使用委托要使用委托首先需要定义它定义一个接受两个int参数返回一个i
【HDU4741】空间解析几何

1 题目链接题目大意给出两条空间中不平行的直线求出这两条直线的距离和对应的点 2 分析在空间中我们知道直线有三种关系相交平行异面但是题目中已经说了是不相交的直线所以只可能有两种关系平行或者异面在空间中直线方程并不
PATH环境变量变化，导致无法找到基本命令

解决办法好多命令的位置在 usr bin 恢复办法如下 1 由于找不到sudo 所以必须写全路径其他命令如果提示找不到也需要写全路径 usr bin sudo vi etc profile 2 末尾添加以下内容后保存 export P
android fwk开发之堡垒机的使用

在Android堡垒机 Ubuntu 服务器上编译android AOSP源码 1 添加用户 1 切换到root用户 sudo su 2 添加账户 useradd m username 删除用户 userdel r username 使用u
使用elementUI实现el-table表格跨行

1 概述 element table 有一个属性 span method 可以设置单元格合并通过给table传入span method方法可以实现合并行或列方法的参数是一个对象里面包含当前行row 当前列column 当前行号rowI
new bing聊天机器人免翻命令行使用--大佬逆向工程api

使用可以看到 IP地址在美国使用步骤下载地址 GitHub地址或者命令行 python3 m pip install EdgeGPT upgrade 获取bing的cookie 不会控制台获取的可以在edge插件里面下载cooki
爬虫实战之《流浪地球》豆瓣影评分析（一）

背景与挖掘目标获取豆瓣评论数据分析好评与差评的关键信息分析评论数量及评分与时间的关系分析评论者的城市分布情况 1 背景与挖掘目标豆瓣 douban 是一个社区网站网站由杨勃网名阿北创立于2005年3月6日该网站以书影音起
ChatGPT漫谈(二)

ChatGPT 脱胎于OpenAI在2020年发布的GPT 3 任何外行都可以使用GPT 3 在几分钟内提供示例并获得所需的文本输出 GPT 3被认为是当时最强大的语言模型但现在 ChatGPT模型似乎更强大 ChatGPT能进行天马
VUE 自定义穿梭框

某次项目要使用穿梭框进行数据选择项目使用的element ui框架框架中的穿梭框是这样子的好像不能满足我的需求因为需要展示很多内容包括图片等信息也要加上很多样式等等我尝试这去改造一会后觉得还是自己动手去写一个靠谱几经鼓捣效
[华为云云服务器评测] 华为云耀云服务器 Java、node环境配置

系列文章目录第一章 linux实战华为云耀云服务器L实例 Java node环境配置文章目录系列文章目录前言一任务拆解二修改密码三配置安全规则四远程登录并更新apt 五安装配置JDK环境 5 1 安装openj
数据结构和简单算法思想

只为自己学习进行一下记录虽然之前上了一些关于数据结构算法之类的课但之前都没有怎么搞懂尤其是算法里面的一些算法思想现在看能不能补上就是一些大佬的算法指导刷LeetCode的一些题回看之前的书上面的重点教材是清华大学出版社的数
IDEA vs VSCode在java开发上的横向对比

讲讲出身了解一个人需要了解他的出身一个app也是如此 Visual Studio Code 简称 VS Code 是Microsoft在2015年4月30日Build开发者大会上正式宣布一个运行于 Mac OS X Windows和 L
java文件操作报错：java.io.FileNotFoundException：D:\..（拒绝访问）

import java io Description 复制文件从一个输入流中读取数据然后通过输出流写入目标位置一边读一边写 ClassName CopyFile Version V1 0 public class CopyFile p
softmax回归

softmax回归线性回归不同 softmax回归的输出单元从个变成了多个且引了softmax运算使输出更适合离散值的预测和训练 softmax回归跟线性回归样将输特征与权重做线性叠加它将logistic 激活函数推广到C类

softmax回归

softmax回归

先读取数据

定义模型

定义损失函数

分类精度

优化算法训练模型

softmax回归 的相关文章

随机推荐

热门标签

softmax回归的相关文章