如何理解协方差矩阵(散布矩阵)

2023-10-27

这学期开了模式识别的学习课程,经常提到概率论与数理统计的一个概念:协方差矩阵(在模式识别中又叫散布矩阵)。理解这个矩阵严格意义上来说其实不需要太多先导知识,我们只需要了解一些线性代数基本的概念。但是你如果不了解协方差矩阵,听模式识别的课程就会云里雾里(就像我一样)。

那么在学习协方差矩阵之前

首先你需要知道一些统计学的基本概念

1.均值:

在这里插入图片描述

2.样本标准差:

[公式]

均值很好理解,是描述样本集合中的中间点,是所有信息的平均。而标准差描述的是一种散布度,比如[0,10,11]和[6,7,8]的均值是一样的都是7,但是很明显[0,10,11]看起来会更加分散一点,这就是散布程度更大一点。

这里从我的角度提一嘴为什么样本标准差中的分母是 x − 1 x-1 x1 。我们知道 x ˉ \bar{x} xˉ是样本中的均值,均值反映的信息和样本整体有关,也就是和样本中的每个值都有关系,因此其实我们可以把均值理解为包含样本中n种信息,而 x i x_i xi这个值本身表示样本中的一个信息(这个应该很好理解),那么 x i − x ˉ x_i - \bar{x} xixˉ就可以理解为包含 n − 1 n-1 n1 种信息,那么对于方差来说,这就达到了估计的目的,这也被称为样本的无偏估计。而如果分母为 n n n 的话,很明显就变成了样本的有偏估计。

这个理解方式的启发其实是机器学习中的卷积层,卷积层这一层的作用就是将图像信息压缩:图像经过卷积以后,虽然经过降维,但是图像包含的信息仍然是原有经过降维处理后信息。

下面对于协方差的理解引用了部分其他博主的理解,我觉得理解起来相对会轻松一点

协方差可以说是在标准差的基础上延申出来的,我们面对多维数据,无法用一个固定的值描述样本的离散程度,协方差就是度量两个随机变量关系的统计量

首先我们看方差的定义:
在这里插入图片描述

这是度量单维度偏离均值程度的式子,接着就是协方差:

[公式]

可以看出来,协方差矩阵可以写成对于每一维来说的方差,只不过是以矩阵形式写出来的方差,举一个三维的最简单的例子

[公式]

从这个例子可以看出来,首先 cov ⁡ ( x ) \operatorname{cov}(x) cov(x) 代表在 x x x 变量中的方差,可以看作是 var ⁡ ( X ) = ∑ i = 1 n ( X i − X ˉ ) ∗ ( X i − X ˉ ) n − 1 \operatorname{var}(X)=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right) *\left(X_{i}-\bar{X}\right)}{n-1} var(X)=n1i=1n(XiXˉ)(XiXˉ)单独的样本方差,而更重要的是 cov ⁡ ( x , y ) \operatorname{cov}(x,y) cov(x,y) 表示 cov ⁡ ( X , Y ) = ∑ i = 1 n ( X i − X ˉ ) ∗ ( Y i − Y ˉ ) n − 1 \operatorname{cov}(X, Y)=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right) *\left(Y_{i}-\bar{Y}\right)}{n-1} cov(X,Y)=n1i=1n(XiXˉ)(YiYˉ),这样以此类推。从这种定义角度可以发现,这就是多维变量之间的完全图关系,而这种关系从某种意义上来说就是他们的互相之间的离散程度,但更准确的说是相关系数。如果这种结果为正值就说明他们是正相关的,结果为负值说明他们之间是负相关的。

在这里,也给出协方差矩阵的计算方式:先让样本矩阵中心化,即每一维度减去该维度的均值得到矩阵 X X X ,使每一维度上的均值为0,直接用矩阵 X X X 乘上它的转置 X T X^T XT ,然后除以 n − 1 n-1 n1 即可。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何理解协方差矩阵(散布矩阵) 的相关文章

  • 什么是负载均衡,看完文章秒懂

    一 负载均衡简介 1 1 大型网站面临的挑战 大型网站都要面对庞大的用户量 高并发 海量数据等挑战 为了提升系统整体的性能 可以采用垂直扩展和水平扩展两种方式 垂直扩展 在网站发展早期 可以从单机的角度通过增加硬件处理能力 比如 CPU 处
  • 运行时报错“version `GLIBCXX_3.4.29‘ not found”底层原理分析

    文章目录 1 报错的现象 2 为什么程序有的报找不到某个版本的动态库 有的报找不到动态库文件 2 1 找不到动态库 2 2 找不到某个版本的动态库 2 2 1 报错的原因 2 2 2 动态库的版本是如何指定的 程序又是如何记录依赖的动态库版
  • DecimalField的使用

    DecimalField 类 DecimalField max digits 无 decimal places 无 选项 固定精度的十进制数 在Python中表示一个 十进制的实例 有两个必需的参数 DecimalField max dig

随机推荐

  • 浏览器插件下载“Download failed. Please check your connection.”解决方法

    第一步 查看错误原因 Download failed Please check your connection 下载失败 请检查您的连接 第二步 根据问题根源查看connects相关设置 第三步 分析原因 我是开启了Manual proxy
  • NeRF必读:Instant-NGP----RTX3090单卡就能玩转NeRF

    前言 NeRF从2020年发展至今 仅仅三年时间 而Follow的工作已呈井喷之势 相信在不久的将来 NeRF会一举重塑三维重建这个业界 甚至重建我们的四维世界 开头先吹一波 NeRF的发展时间虽短 有几篇工作却在我研究的领域开始呈现万精油
  • C语言---双向链表(详解)---数据结构

    双向链表所需要头文件 首先重定义类型名 意义我前几篇讲过几次了 这里就不在赘述了 顺序表 单链表的开头都有说明 然后我们需要一个结构体 结构体包含 存储数据的 a 指向一个节点的指针 next 指向上一个节点的指针 prve 双向链表实现的
  • pgadmin4更改数据类型和主键

    在 pgAdmin 4 中更改数据类型和主键需要以下步骤 打开 pgAdmin 4 连接到您想要修改的数据库 找到并打开您想要修改的表 单击该表后单击 设计 按钮 找到要修改的列 单击该列后单击 编辑 删除 按钮 在弹出的窗口中 更改 数据
  • hai子兄弟表示法(C语言实现)——树的存储结构

    孩子兄弟表示法实际就是创建一棵二叉树 include
  • 统计中位数为 K 的子数组

    给你一个长度为n的数组nums 该数组由从1 到n的不同整数组成 另给你一个正整数k 统计并返回nums中的 中位数等于k的非空子数组的数目 注意 数组的中位数是按递增顺序排列后位于中间的那个元素 如果数组长度为偶数 则中位数是位于中间靠左
  • 音频系统POP音的原理和解决方法

    音频系统POP音的原理和解决方法 目录 文章目录 音频系统POP音的原理和解决方法 目录 音频IC与功放IC的电源时序与功能模块使能时序 功放IC输入端INP与INN的阻抗匹配 增大VBIAS滤波电容 BTL输出和SE输出 减小输出端耦合电
  • JWT令牌验证

    目录 一 JWT介绍 二 安装依赖 三 登陆接口 1 令牌工具类 2 接口代码 四 说明 一 JWT介绍 JWT全称 JSON Web Token 官网 JSON Web Tokens jwt io 定义了一种简洁的 自包含的格式 用于在通
  • Cortex-M3/M4内核STM32的LR寄存器和PC寄存器

    文章目录 怎么控制STM32跳转到指定程序 STM32的LR寄存器和PC寄存器 结语 怎么控制STM32跳转到指定程序 首先 使用标号加goto语句可以使程序强制跳转 而goto的原理实际上是汇编语言里面的强制跳转 我们看STM32的启动文
  • 顺序表企业级应用

    高并发 WEB 服务器中顺序表的应用 高性能的 web 服务器 Squid 每秒可处理上万并发的请求 从网络连接到服务器的客 户端与服务器端在交互时会保持一种会话 和电话通话的场景类似 服务器端为了管 理好所有的客户端连接 给每个连接都编了
  • PARL 强化学习框架学习

    最近参加了百度的的PARL深度强化学习课程 算是对强化学习有了一定了解 因为之前并没有学习过强化学习相关的知识 粗略入门 体验了PARL框架 确实对新手比较友好 入门学习了比较基础的算法 如SARSA Q Learning DQN PG D
  • Matlab 2020b 64bit

    Matlab 2020b 64bit 链接 https pan baidu com s 1PfAaWPGEzyXBBvYWe48Fng pwd kigc 提取码 kigc 来自百度网盘超级会员V7的分享
  • 数据结构之线性表(bsd, sys/queue.h)

    数据结构之线性表 Author Once Day Date 2023年5月27日 参考文档 Linux内嵌链表 sys queue h 详解 tissar的博客 CSDN博客 嵌入式大杂烩周记第 3 期 sys queue h 知乎 zhi
  • AIC(最小信息化准则)

    AIC信息准则 即Akaike information criterion 是用来衡量统计模型拟合优良性的一个标准 是是由日本统计学家赤池弘次创立和发展的 因此也称为赤池信息量准则 它建立在熵的概念基础上 可以权衡所估计模型的复杂度和模型拟
  • 去除vue顶部60px的空白

    问题 今天才注意到编译后的vue代码 在网站的顶部有一个margin top 60px的空白 有点不解 于是去看源码 代码 app font family Avenir Helvetica Arial sans serif webkit f
  • 概率统计21——指数分布和无记忆性

    指数分布 Exponential distribution 是一种连续型概率分布 可以用来表示独立随机事件发生的时间间隔的概率 比如婴儿出生的时间间隔 旅客进入机场的时间间隔 打进客服中心电话的时间间隔 系统出现bug的时间间隔等等 指数分
  • 给rhel9、centos-stream9 设置软件源

    我使用的是清华镜像源 https mirrors tuna tsinghua edu cn centos stream SIGs 9 stream 一 软件源添加 vim etc yum repos d CentOS Stream9 rep
  • typedef struct node的用法及与struct node的区别,为何要用typedef?

    typedef的作用是为已有的数据类型定义一个新名字 其主要目的是为了我们在使用时能用这个更加清晰简单的新名字 还有一个目的就是为了简化变量的声明 下面的几段代码具有相同的功能 都是用于链表结构体节点的定义和声明 第一种方式 struct
  • vue页面刷新或者后退参数丢失的问题

    在toB的项目中 会经常遇到列表数据筛选查询的情景 当要打开某一项的详情页或者暂时离开列表页 再返回 后退时 选择的筛选条件会全部丢失 辛辛苦苦选择好的条件全没了 还得重新选择 如果有分页的更头大 还得重新一页页翻到之前看到的那一页 用户体
  • 如何理解协方差矩阵(散布矩阵)

    这学期开了模式识别的学习课程 经常提到概率论与数理统计的一个概念 协方差矩阵 在模式识别中又叫散布矩阵 理解这个矩阵严格意义上来说其实不需要太多先导知识 我们只需要了解一些线性代数基本的概念 但是你如果不了解协方差矩阵 听模式识别的课程就会