协方差矩阵的几何解释

2023-11-16

A geometric interpretation of the covariance matrix

http://www.visiondummy.com/2014/04/geometric-interpretation-covariance-matrix/

译文:http://demo.netfoucs.com/u010182633/article/details/45937051

介绍

在本文中,我们通过探索线性变换与所得数据协方差之间的关系提供协方差矩阵一个直观的几何解释。大部分教科书基于协方差矩阵的概念解释数据的形状。相反,我们采取一个反向的方法,根据数据的形状来解释协方差矩阵的概念。

在《为什么样本方差除以N-1?》的文章中,我们会讨论方差的概念,并提供了众所周知的估算样本方差公式的推导和证明。这篇文章中使用的图1表明标准差(方差的平方根)提供了数据在特征空间上传播多少的量度。 
这里写图片描述

我们发现,样本方差的无偏估计可由下式获得: 
这里写图片描述

然而,方差只能用于解释平行于特征空间轴方向的数据传播。考虑图2所示的二维特征空间: 
这里写图片描述

对于这个数据,我们可以计算出在x方向上的方差这里写图片描述和y方向上的方差这里写图片描述。然而,数据的水平传播和垂直传播不能解释明显的对角线关系。图2清楚地显示,平均而言,如果一个数据点的x值增加,则y值也将增加,这产生了正相关。这种相关性可以通过扩展方差概念到所谓的数据“协方差”捕捉到: 
这里写图片描述

对于2D数据,我们得到这里写图片描述,这些值可以用矩阵来表示,该矩阵叫做协方差矩阵: 
这里写图片描述

如果x与y是正相关的,那么y和x也是正相关的。换句话说,这里写图片描述。因此,协方差矩阵始终是一个对称矩阵,其对角线上是方差,非对角线上是协方差。二维正态分布数据由它的均值和2x2协方差矩阵就可以完全解释。同样,一个3x3协方差矩阵用于捕捉三维数据的传播,一个NxN协方差矩阵捕获N维数据的传播。

图3展示了数据的整体形状如何定义协方差矩阵: 
这里写图片描述

协方差矩阵的特征值分解

在下一节,我们将讨论协方差矩阵如何被解释为白色数据转换成我们观察到数据的线性操作。然而,在深入技术细节之前,对特征向量和特征值如何唯一地确定协方差矩阵(数据形状)有一个直观的认识是非常重要的。

正如我们在图3看到的,协方差矩阵定义了我们数据的传播(方差)和方向(协方差)。因此,如果我们想用一个向量和它的大小来表示协方差矩阵,我们应该简单地尝试找到指向数据最大传播方向上的向量,其大小等于这个方向上的传播(方差)。

如果我们定义这个向量为这里写图片描述,那么我们数据D到这个向量上的映射为这里写图片描述,映射数据的方差是这里写图片描述。由于我们正在寻找指向最大方差方向的向量这里写图片描述,所以我们应该选择它的成分,使得映射数据的协方差矩阵这里写图片描述尽可能的大。最大化这里写图片描述的形式为这里写图片描述的任何函数,其中这里写图片描述是归一化单位向量,可以用一个所谓的瑞利商表示。通过设置这里写图片描述等于矩阵的最大特征特征向量这里写图片描述可以获得这样瑞利商的最大值。

换句话说,协方差矩阵的最大特征向量总是指向数据最大方差的方向,并且该向量的幅度等于相应的特征值。第二大特征向量总是正交于最大特征向量,并指向第二大数据的传播方向。

现在,让我们来看看一些例子。在文章《特征值和特征向量》中http://blog.csdn.net/u010182633/article/details/45921929,我们看到一个线性变换矩阵T完全由它的特征向量和特征值定义。应用到协方差矩阵,这意味着: 
这里写图片描述 
这里写图片描述

如果我们数据的协方差矩阵是对角矩阵,使得协方差是零,那么这意味着方差必须等于特征值λ。如图4所示,特征向量用绿色和品红色表示,特征值显然等于协方差矩阵的方差分量。 
这里写图片描述

然而,如果协方差矩阵不是对角的,使得协方差不为零,那么情况稍微更复杂一些。特征值仍代表数据最大传播方向的方差大小,协方差矩阵的方差分量仍然表示x轴和y轴方向上的方差大小。但是,因为数据不是轴对齐的,所以这些值不再与图5所示的相同。 
这里写图片描述

通过比较图5与图4,可以清楚地看到特征值表示沿特征向量方向数据的方差,而协方差矩阵的方差分量表示沿轴的传播。如果没有协方差,则这两个值是相等的。

协方差矩阵作为线性变换

现在,让我们忘了协方差矩阵。图3的实例可以简单地认为是图6的一个线性变换实例: 
这里写图片描述

图6所示的数据是D,则图3所示的每个实例可以通过线性变换D得到:这里写图片描述

其中T是变换矩阵,包括一个旋转矩阵R和缩放矩阵S: 
这里写图片描述

这些矩阵定义如下: 
这里写图片描述 
其中这里写图片描述是旋转角度。

这里写图片描述 
这里写图片描述分别是x方向和y方向的比例因子。

在下面的段落中,我们将讨论协方差矩阵这里写图片描述与线性变换矩阵T= RS之间的关系。

让我们先从未缩放(缩放相当于1)和未旋转的数据开始。在统计中,这往往为“白数据’,因为它的样本是从标准正态分布引出的,因此对应于白(不相关)噪声: 
这里写图片描述

这个“白色”数据的协方差矩阵等于单位矩阵,使得方差和标准差等于1,协方差等于零: 
这里写图片描述

现在让我们用因子4在x方向缩放数据: 
这里写图片描述

数据D’现在如下: 
这里写图片描述

D’的协方差这里写图片描述现在是: 
这里写图片描述

D’的协方差这里写图片描述与线性变换矩阵T有关系,D=TD,其中: 
这里写图片描述

然而,虽然数据在x和y方向上缩放时等式(12)成立,但是应用旋转是否依然成立呢?为了调查一般情况下线性变换矩阵T和协方差矩阵这里写图片描述之间的关系,我们试图分解协方差矩阵为旋转和缩放矩阵的乘积。

正如我们前面所看到的,我们可以用特征向量和特征值表示协方差矩阵: 
这里写图片描述 
这里写图片描述

等式(13)保存矩阵Σ的每个特征向量和特征值。在2D情况下,我们得到两个特征值和两个特征值。由公式(13)定义的两个等式可以有效地用矩阵符号来表示: 
这里写图片描述 
其中V是矩阵,它的列是Σ的特征向量,L是对角矩阵,其非零元素对应特征值。

这意味着我们可以将协方差矩阵表示为特征向量和特征值的函数: 
这里写图片描述

方程(15)就是所谓协方差矩阵特征值分解,并可以使用奇异值分解算法来获得。而特征向量表示数据最大方差的方向,特征值表示那些方向方差的幅度。换言之,V表示旋转矩阵,而这里写图片描述表示一个缩放矩阵。协方差矩阵可以进一步分解为: 
这里写图片描述 
这里写图片描述

在等式(6)中,我们定义了一个线性变换T= RS。由于S是对角缩放矩阵,所以S=ST。此外,由于R为正交矩阵,R-1=RT。因此,这里写图片描述协方差矩阵可以写为: 
这里写图片描述

换言之,如果我们应用由T=RS定义的线性变换到图7所示的原始白数据,我们得到了旋转和缩放的数据D’及协方差矩阵这里写图片描述。这示于图10: 
这里写图片描述
图10的彩色箭头表示特征向量。最大特征向量,即与最大特征值对应的特征向量,总是指向数据最大方差的方向,并由此确定其方位。次特征向量总是正交于最大特征向量,因为旋转矩阵的正交性。

总结 
在本文中,我们表明观察到数据的协方差矩阵与白色不相关数据的线性变换有直接的关系。此线性变换完全由数据的特征向量和特征值确定。而特征向量表示旋转矩阵,特征值对应于每个维度上缩放因子的平方。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

协方差矩阵的几何解释 的相关文章

  • 海森矩阵及其应用

    海森矩阵及其应用 转载 2017年04月20日 09 59 48 标签 梯度下降算法 微积分 牛顿迭代法 原文参考链接 here 原文讲得到很详细 海森矩阵 在数学中 海森矩阵 Hessian matrix或Hessian 是一个自变量为向
  • 离散余弦变换

    离散余弦变换 DCT for Discrete Cosine Transform 是与傅里叶变换相关的一种变换 它类似于离散傅里叶变换 DFT for Discrete Fourier Transform 但是只使用实数 离散余弦变换相当于
  • 贝叶斯推断及其互联网应用(二):过滤垃圾邮件

    上一次 我介绍了贝叶斯推断的原理 今天讲如何将它用于垃圾邮件过滤 贝叶斯推断及其互联网应用 作者 阮一峰 接上文 七 什么是贝叶斯过滤器 垃圾邮件是一种令人头痛的顽症 困扰着所有的互联网用户 正确识别垃圾邮件的技术难度非常大 传统的垃圾邮件
  • 证明sinx/x的极限等于1(x趋向于0)

    洛比达法则 上下都对x求导 得1 cosx 1
  • 时域和空域和频域

    傅立叶变换是f t 乘以正弦项的展开 正弦项的频率由u 其实是miu 的值决定 因为积分后左边剩下的为一变量是频率 所以我们说傅立叶变换域是频率域 数字图像处理 冈萨雷斯 中文第三版P128 当变量t用于说明图像时 我们一般将变量t的域称为
  • 极限导数练习题

    f x sinx 2 x 当x趋近于0时 f x 的极限是0 f x sin x 2 x 当x趋近于0时 f x 的极限是0 f x sin 2x x 当x趋近于0时 f x 的极限是2
  • python 之pulp 线性规划介绍及举例

    原文 https www cnblogs com shizhenqiang p 8274806 html 安装 conda install pulp pulp http pythonhosted org PuLP main basic py
  • 凸函数性质习题

    试题专页 1题文 考试题提前练 gt 戳这 凸函数的性质定理为 如果函数f x 在区间D上是凸函数 则对于区间D内的任意x1 x2 xn 有 f x1 f x2 f xn n f x1 x2 xn n 已知函数y sinx在区间 0 上是凸
  • 贝叶斯推断及其互联网应用(一)

    贝叶斯推断及其互联网应用 一 投递人 itwriter 发布于 2011 08 25 14 03 评论 6 有1981人阅读 原文链接 收藏 一年前的这个时候 我正在翻译Paul Graham的 黑客与画家 那本书大部分谈的是技术哲学 但是
  • 相关系数,互相关函数,协方差,卷积

    X t 为随机过程 a t E X t 为期望 Y t 为另一随机过程 自相关函数的定义为 R s t E X s X t 互相关函数的定义为 R s t E X s Y t 事实上 在图象处理中 自相关和互相关函数的定义如下 设原函数是f
  • 函数的相关和卷积

    1 卷积的定义 卷积满足交换律 分配律 结合律 也具有位移不变性以及缩放性质 2 互相关的定义 变量替换后有 上述两式完全等价 性质 1 互相关是两个函数间存在相似性的量度 2 由上述 2 式可得 3 相关运算和卷积运算的区别 对相关来说
  • 世界上最完美的公式 ----欧拉公式

    欧拉公式 在数学历史上有很多公式都是欧拉 leonhard euler 公元1707 1783年 发现的 它们都叫做 欧拉公式 它们分散在各个数学分支之中 1 分式里的欧拉公式 a r a b a c b r b c b a c r c a
  • 线性回归最小二乘法和梯度下降法-详细

    原文 https blog csdn net y990041769 article details 69567838 问题描述 首先我们定义问题 线性回归要解决的问题就是根据给出的数据学习出一个线性模型 例如我们最常说的身高和体重的关系 以
  • java实现高斯赛德尔算法解线性方程组

    package linear equation import java util Scanner 使用高斯赛德尔迭代法求解线性方程组 public class Gauss Seidel Iterate 求下三角 private static
  • 自然对数e的来历

    e是自然对数的底数 是一个无限不循环小数 其值是2 71828 是这样定义的 当n gt 时 1 1 n n的极限 注 x y表示x的y次方 随着n的增大 底数越来越接近1 而指数趋向无穷大 那结果到底是趋向于1还是无穷大呢 其实 是趋向于
  • 对数和指数

    参考 https www zhihu com question 21453993 这就相当于先发明减法符号 再发明加法符号 1614年 纳皮尔发明了对数和对数表 1637年 法国数学家笛卡儿发明了指数 比对数晚了20多年 1770年 欧拉才
  • 2的31次方和3的21次方哪个大,123组成最大的数是多少?

    123这三个数字组成最大的数是什么数 面试官告诉小孙 123这三个数字组成最大的数是什么数 我希望你能够在5分钟之内回答出来 小孙当时连想都没有想 123组成的最大数字 当然就是123了 当小孙把这个答案告诉面试官的时候 面试官摇摇头 然后
  • 特征值和特征向量的几何和物理意义

    原文 http blog 163 com renguangqian 126 blog static 1624014002011711114526759 FUCk 相见很晚 如果大学期间遇到这样的文章 线代必须90分以上 特征值和特征向量的几
  • 逻辑回归原理(python代码实现)

    原文 https blog csdn net csqazwsxedc article details 69690655 Logistic Regression Classifier逻辑回归主要思想就是用最大似然概率方法构建出方程 为最大化方
  • 协方差矩阵的实例与意义

    协方差矩阵的实例与意义 在机器学习中经常需要计算协方差矩阵 本科时没学过这个概念 一直对此非常头疼 现在试图通过实例的计算 图形化的表示来梳理一下什么是协方差矩阵 A numerical example 问题 有一组数据 如下 分别为二维向

随机推荐

  • 华为云服务器,新用户福利!!0元免费体验云产品最长可达一年

    华为云官网最新活动 新用户完成个人实名认证 参与问卷调研后即可免费试用 云产品0元试用 最长可达一年 华为云服务立足于互联网领域 依托于华为公司雄厚的资本和强大的云计算研发实力 面向互联网增值服务运营商 大中小型企业 政府 科研院所等广大企
  • global::System.Runtime.Versioning.TargetFrameworkAttribute 特性重复问题处理

    今天编译程序遇到global System Runtime Versioning TargetFrameworkAttribute 特性重复错误 原因是编译时生成的 NETFramework Version v4 6 1 AssemblyA
  • 记一次MySql还原导致的无法连接

    问题 昨天同事使用服务器的MySql数据库还原了一个5GB 的备份 结果一直卡住 他就将数据库强行关闭 没再执行任何其他操作 结果今天客户反馈登录异常 逐步排查 定位到是数据库无法访问 于是远程查看服务器 发现 MySql服务是正在运行的
  • RTKlib软件源码学习(观测文件与星历文件读取)

    本文基于本人对rtklib源码的学习进行顺序汇总 为记录个人的学习与理解 并根据个人需要对部分代码对其进行注释 如有错误或者不完善的地方烦请提出建议或改正方法 目录 1 execses函数 2 readobsnav函数 3 readrnxt
  • 【JS逆向】之HOOK代码怎么写

    声明 本文只作学习研究 禁止用于非法用途 否则后果自负 如有侵权 请告知删除 谢谢 前言 我解释一下hook是什么玩意 hook的原意是钩子 我理解替换或者拦截原有方法去修改和处理 1 怎么去替换原来的方法 这里我自己写一个方法去替换 实例
  • 中关村归国留学人员联创中心揭牌仪式,Jina AI 受邀出席活动

    2022 年 9 月 25 日上午 中关村归国留学人员联创中心揭牌仪式在中关村创业大街顺利举行 Jina AI 联合创始人兼 COO 何烜彬现场进行企业项目分享 并面向现场各海外高校校友代表发出人才招募邀请 活动背景 为更好地服务国际化人才
  • matlab入门基础:矩阵操作(一)

    系列笔记目录 第二节 矩阵操作 一 创建特殊矩阵 矩阵的运算 文章目录 系列笔记目录 前言 一 创建特殊矩阵 二 矩阵运算 1 矩阵元素的修改 2 矩阵的变维 3 矩阵的变向 4 矩阵的抽取 练习 三 矩阵的数学运算 总结 前言 MATLA
  • C++ - Vector 计算 均值(mean) 和 方差(variance)

    C Vector 计算 均值 mean 和 方差 variance 代码 double sum std accumulate std begin resultSet std end resultSet 0 0 double mean sum
  • C++通讯录管理系统(简单版)

    这个通讯录管理系统是我听课后做的笔记 都是很基础的逻辑实现 第一次动手写了一个小案例感觉找到了一点方向 也希望能帮到一点忙 1 系统需求 通讯录是一个可以记录亲人 好友信息的工具 本教程主要利用C 来实现一个通讯录管理系统 系统中需要实现的
  • PowerDesigner将PDM导出生成WORD文档--温习老知识

    今天的温习老知识 是如何将一个PD设计的PDM来导出WORD文档 这是一个非常实用的功能 可以在软件过程的数据库设计文档编写中节省N多时间 那不废话了 我们就开始今天的讲解吧 第一步 点击Report Temlates 制作模板 第二步 时
  • 1. 创建和生成

    文章目录 创建和生成 从 python 列表或元组创建 使用 arange 生成 使用 linspace logspace 生成 np linspace 使用 ones zeros 创建 使用 random 生成 从文件读取 本教程内容旨在
  • Python:实现多个txt文本的简单合并,亲测简单好用,保姆教程

    声明 非原创 我是python废废 原博客连接为 Python批量合并多个txt文件 自由的小白的博客 CSDN博客 python 合并多个txt 我在这里只做分享 好博客要更多人看到嘛 一 成果展示 我希望实现简单的txt文本合并 合并前
  • APP的接口版本管理 实现多版本共存

    思路 用户请求url gt 拦截器拦截 gt 转发到真正处理类和方法 gt 返回结果 url注解类 package com jc app util apiVersion import java lang annotation 需要拦截的AP
  • platform 设备驱动实验

    目录 Linux 驱动的分离与分层 驱动的分隔与分离 驱动的分层 platform 平台驱动模型简介 platform 总线 platform 驱动 platform 设备 硬件原理图分析 试验程序编写 platform 设备与驱动程序编写
  • springcloud+docker+elk搭建日志分析系统

    springcloud docker elk搭建日志分析系统 elk架构 搭建步骤 创建对应配置文件 注 编排文件与logstash和kibana在同一文件夹下 logstash conf配置 input tcp mode gt serve
  • 人工智能的数学基石:揭秘人工智能十大数学基础

    人工智能 Artificial Intelligence 简称AI 正以惊人的速度改变着我们的生活 然而 要实现智能的机器 离不开数学的支持 本文将带你深入探索人工智能的数学基础 揭示AI背后的数学奥秘 一 线性代数 Linear Alge
  • 函数对象(重载括号运算符)

    函数对象 重载括号运算符 函数对象超出普通函数的概念 函数对象可以有自己的状态 在使用stl中 经常需要将函数对象作为算法的输入参数 或实例子化一个容器的输入参数
  • NodeJs之邮件(email)发送

    NodeJs之邮件 email 发送 一 介绍与需求 1 1 介绍 1 Nodemailer简介 Nodemailer是一个简单易用的Node js邮件发送插件 github地址 Nodemailer的主要特点包括 支持Unicode编码
  • SpringBoot+Shiro+LayUI权限管理系统项目-9.核心知识点总结

    1 说明 本篇讲一下本项目几个重要的知识点 详细看源码 文章下方捐赠或QQ联系捐赠获取 2 Shiro如何设置密码加密算法 1 在shiro配置文件中添加 Bean public HashedCredentialsMatcher hashe
  • 协方差矩阵的几何解释

    A geometric interpretation of the covariance matrix http www visiondummy com 2014 04 geometric interpretation covariance