终于明白协方差的意义了

2023-10-27

转自:https://blog.csdn.net/GoodShot/article/details/79940438

协方差其意义:
度量各个维度偏离其均值的程度。协方差的值如果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),结果为负值就说明负相关的,如果为0,也是就是统计上说的“相互独立”。

如果正相关,这个计算公式,每个样本对(Xi, Yi), 每个求和项大部分都是正数,即两个同方向偏离各自均值,而不同时偏离的也有,但是少,这样当样本多时,总和结果为正。下面这个图就很直观。下面转载自:http://blog.csdn.net/wuhzossibility/article/details/8087863

在概率论中,两个随机变量 X 与 Y 之间相互关系,大致有下列3种情况:

当 X, Y 的联合分布像上图那样时,我们可以看出,大致上有: X 越大  Y 也越大, X 越小  Y 也越小,这种情况,我们称为“正相关”。


当X, Y 的联合分布像上图那样时,我们可以看出,大致上有:X 越大Y 反而越小,X 越小 Y 反而越大,这种情况,我们称为“负相关”。


当X, Y  的联合分布像上图那样时,我们可以看出:既不是X  越大Y 也越大,也不是 X 越大 Y 反而越小,这种情况我们称为“不相关”。
怎样将这3种相关情况,用一个简单的数字表达出来呢?

在图中的区域(1)中,有 X>EX ,Y-EY>0 ,所以(X-EX)(Y-EY)>0;

在图中的区域(2)中,有 X<EX ,Y-EY>0 ,所以(X-EX)(Y-EY)<0;

在图中的区域(3)中,有 X<EX ,Y-EY<0 ,所以(X-EX)(Y-EY)>0;

在图中的区域(4)中,有 X>EX ,Y-EY<0 ,所以(X-EX)(Y-EY)<0。

当X 与Y 正相关时,它们的(联合)分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有E(X-EX)(Y-EY)>0 。(可以从一维 x~N(μ,σ)的大部分的分布(-3σ-3σ)99.7%的区间取值来理解,当符合条件的X和Y区域都在这(1)(3)区间,X-EX和Y-EY的数值同大于0和小于0的居多,其乘积大于0(是一个三维立体型吧,会根据概率密度p(x)来决定该区域数值,),且其对应数值相乘(X-EX)(Y-EY)越大偏离越大)

当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有(X-EX)(Y-EY)<0 。

当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有(X-EX)(Y-EY)=0 。

所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差
cov(X, Y) = E(X-EX)(Y-EY)。
当 cov(X, Y)>0时,表明 X与Y 正相关;

当 cov(X, Y)<0时,表明X与Y负相关;

当 cov(X, Y)=0时,表明X与Y不相关。

这就是协方差的意义。

另外补充:

1.

求特征协方差矩阵,如果数据是3维,那么协方差矩阵是

     

     这里只有x和y,求解得

     

     对角线上分别是x和y的方差,非对角线上是协方差。协方差大于0表示x和y若有一个增,另一个也增;小于0表示一个增,一个减;协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小。


2.参考:https://blog.csdn.net/goodshot/article/details/50961720
 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

终于明白协方差的意义了 的相关文章

  • 使用git_blame定位修改代码历史

    使用git blame定位修改代码历史 git blame定义 git blame Show what revision and author last modified each line of a file 文档地址 https git
  • 网络安全工程师自学教程2023年最新版

    什么是黑客 你以为的黑客是这样的 黑客帝国 实际上 黑客可能是街边炒粉的大叔 穿着格子衫的路人甲 一位体重再增加就得买3人座的 小胖 著名黑客Richard Stallman 黑客是一类掌握超高计算机技术的人群 凭着掌握的知识 他们既可以从
  • UDP消息发送

    发送端 package com kuang lesson03 import java net DatagramPacket import java net DatagramSocket import java net InetAddress
  • CAS(compare and swa)中的ABA问题及解决

    CAS compare and swap CAS是 compare and swap 的缩写 字面意思是比较交换 CAS锁通常也是实现乐观锁的一种机制 首先会给它一个期望值 用期望值与老值做比较 如果相等就用新传入的值进行修改 但是CAS通
  • GF_CLR初始用 - 正式版

    参照 DeerGF Wolong框架使用教程 与tackor老哥的踩坑日记所编写 第二次尝试 总结第一次经验重新来 点击链接加入群聊 Gf Wolong热更集合 一 部署 HybridCLR Wolong 环境 首先安装Windows Bu

随机推荐

  • IDEA安装Vue插件后为什么创建.vue文件不显示vue图标

    我的IDEA安装Vue插件后 按道理来说 新建一个 vue文件 文件前面应该会有一个 V 一样的图标 然而事实并不是 百度了一圈 大部分人都是说这样的 试了一下 并没用 于是乎 我找到了正确答案来帮刚入门Vue的小白填坑 打开 File g
  • MySQL分区(Partition)功能试验

    目录 概述 分区表和未分区表试验过程 分区命令详解 概述 自5 1开始对分区 Partition 有支持 6 0应比较稳定 水平分区 根据列属性按行分 举个简单例子 一个包含十年发票记录的表可以被分区为十个不同的分区 每个分区包含的是其中一
  • 【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测(Python代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 1 1 LSTM神经网络算法 1 2 PSO算法 1 3 PSO LSTM负荷预测模型 2 运行结果 2
  • excel 中如何使用python操作

    在Excel中使用Python可以通过两种方式实现 使用Python插件 您可以使用一些Excel插件 如PyXLL xlwings等 这些插件可以将Python代码嵌入到Excel工作簿中 以便在Excel中运行Python代码 使用Py
  • 服务器带宽测试

    服务器带宽 简单地说 就是同一时间段能传输的数据总量 服务器带宽越小那么可容纳数据吞吐量越小 同一时间段可容纳的用户访问量也越少 单位时间内从服务器拉取的数据量就越小 服务器带宽越大 可容纳同一时间访问数据越大 单位时间内从服务器拉取的数据
  • 1.8 C++ string

    string基本概念 本质 string是C 风格的字符串 而string本质上是一个类 string和char 区别 char 是一个指针string是一个类 类内部封装了char 管理这个字符串 是一个char 型的容器 特点 stri
  • MATLAB人工神经网络ANN代码

    本文介绍基于MATLAB实现人工神经网络 ANN 回归的详细代码与操作 目录 1 分解代码 1 1 循环准备 1 2 神经网络构建 1 3 数据处理 1 4 模型训练参数配置 1 5 神经网络实现 1 6 精度衡量 1 7 保存模型 2 完
  • android_使用ViewPager和Fragment实现滑动导航

    ViewPage是android support v4 jar包提供的用于页面滑动的库 这里没有将整个实现过程记录 只是把知识点摘出来单独解释 可参照代码自己实现 1 在xml布局文件中添加android support v4 view V
  • Keil 5使用JLink直接调试正在运行的CPU

    原文链接 环境 目标CPU STM32F429 连接工具 JLink V9 连接方式 SWD 调试工具 Keil MDK 5 20 使用场景 目标板正在运行 但是出BUG了 需要调试 而当前又没有在线debug 于是就需要用调试器在不复位C
  • C++ Streams

    1 fstream File table data txt 的内容为 137 2 71828 42 3 14159 7897987 1 608 1337 01101010001 从上述文件中读取第一个整数和第二个小数 ifstream in
  • 一篇文章学懂ADB命令和Monkey命令

    一篇文章学懂ADB命令和Monkey命令 1 adb命令 1 1 查看连接设备 1 2 查看adb版本 1 3 查看手机当前启动App的应用名和包名 1 4 使用aapt使用aapt 查看app的包名和启动名 查看app的包名和启动名 1
  • Element框架更换主题色

    Element 默认的主题色是鲜艳 友好的蓝色 但是UI小姐姐在设计的时候会为了更贴合项目主旨设计出其他颜色的主题色 比如新能源项目一般选用绿色做为主题色 此时我们就需要更改Element框架的主题色 一开始博主的想法是全局修改框架默认样式
  • JDBC连接各种数据库

    ConnectHSQLDB java Java代码 ConnectHSQLDB java package com javaworkspace connecthsqldb import java sql Connection import j
  • /usr/lib64/sa/sa2脚本解释

    文章目录 前言 脚本原文 脚本解释 前言 usr lib64 sa sa1脚本和 usr lib64 sa sa2脚本都是Linux 系统上的 sysstat 工具的一部分 在 etc cron d sysstat这个定时任务下执行 用来收
  • arm+linux swap出错问题

    今天 程序跑了两个小时 忽然出现如下信息 swap dup Bad swap file entry 002fdf80 VM killing process intrusion test swap free Bad swap file ent
  • Android-S模拟器

    0 前言 参考资料 1 基于Android P对Emulator的使用进行了说明 Android S情况有变 因此撰写本文进行记录 1 编译 根据参考资料 1 的方法编译 aosp x86 64 eng 完成后执行emulator无法正常进
  • 南京美食,为吃遍天下做准备~~

    标点美食地址 1 羊肉泡馍 长白街348号有家 老陕家 面馆 郑和公园北面 肉加馍 2 蓝空饭店 三条巷那边 稻香鸭 红烧老鹅 韭香脆皮鸡 是很好的还有一个叫什么牛肉粒的也好吃昏的了 3 山西炸酱面馆 顺着流行青年广场旁的天桥走到马路对面
  • 【阅读笔记】联邦学习实战——构建公平的大数据交易市场

    联邦学习实战 构建公平的大数据交易市场 前言 1 大数据交易 1 1 数据交易定义 1 2 数据确权 1 3 数据定价 2 基于联邦学习构建新一代大数据交易市场 3 联邦学习激励机制助力数据交易 4 FedCoin支付系统设计 4 1 Po
  • stm32 SystemInit函数详解

    官方固件库中的对应函数为 void SystemInit void Reset the RCC clock configuration to the default reset state for debug purpose Set HSI
  • 终于明白协方差的意义了

    转自 https blog csdn net GoodShot article details 79940438 协方差其意义 度量各个维度偏离其均值的程度 协方差的值如果为正值 则说明两者是正相关的 从协方差可以引出 相关系数 的定义 结