相关性分析

2023-11-10

这里的相关性分析主要是线性相关性分析,当然其他的形状的相关性分析可以通过变换转换为线性相关性分析。但是,线性相关性分析始终是相关性分析的基础。线性相关分析的构建主要分为以下几种:

直接绘制散点图

通过把点标出来主观上看是否是线性相关。

绘制散点图矩阵

绘制散点图矩阵是直接绘制散点图的一种,适用于多元线性回归的描述。如果用直接绘制散点图的方法,将每次取多个元中的两个进行绘画,但是这样很没有逻辑。所以我们可以将这n个元的具体情况用柱状图表示出来,放在正方形的对角线上,这样每一个变量与每一个变量之间都绘制了一个散点图,做到了不重复不遗漏。

计算相关系数

之前的两种方法偏向于定性分析,如果要定量分析,那么就要使用相关系数。在二元变量的相关分析中,比较常用的Pearson相关系数、Spearman秩相关系数、判定系数。

Pearson相关系数

适用条件:分析两个连续性变量的相关关系(不太理解为什么说Pearson线性相关系数要求连续变量的取值服从正态分布)

公式:

判断条件:(其本身的条件决定r的取值为[-1,1])

是正相关还是负相关:看r的正负,如果是正则是正相关,如果是负则是负相关

判断线性关系的强弱:

看r的绝对值:

绝对值=0:不存在线性关系

绝对值<=0.3:极弱线性相关或不存在线性相关

0.3<绝对值<=0.8:低度线性相关

0.5<绝对值<=0.8:显著线性相关

绝对值>0.8:高度线性相关

绝对值=1:完全线性相关

Spearman秩相关系数

适用条件:不服从正态分布的变量、分类或等级变量之间的关联性分析可以使用Spearman秩相关系数,注意是可以使用,说明正太分布的也可以用Spearman秩相关系数。

公式:(Spearman秩相关系数是统计学的知识,需要对二元的数据的两种数据进行排序,用标号对每个排序数据进行标记,然后对同一个事物的两种排序的标号之差进行运算)

 对两个变量成对的取值分别按照从小到大(或者从大到大小)顺序编秩,R i 代表x i 的秩次,Q i 代表y i 的秩次,R i -Q i 为x i 、y i 的秩次之差。

(举个例子)

来自于b站:

统计学与质量052 - 皮尔逊 (Pearson) 相关系数 & 斯皮尔曼 (Spearman) 相关系数_哔哩哔哩_bilibili皮尔森相关系数 与 与斯皮尔曼相关系数 (Pearson Correlation Coefficient & Spearman’s correlation coefficient for ranked data), 视频播放量 20990、弹幕量 22、点赞数 376、投硬币枚数 187、收藏人数 375、转发人数 89, 视频作者 深圳麦粮, 作者简介 用动画和图形介绍统计学原理(微信:HLNBGS 群:麦粮统计),相关视频:统计学与质量053 - 简单线性回归 最小二乘法 决定系数,来感受一下韦教主上习题课时的气压,毕业论文皮尔曼与斯皮尔曼相关系数的区别是什么?#论文-,SPSS 统计分析-两变量间的相关分析,Pearson 、 Spearman、 Kendall 相关分析,使用条件、操作说明、案例详解与论文写作指导,spearman与pearson相关性系数的区别,斯皮尔曼与皮尔森相关性系数的区别,什么是秩次,以美国公布的新冠死亡人数与年龄数据为例,SPSS问卷调查皮尔逊相关性分析(Pearson Correlation)在问卷调查数据统计分析中的应用,社会科学的统计学 | 第六节 相关分析 | 皮尔逊相关 | 斯皮尔曼等级相关 | 协方差,SPSS-相关性检验1-皮尔逊相关性检验-Pearson correlation coefficient-SPSS数据分析-SPSS统计分析-SPSS统计分析从,SPSS-相关性检验2-斯皮尔曼等级相关性检验-Spearman correlation coefficient-SPSS数据分析-SPSS统计分析-SPSS统,【用SPSS写论文】相关性分析怎么用到论文中https://www.bilibili.com/video/BV1oE411G7Za/?spm_id_from=333.337.search-card.all.click&vd_source=a50afd4fb17bb7c0aa0f024bc613a5bd

 判断Spearman相关的强弱:

 

对于两个相关系数的建立,都要经过假设检验,一般使用t检验方法进行假设检验。研究表明,在正态分布的假定下,Spearman秩相关系数与Pearson相关系数在效率上是等价的,而对于连续测量数据,更适合于Pearson相关系数来分析。

判定系数

判定系数是相关系数的平方,用来衡量回归方程对y的解释程度。

代码实现:以上两种相关系数都可以通过corr()函数实现,具体的形式如下。

corr()函数的用法_corr函数_努力学--ing的博客-CSDN博客corr()函数的用法corr可选的方式有三种:1)pearson:相关系数来衡量两个数据集合是否在一条线上面,即针对线性数据的相关系数计算,针对非线性数据便会有误差。2)spearman:非线性的,非正太分析的数据的相关系数3)kendall:用于反映分类变量相关性的指标,即针对无序序列的相关系数,非正太分布的数据其中corr()函数的参数为空时,默认使用的参数为pearson上面的结果验证了,pearson对线性的预测较好,对于幂函数,预测差强人意。...https://blog.csdn.net/weixin_44361900/article/details/108696198?ops_request_misc=&request_id=&biz_id=102&utm_term=corr%EF%BC%88%EF%BC%89&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-108696198.nonecase&spm=1018.2226.3001.4187

具体代码如下:

# 代码3-9 餐饮销量数据相关性分析

# 餐饮销量数据相关性分析
from __future__ import print_function
import pandas as pd

catering_sale = 'D:\DataMiningCode\chapter3\demo\data\catering_sale_all.xls'  # 餐饮数据,含有其他属性
data = pd.read_excel(catering_sale, index_col = '日期')  # 读取数据,指定“日期”列为索引列

print(data.corr())  # 相关系数矩阵,即给出了任意两款菜式之间的相关系数,这里的corr方法是默认首先使用Pearson相关系数
print(data.corr()['百合酱蒸凤爪'])  # 只显示“百合酱蒸凤爪”与其他菜式的相关系数
print(data['百合酱蒸凤爪'].corr(data['翡翠蒸香茜饺']))# 计算“百合酱蒸凤爪”与“翡翠蒸香茜饺”的相关系数

 运行结果如下:

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

相关性分析 的相关文章

随机推荐

  • 图灵聊天机器人API1.0与API2.0的使用方法

    转 https blog csdn net www rsqdz net article details 79680461 https blog csdn net qq 42292831 article details 88677623 思维
  • 业内人员告诉你银行测试到底做什么,怎么进银行测试.....

    前言 从一家工作了五年的软件公司的测试管理者跳槽到银行做软件测试 短短两个月 对银行测试有了初步认识 总结和记录下来 加深个人的理解 同时也共享给各位 银行作为大家的理财顾问 对金钱非常敏感 频繁甚至偶尔出现的软件故障都会打击顾客的信心 如
  • SCDN如何有效防御CC攻击和DDOS攻击的

    SCDN是由阿里云提供的一整套安全加速的解决方案 可以根据业务需求去进行定制 在防护效果上 最低防护20gbps 300gbps 当然定制版的防护最高可达到600gbps 在网络上我们常见的网络攻击就是CC攻击和DDOS攻击了 那么CC攻击
  • 数据库基本操作(持续更新ing)

    SQL语句基本类型 CRUD 增加 Create 查询 Retrieve 更新 Update 删除 Delete 创建数据库 CREATE DATABASE 数据库名 删除数据库 DROP DATABASE 数据库名 切换数据库 USE 数
  • ArcGIS Runtime for Android天地图底图及TPK数据包放大后数据不显示问题

    环境 ArcGIS Runtime for Android版本 100 14 0 底图放大不显示的原因 在天地图url的配置中配置了更高level的url 但没有实际的数据 或url返回了 解决方法 不配置没有数据的level的url TP
  • 平稳过程的各态历经性

    平稳过程的各态历经性 1 各态历经的定义 2 例题 2 1 例1 2 2例2 3 各态历经性的判定 1 各态历经的定义 如果一个随机过程是平稳的 而且是均值和相关函数都具有各态历经性 那么我们称这个平稳过程具有各态历经性 均值各态历经的定义
  • Ubuntu ssh 访问服务器失败

    今天用ssh 登录交换机的时候发现访问不了 一直报no matching key exchange method found ccchw ccchw HP Compaq Elite 8300 CMT ssh ssh itte 10 163
  • K210图像检测&(1~8)数字卡片识别

    前言 第一次使用该平台 想先找一个简单的识别 来走走流程 就想到了 前几年的送药小车的数字卡片识别 花了半天收集标记图片 在运行时要注意摄像头与数字卡片的高度 不过也有些不足 可能是收集某个数字的训练集的时候 拍摄高度 不一致 因为是手拍
  • C++之引用类型,深浅拷贝构造

    引用类型 给内存段取别名 int m 10 引用 给内存段取别名 所以需要给他一段内存段 而不只是声明 int n m 不是赋值的意思 是别名的意思 想要在被调函数中修改主调函数中定义的变量的值时 不需要将其地址传输给被调函数 直接传输变量
  • IDEA 使用技巧(快速生成xml文件)

    settiings 搜索File 找到 File and Code Templates 点击加号新建一个 Name 输入文件名 Extension 输入文件类型
  • PCL 生成空间直线点云

    目录 一 算法原理 二 代码实现 三 结果展示 一 算法原理 已知直线上一点和直线的方向向量 即可根据数学原理生成用于算法测试的标准直线点云 以下示例代码中 以直线上一点为中心点生成空间直线点云 其中点的个数为100个 相邻点之间的间隔为0
  • 微信小程序的的图片显示不出来

    图片的路径分两种 1 本地的图片如images文件夹下面的 images t1 jpg 或者是http localhost 8080 Teacher news t1 jpg 2 网络连接的图片http www baidu com vue n
  • python自动化操作, 三种方法解决滑动模块问题(后二种可跳过90%滑动,限制需要打开浏览器)

    selenium win32api pyautogui 元素定位 可无头进行访问 但是会被检测 基本用不了 sli ele driver find element By XPATH span id nc 1 n1z xpath 定位 if
  • 人工智能电话机器人一个顶10个,各版本系统搭建

    前接触多的就是电销行业 有电话机器人 VOS线路问题或要演示站AI技术支持 一个人面对多台电话不停地接听 特别是客户多时不知道应答哪一个 反而还把自己搞得心烦意乱 不过随着科技的发展 电销行业里出现了一个叫智能电销机器人的产品 自动应答客户
  • Innovus零基础lab学习全面复盘总

    Innovus零基础lab学习全面复盘总结 附完整版pdf 文章右侧广告为官方硬广告 与吾爱IC社区无关 用户勿点 点击进去后出现任何损失与社区无关 为了让各位训练营学员更快入门数字 IC 后端 从第八期 IC 训练营开始 小编以一个 数字
  • chatgpt 上方一直在转圈 白屏 空白

    下面空白 上面有个转圈 清除缓存 进入https platform openai com 返回刷新 更换节点 退出 Clash 软件 返回刷新 白屏 空白 来回换节点 就是换节点 有的时候是v p n的问题
  • MongoDB安装部署

    一 mongodb安装部署 关闭防火墙和selinux root mongodb iptables F root mongodb setenforce 0 root mongodb systemctl stop firewalld 2 指定
  • hdu 3879 最大密集子图(点和边均带权)(模板)

    最大权闭合图 可以用最大密集子图来解速度更快复杂度低 题解 胡伯涛 最小割模型在信息学竞赛中的应用 点和边均带权的最大密集子图 s i 权为U 点权绝对值和 边的所有权值 i t 权为U 点的值 点的度 u v 权值为w 意思是选了v后可以
  • Mybatis-plus使用手册

    Mybatis plus 1 定义 MyBatis Plus 是一个 Mybatis 增强版工具 在 MyBatis 上扩充了其他功能没有改变其基本功能 为了简化开发提交效率而存在 2 使用 SpringBoot 集成 MyBatis Pl
  • 相关性分析

    这里的相关性分析主要是线性相关性分析 当然其他的形状的相关性分析可以通过变换转换为线性相关性分析 但是 线性相关性分析始终是相关性分析的基础 线性相关分析的构建主要分为以下几种 直接绘制散点图 通过把点标出来主观上看是否是线性相关 绘制散点