R语言实战笔记 基本统计分析-相关

2023-11-14

相关

相关系数可以用来描述定量变量之间的关系。
将使用R基础安装中的state.x77数据集,提供了美国50个州在1977年的人口、收入、文盲率、预期寿命、谋杀率和高中毕业率数据等。
数据如下:

在这里插入图片描述

相关的类型

Pearson、Spearman和Kendall相关:

可以用cor(x, use= , method= )函数计算三种相关系数。而cov()函数可用来计算协方差。

cor和cov的参数

x:矩阵或数据框

use:指定缺失数据的处理方式。可选的方式为all.obs(假设不存在缺失数据——遇到缺失数据时将报错)、everything(遇到缺失数据时,相关系数的计算结果将被设为missing)、complete.obs(行删除)以及pairwise.complete.obs(成对删除,pairwise deletion)

method:指定相关系数的类型。可选类型为pearson、spearman或kendall。

> states<-state.x77[,1:6]
> cov(states)
> cor(states)
> cor(states,method = "spearman")

在这里插入图片描述

cov()计算了方差和协方差

第一个cor()计算了Pearson积差相关系数

第二个cor()计算了Spearman登记相关系数(可以看到收入和高中毕业率之间存在很强的正相关,而文盲率和预期寿命之间存在很强的负相关)

默认情况下得到的结果是一个方阵。你同样可以计算非方形的相关矩阵。

> x<-states[,c("Population","Income","Illiteracy","HS Grad")]
> y<-states[,c("Life Exp","Murder")]
> cor(x,y)

在这里插入图片描述

偏相关

偏相关是指在控制一个或多个定量变量时,另外两个定量变量之间的相互关系。

函数格式:pcor(u , s)

u是一个数值向量,前两个数值表示要计算相关系数的变量下标,其余的数值为条件变量(即要排除影响的变量)的下标。
S为变量的协方差阵。

> library(ggm)
> colnames(states)
> pcor(c(1,5,2,3,6),cov(states))

在这里插入图片描述

在控制了收入、文盲率和高中毕业率的影响时,人口和谋杀率之间的相关系数为0.346。偏相关系数常用于社会科学的研究中。

其他类型的相关

polycor 包中的 hetcor() 函数可以计算一种混合的相关矩阵,其中包括数值型变量的Pearson积差相关系数、数值型变量和有序变量之间的多系列相关系数、有序变量之间的多分格相关系数以及二分变量之间的四分相关系数。

相关性的显著性检验

在计算好相关系数后,要进行统计显著性检验。
常用原假设为变量间不相关(即总体的相关系数为0)。

  • cor.test(x, y, alternative = , method = )

cor.test(x, y, alternative = , method = )对单个的Pearson、Spearman和Kendall相关系数进行检验。

x和y:要检验相关性的变量;

alternative:用来指定进行双侧检验或单侧检验(“two.side”、“less”、“greater”);

method:用以指定要计算的相关类型(“pearson”、“kendall”、“spearman”);

> cor.test(states[,3],states[,5])

在这里插入图片描述

检验了预期寿命和谋杀率的Pearson相关系数为0的原假设。在一千万次中只会有少于一次的机会见到0.703这样大的样本相关度(即p=1.258e–08)。拒绝原假设。即预期寿命和
谋杀率之间的总体相关度不为0。

  • corr.test()

corr.test()函数可以计算相关矩阵和显著性水平。

use= 的取值可为 “pairwise” 或 “complete” (分别表示对缺失值执行成对删除或行删除)。

method= 的取值可为 “pearson” (默认值)、 “spearman” 或 “kendall”

> library(psych)
> corr.test(states,use="complete")

在这里插入图片描述
这里可以看到,人口数量和高中毕业率的相关系数(–0.10)并不显著地不为0(p=0.5)。

其他显著性检验
  • pcor.test(r, q, n)

psych包中的pcor.test(r, q, n)函数可以用来检验在控制一个或多个额外变量时两个变量之间的条件独立性。

r是由pcor()函数计算得到的偏相关系数

q是要控制的变量数(用数值表示位置)

n为样本大小

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R语言实战笔记 基本统计分析-相关 的相关文章

  • ess-rdired:我收到此错误“现在没有 ESS 进程与此缓冲区关联”

    To use ess rdired为了浏览对象 我按照 ESS 手册并将以下内容添加到我的 emacs autoload ess rdired ess rdired View R objects in a dired like buffer
  • 将文件夹中的多个 csv 文件读取到 R 中的单个数据帧中[重复]

    这个问题在这里已经有答案了 我有一个包含 332 个 csv 文件的文件夹 文件名称如下 001 csv 002 csv 003 csv 330 csv 331 csv 332 csv 所有文件都具有相同数量的变量和相同的格式 我需要读取一
  • R中无法连接odbc数据库

    我一直在尝试使用以下命令将我公司的 DMS 连接到 RodbcConnect命令 但收到以下消息 myConn lt odbcConnect NZSQL uid cejacobson pwd password Warning message
  • 配置 fix() 和 edit() 以从 R/RStudio 在 Notepad++ 中打开

    当我在 RStudio 或 RGUI 中执行此操作时 fix SomeFunction 或使用edit 我可以在记事本中看到该函数的代码 有什么方法可以更改此设置 以便代码预览在 Notepad 中打开 而不是在普通的旧记事本中打开 同样
  • 使用 2 个向量参数翻转函数

    我想对需要 2 个向量参数的函数应用滚动 这是使用 data table 的示例 不起作用 library data table df lt as data table cbind data frame x 1 100 y 101 200
  • 从受密码保护的站点读取信息

    我一直在 R 教程中使用 readLines 从网站上抓取信息 我现在希望从我自己的网站提取数据 特别是 awstats 数据 但是该域受密码保护 有没有一种方法可以通过用户名和密码传递我需要的特定 awstats 数据的 url url
  • ggsubplot 是否适用于 R 3.2.1+?

    CRAN 提供的 ggsubplot 版本与 R 的最新版本 例如 3 1 1 不兼容 运行 ggsubplot 示例会返回以下错误 Error in layout base data vars drop drop At least one
  • 正则表达式提取美国邮政编码,但不提取假代码

    使用 XML 包和 XPath 从网站上抓取地址 有时我只能得到一个嵌入了我想要的邮政编码的字符串 提取邮政编码很简单 但有时会显示其他五位数字的字符串 以下是 df 中问题的一些变体 zips lt data frame id seq 1
  • 行方向变异的有效方法

    我有两个数据框 dfUsers and purchases使用以下代码生成 set seed 1 library data table dfUsers lt data table user letters 1 5 startDate sam
  • R正则表达式获取第二个下划线之前的所有文本

    s lt 1 343 43Hello 2 323 14 fdh 99H 在 R 中 我想使用正则表达式来获取第二个下划线之前的子字符串 如何使用一个正则表达式来完成此操作 另一种方法是用 分割 然后粘贴前两个 一些东西 paste sapp
  • 使用神经网络包进行多项分类

    这个问题应该很简单 但文档没有帮助 我正在使用 R 我必须使用neuralnet多项式分类问题的包 所有示例均针对二项式或线性输出 我可以使用二项式输出进行一些一对一的实现 但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点 其中
  • 使用faceting()时如何连接geom_point()和geom_line?

    我有一个问题 但我在互联网上没有找到任何相关信息 我很高兴得到一些提示 我有一个数据集 其中 x 轴是离散的 但我想将这些点相互连接 我可以做到 我的问题是当我添加分面选项时 我无法再将这些点相互链接起来 我找到了一个替代方案 但看起来不太
  • Shiny:从DT数据表中选定的行获取信息

    我们正在尝试重新创建示例 https demo shinyapps io 029 row selection https demo shinyapps io 029 row selection 使用DT包来渲染数据帧而不是shiny包 DT
  • R,igraph,是否可以用图案填充顶点

    使用 R 和 igraph 绘制图形 我使用颜色来标记顶点类型 请参阅下面的代码 是否可以用图案而不是颜色填充顶点 以便在以彩色和黑白查看时可以区分节点类型 我需要 4 种独特的颜色 图案 colorbrewer 中唯一适合的调色板是这个
  • 在ggplot2中,箱线图线的末尾代表什么?

    我找不到箱线图线条端点代表什么的描述 For example here are point values above and below where the lines end 我意识到盒子的顶部和底部是第 25 个和第 75 个百分位数
  • 在zooreg时间序列中查找非唯一索引条目时遇到问题

    我有几年的数据正在尝试将其转化为动物园对象 Dropbox 上的 csv https www dropbox com sh vg8w8pt16e0v3xs AABKtWqDkPu9JVKpwBXO36VOa dl 0 一旦数据被强制转换为动
  • 基本 dyplr 函数给出错误:“check_dots_used”

    试图找出为什么我会收到此错误 以前从未见过 谷歌没有帮助 check dots used action warn 中的错误 未使用参数 action warn 我在下面的非常基本的试验中收到错误 而且在 group by count 中也收
  • R ggplot2 分面保持比率但覆盖/定义输出图大小

    我目前正在使用 ggplot2 来比较不同组的统计数据 每个组属于不同的区域 这是通过运行 R 脚本的 Web 应用程序 tikiwiki CMS 插件 R 完成的 每个区域我可以有 2 到 30 个或更多组 相同的 R 脚本针对唯一网页中
  • ggplot2 中的中心图标题

    这个简单的代码 以及今天早上我的所有脚本 已经开始在 ggplot2 中给我一个偏离中心的标题 Ubuntu version 16 04 R studio version Version 0 99 896 R version 3 3 2 G
  • R中data.frame(列表)的列平均值

    Data https i stack imgur com ZYsmv jpg 请 我需要计算此 data frame 中维吉尼亚币 Sepal Length 列的平均值 Sepal Length Sepal Width Petal Leng

随机推荐

  • Spring框架(IOC)

    一 什么是 IOC 1 控制反转 把对象创建和对象之间的调用过程 交给 Spring 进行管理 2 使用 IOC 目的 为了耦合度降低 二 IOC 底层原理 xml 解析 工厂模式 反射 三 IOC过程 xml解析帮助我们得到xml文件中我
  • Windows下zerotier托盘程序 DesktopUI 编译步骤

    Windows下面zerotier托盘程序 DesktopUI 编译步骤 1 安装windows下的 gcc make cargo 工具 2 下载源码 https github com zerotier DesktopUI git 3 cd
  • 命令行下使用CL.exe编译多cpp文件工程

    一 CL exe是控制 Microsoft C 和 C 编译器与链接器的 32 位工具 编译器产生通用对象文件格式 COFF 对象 obj 文件 链接器产生可执行文件 exe 或动态链接库文件 DLL 用法如下 注意 所有编译器选项都区分大
  • [Git专题] 环境搭建

    环境搭建 在正式使用 Git 之前 首先应当安装 Git 并完成一些基础配置 本章内容就教大家在 Ubuntu 和 CentOS 上安装 Git 的方法 安装 Git 客户端 如果你使用的是基于 Debian 的 Linux 发行版本 那么
  • SpringBoot+redis RedisTemplate/jedis 配置多个数据源 灵活切库 选择库

    目录 1 这里也介绍两种方式 一种是redis的 RedisTemplate 另一种是jedis 大家需要哪一种 自己选择 2 这里先说redis 的 RedisTemplate 1 加入依赖并在在yml 文件里面加入配置 2 添加配置文件
  • 推荐106个软件工程本科的计算机毕业设计,有手就会

    对于即将面临毕业设计的计算机专业学生来说 如何选题和成功完成项目是一个艰难的问题 今天 我们将与大四的学生分享一些毕业设计项目 希望能为你提供一些帮助 一 成品列表 以下所有springboot框架项目的源码博主已经打包好上传到百du云了
  • Java操作Excel - Easy Excel

    一 介绍 官网 https easyexcel opensource alibaba com EasyExcel是阿里巴巴开源的 一个基于Java的 快速 简洁 解决大文件内存溢出的Excel处理工具 他能让你在不用考虑性能 内存的等因素的
  • 抖音跳微信小程序(抖音分享卡片和链接)图文教程

    序 1 本博文参考一下资料 获取接口调用凭据 微信开放文档 获取scheme码 微信开放文档 获取授权帐号调用令牌 微信开放文档 用H5打开微信小程序 weixin 46746389的博客 CSDN博客 2 注意 只能是企业认证的小程序才可
  • Vue面试系列之十:watch和computed的区别以及怎么选用

    1 区别 1 1 定义 语义区别 watch
  • 函数模板与普通函数的区别

    函数模板与普通函数的区别 1 普通函数调用时可以发生自动类型转换 隐式转换 2 函数模板调用时 如果利用自动类型推导 不会发生隐式类型转换 3 如果利用显示指定类型的方式 可以发生隐式类型转换 代码示例 include
  • Java物联网方向_物联网专业课程安排——未来主要方向之一

    课程1 物联网产业与技术导论 使用电子工业出版社 物联网 技术 应用 标准 安全与商业模式 等等教材 在学完高等数学 物理 化学 通信原理 数字电路 计算机原理 程序设计原理等课程后开设本课程 全面了解物联网之RFID M2M 传感网 两化
  • 关于加法溢出问题

    开个题目 关于加法溢出问题 以后想到什么情况就在这里更新吧 1 freeRTOS 的时钟节拍函数 要实现一个定时任务A 当前时钟节拍计数器xTickCount 需要延时的时钟节拍 delayTick 延时的时钟节拍时间点tickTime 由
  • 05智慧杆塔

    一张图读懂一个产业之智慧杆塔 智慧杆塔是综合承载多种设备和传感器并具备智慧能力的杆 塔等设施的总称 包括但不限于通信杆 塔 路灯杆和监控杆 智慧杆塔具备的功能由其挂载的设备和传感器决定 这些设备和传感器可通过各种通信技术接入网络和平台 并在
  • R语言实用教程薛毅清华出版社课后题答案

    有R语言实用教程薛毅课后题答案习题1 5 详情请到我的页面资源查看
  • NVMe Cli 使用教程 -- NVMe Read / Write 使用实践

    1 NVMe Write Write命令的官方说明 nvme write
  • C Primer Plus 第五章 编程练习

    第五章 编程练习 5 1 题 目 编写一个程序 把用分钟的时间转换用小时和分钟表示的时间 使用 define或者const创建一个表示60的符号常量或const变量 通过while循环让用户重复输入值 直到用户输入小于或者等于0 的值才停止
  • 网络安全工程师

    岗位职责 1 分析网络现状 对网络系统进行安全评估和安全加固 设计安全的网络解决方案 2 在出现网络攻击或安全事件时 提高服务 帮助用户恢复系统及调查取证 3 针对客户网络架构 建议合理 的网络安全解决方案 4 负责协调解决方案的客户化实施
  • CISSP-安全和风险管理

    俗话说什么是网络安全 那网络安全的基本原则有哪些呢 主要是有可用性 保密性 完整性 1 那什么是可用性 可用性的话 那就是在我们的数据和资源需要随时保持能够授权用户进行访问 用户想要访问想要用的时候 你就应该能用 而不是不能用 2 那什么是
  • Vijava 学习笔记之 DataStore(基础配置信息)

    vijava 代码 实体类 package com vmware pojo import java util ArrayList import java util Calendar 存储信息 author zhb public class
  • R语言实战笔记 基本统计分析-相关

    相关 相关系数可以用来描述定量变量之间的关系 将使用R基础安装中的state x77数据集 提供了美国50个州在1977年的人口 收入 文盲率 预期寿命 谋杀率和高中毕业率数据等 数据如下 相关的类型 Pearson Spearman和Ke