R语言tidyr包的详解

2023-11-13

tidyr用于数据处理，可以实现数据长格式和宽格式之间的相互转换，这里所指的长格式数据就是一个观测对象由多行组成，而宽数据格式则是一个观测仅由一行组成。除此之外，tidyr还可以对数据进行拆分和合并，同时也能够对缺失值进行简单的处理。tidyr的转换函数gather（宽到长）和spread（长到宽）所需参数少，逻辑上更易理解，自始至终都围绕着data，key、value三个参数来进行设定，对比其它R语言长宽格式互换的实现方式，个人认为tidyr操作性还是比较突出的。

1. gather实现wide 到 long 转换

tidyr中的gather函数类似于reshape2中的melt函数，可实现将宽格式数据转换为长数据格式。

gather(data, key, value, ..., na.rm = FALSE, convert = FALSE, factor_key = FALSE)

data：需要被转换的宽形data.frame
key：将原数据框中的所有列赋给一个新变量key
value：将原数据框中的所有值赋给一个新变量value
…：可以指定哪些列聚到同一列中，可用于选择两列之间的所有列col1:coln, 排除列-coln
na.rm：是否删除缺失值，默认为FALSE不删除
convert：为TRUE时会自动在key列上使用type.convert函数，默认值为FALSE
factor_key：FALSE时key值为字符向量，TRUE时key值为factor类型
require(tidyr)
#将mtcars的所有列聚合成两列
gather(mtcars, attr, value)
#聚合mpg和gear之间的列
gather(mtcars, attr, value, mpg:gear)
#仅聚合mpg和wt变量，其余变量保持不变
gather(mtcars, attr, value, mpg, wt)
require(dplyr)
#添加car列到mtcars中
mtcars$car <- rownames(mtcars)
#除了car列，将mtcars的所有列聚合成两列
gather(mtcars, attr, value, -car)
mtcars %>% gather(attr, value, -car)
#聚合mpg和gear之前的列
mtcars %>% gather(attr, value, mpg:gear)
mtcars %>% gather(mpg:gear, key = "attr", value = "value")
#仅聚合gear和carb变量，其余变量保持不变
mtcars %>% gather(attr ,value ,gear ,carb)
mtcars %>% gather(gear ,carb ,key = "attr", value = "value")
2. spread实现long 到wide转换

tidyr中的spread函数类似于reshape2中的cast函数，可实现将长格式数据转换为宽数据格式。

spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE, sep = NULL)

data：为需要转换的长形data.frame
key：设置需要扩宽的类别变量
value：设置需要扩宽的变量的度量值
fill：对于缺失值，可将fill的值赋值给被转型后的缺失值
convert：为TRUE时会自动在新列上使用type.convert函数，其中as.is = TRUE，默认值为FALSE
drop: 为FALSE保留factor的level，使用fill的值填充missing的值
sep：为默认值NULL时，新列名使用key中的值，非NULL时，新列名为<key_name><sep><key_value>
require(dplyr)
mtcars$car <- rownames(mtcars)
longformat <- gather(mtcars, attr, value, -car)
#还原长格式为原宽格式数据
spread(longformat, attr, value)
longformat %>% spread(attr, value)
#设置sep，新的列名为<key_name><sep><key_value>的形式
spread(longformat, attr, value, sep = '|')
#还原长格式为原宽格式数据，car列的值转换为每一个列
spread(longformat, car, value)
longformat %>% spread(car, value)
df <- data.frame(x = c("a", "b"), y = c(3, 4), z = c(5, 6))
#转换为宽格式再转换为长格式，实际还原为原df，只是变量顺序不同
df %>% spread(x, y) %>% gather(x, y, a:b, na.rm = TRUE)
df <- data.frame(row = rep(c(1, 51), each = 3),
var = c("Sepal.Length", "Species", "Species_num"),
value = c(5.1, "setosa", 1, 7.0, "versicolor", 2))
#对于混合类型的value列，默认convert = FALSE，转换的新列为factor类型
df %>% spread(var, value)
#设置convert = TRUE，保留原类型
df %>% spread(var, value, convert = TRUE)
————————————————
版权声明：本文为CSDN博主「Kingsley_W」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/wltom1985/article/details/107902563

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R语言

开发语言

R语言tidyr包的详解的相关文章

基于java的物资管理系统设计与实现

基于java的物资管理系统设计与实现 I 引言 A 研究背景和动机基于Java的物资管理系统设计与实现的研究背景和动机在于提高物资管理系统的效率和质量使得物资管理系统更加便捷快速准确从而提高物资管理的水平该系统的设计和实现主要围
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
华为OD机试 Java 【计算文件大小】

题目一个电脑文件夹系统每个文件夹里都有一些文件和可能还有其他子文件夹给定所有文件夹的大小和子文件夹列表你的任务是找出某一个文件夹及其所有子文件夹里的文件总大小输入格式首行有两个数字文件夹的总数M和你要查询的文件夹ID N 之后
Android Navigation的四大要点你都知道吗？

在JetPack中有一个组件是Navigation 顾名思义它是一个页面导航组件相对于其他的第三方导航不同的是它是专门为Fragment的页面管理所设计的它对于单个Activity的App来说非常有用因为以一个Activity为架构
面试官随便问几个问题就知道你究竟做没做过微信支付宝支付

面试官随便问几个问题就知道你究竟做没做过微信支付宝支付你知道直连模式和服务商模式吗网上的课程一般给你演示的都是直连模式而企业中有不少是申请成为了服务商因为里面有佣金提成我粗俗地解释直连模式就是说你是一个会做生意的老板自己会搞
Hutool改变我们的coding方式(二)

Hutool改变我们的coding方式 Hutool 简介 Hutool如何改变我们的coding方式文档安装 Maven
计算机Java项目｜尤文图斯足球俱乐部网上商城系统

作者简介 Java领域优质创作者 CSDN博客专家 CSDN内容合伙人掘金特邀作者阿里云博客专家 51CTO特邀作者多年架构师设计经验腾讯课堂常驻讲师主要内容 Java项目 Python项目前端项目人工智能与大数据简历模板
【go语言】结构体数据填充生成md错误码文件

这里使用pongo2这个模版引擎库进行md文件渲染 GitHub flosch pongo2 Django syntax like template engine for Go package main import fmt github
【路径规划】基于改进遗传算法求解机器人栅格地图路径规划（Matlab实现实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
初学者如何快速入门Python（内附详细攻略），一文讲清

目前python可以说是一门非常火爆的编程语言应用范围也非常的广泛工资也挺高未来发展也极好 Python究竟应该怎么学呢我自己最初也是从零基础开始学习Python的给大家分享Python的学习思路和方法一味的买书看书看视频是
【路径规划】基于改进遗传算法求解机器人栅格地图路径规划（Matlab实现实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
在 Python 中实现 List 抽象

在 Python 中创建一个包含多个对象的 list 很常见例如对于一组具有相同功能的对象比如播放声音希望能够使用类似 my list play 的语法来触发 list 中所有对象的 play 方法另一个例子是当希望关闭 li
Java开发中不要使用受检异常

简介 Java是唯一主流实现了受检异常概念的编程语言一开始受检异常就是争议的焦点在当时被视为一种创新概念 Java于1996年推出如今却被视不良实践本文要讨论Java中非受检异常和受检异常的动机以及它们优缺点与大多数关注这个
计算机Java项目｜人体健康信息管理系统

作者简介 Java领域优质创作者 CSDN博客专家 CSDN内容合伙人掘金特邀作者阿里云博客专家 51CTO特邀作者多年架构师设计经验腾讯课堂常驻讲师主要内容 Java项目 Python项目前端项目人工智能与大数据简历模板
Java进阶之旅第七天

Java进阶之旅第七天文章目录 Java进阶之旅第七天方法引用介绍代码展示结果方法引用的分类

随机推荐

SpringCloud——网关Gateway

文章目录六统一网关 Gateway 6 1 网关介绍 6 2 快速搭建网关 6 3 断言工厂 6 4 过滤器工厂 6 5 全局过滤器 GlobalFIlter 6 6 过滤器的执行顺序 6 7 跨域问题六统一网关 Gateway 6
C编写的程序可能产生的主要缺陷

摘自软件静态分析工具评析王凯孔祥营空指针引用悬空指针资源泄露函数返回值使用未初始化变量无限循环死亡代码缓冲区溢出野指针等 1 空指针引用空指针引用会导致程序崩溃空指针引用的情况包括忘记对指针为NULL 的情况
java入门四：数组

1 数组概述数组是最简单的数据结构是相同类型数据的有序集合数组描述的是相同类型的若干个数据按照一定的先后次序排列组合而成的数组中每一个数据称作一个数组元素每个数组元素可以通过一个下标来访问他们 2 数组的声明创建首先必须声明
分享解决jar包冲突问题的方法：(看了这个你就能解决所有包冲突问题！)

1 问题描述 maven eclipse环境 1 1 昨晚发布这个新功能接入notify消息中间件预发失败报 nested exception is java lang NoSuchMethodError org springfram
Go函数--匿名函数与闭包

0 匿名函数概念 Go语言提供两种函数有名函数和匿名函数所谓匿名函数就是没有函数名的函数匿名函数没有函数名只有函数体它和有名函数的最大区别是我们可以在函数内部定义匿名函数形成类似嵌套的效果匿名函数常用于实现回调函数闭包等
is服务器虚拟目录,Tomcat虚拟目录配置

1 编辑server文件 x tomcat conf server xml 2 只要在server xml文件中加入如下代码即可注意在server xml中此语句 unpackWARs true autoDeploy true xml
数据库：sql 递归

mysql 自关联表以下为向下递归以及向上递归样例 1 递归查询前期准备如果你的表已经存在可忽略此步建表 CREATE TABLE wq areainfo id int 11 NOT null AUTO INCREMENT leve
服务器A拷贝文件到服务器B

命令格式如下 scp 要拷贝的文件名服务器B的用户名 IP 服务器B要存放的路径拷贝文件如 scp install log root 192 168 33 111 home 或 scp install log 192 168 33 1
Docker是什么？

一概述 Docker是一个用于开发交付和运行应用程序的开放平台 Docker使您能够将应用程序与基础架构分离从而实现快速交付软件借助Docker 您可以以与管理应用程序相同的方式来管理基础架构通过利用Docker快速交付测试和部
python生成微信个性签名的词云图

需要用到的库 itchat jieba numpy wordcloud import itchat import re import jieba import matplotlib pyplot as plt import PIL Imag
企业运维

欢迎关注全栈工程师修炼指南公众号设为星标每天带你基础入门到进阶实践再到放弃学习专注企业运维实践网络安全系统运维应用开发物联网实战全栈文章等知识分享花开堪折直须折莫待无花空折枝作者主页 https w
QT控件之（QLabel）中加载了图片想清除掉

这个时候直接在你加载图片的那个label中使用如下代码清除label中加载过来的图片 label clear qt学习推荐百度云盘链接 https pan baidu com s 11b634VvKMIsGdahyBLpZ3Q 提取码
远程调试Android/IOS设备/微信网页方法汇总

以下汇总现在可远程调试手机网页的几个方法基本上官方都有详细的说明文档可移步至相关网站查看这里就不赘述使用操作方法了微信web开发者工具 PC客户端官方说明文档支持Windows和Mac系统支持调试Android和IOS设备
原生 fetch 请求 fetch和ajax的区别

比如请求一个json文件 async function 请求 let res fetch data1 json 解析内容 let data await res json 获取到json 文件 console log data 比如请求一个图
NG4+NG-ZORRO搭建项目

一安装Nodejs Angular CLI 安装nodejs node官网下载安装即可安装完成后查看版本信息 npm v npm install g angular cli 下载Angular CLI 查看Angular CLI的安装结
【正点原子STM32连载】第四十二章 FLASH模拟EEPROM实验摘自【正点原子】MiniPro STM32H750 开发指南_V1.1

1 实验平台正点原子MiniPro H750开发板 2 平台购买地址 https detail tmall com item htm id 677017430560 3 全套实验源码手册视频下载地址 http www openedv
使用Encoder-Decoder模型自动生成对联的思路

版权声明可以任意转载转载时请标明文章原始出处和作者信息 author 张俊林在我看到第一篇Encoder Decoder模型的论文的时候我就觉得用这个来作对联自动生成是再合适不过的了做诗词应该也是比较适合的但是相对诗词用它来做
Linux wget下载指定目录及重命名

Linux系统wget下载指定目录及重命名假设目录为 happy page 假设下载网址为 http www baidu com 假设下载文件的原始文件名为 baidu html 1 指定下载目录 wget P happy page ht
PCL-获取点云体素中的所有点的索引的方法

使用 octree 将点云体素化之后获取体素中所有点的方法即OctreeContainerBase中的三个方法的介绍 getPointIndex getPointIndicesVector getPointIndices 这三个方法都是
R语言tidyr包的详解

tidyr用于数据处理可以实现数据长格式和宽格式之间的相互转换这里所指的长格式数据就是一个观测对象由多行组成而宽数据格式则是一个观测仅由一行组成除此之外 tidyr还可以对数据进行拆分和合并同时也能够对缺失值进行简单的处理 tid

R语言tidyr包的详解

R语言tidyr包的详解 的相关文章

随机推荐

热门标签

R语言tidyr包的详解的相关文章