dplyr 和 tidyr：将长格式转换为宽格式并排列列

2024-01-08

我正在创建一个shiny app用户将在其中上传包含多个变量的 .csv 文件。使用dplyr，我会select前四个变量，如下所示，并将它们从长格式转换。

DATA

df <- read.table(text = c("
Customer    Rate    Factor  Power
W1  6   TK1 5
W2  3   TK1 0
W3  1   TK1 0
W4  2   TK1 0
W5  4   TK1 0
W6  8   TK1 0
W7  5   TK1 0
W8  7   TK1 3
W1  6   TK2 0
W2  3   TK2 1
W3  1   TK2 0
W4  2   TK2 5
W5  4   TK2 0
W6  8   TK2 0
W7  5   TK2 0
W8  7   TK2 3
W1  6   TK3 0
W2  3   TK3 5
W3  1   TK3 1
W4  2   TK3 0
W5  4   TK3 0
W6  8   TK3 0
W7  5   TK3 0
W8  7   TK3 0
W1  6   TK4 0
W2  3   TK4 3
W3  1   TK4 0
W4  2   TK4 0
W5  4   TK4 0
W6  8   TK4 0
W7  5   TK4 0
W8  7   TK4 0
W1  6   TK5 1
W2  3   TK5 0
W3  1   TK5 5
W4  2   TK5 0
W5  4   TK5 1
W6  8   TK5 0
W7  5   TK5 0
W8  7   TK5 0
W1  6   TK6 0
W2  3   TK6 0
W3  1   TK6 0
W4  2   TK6 0
W5  4   TK6 0
W6  8   TK6 0
W7  5   TK6 5
W8  7   TK6 0
W1  6   TK7 0
W2  3   TK7 0
W3  1   TK7 0
W4  2   TK7 0
W5  4   TK7 0
W6  8   TK7 3
W7  5   TK7 3
W8  7   TK7 0
W1  6   TK8 0
W2  3   TK8 0
W3  1   TK8 1
W4  2   TK8 0
W5  4   TK8 0
W6  8   TK8 3
W7  5   TK8 0
W8  7   TK8 0
W1  6   TK9 0
W2  3   TK9 0
W3  1   TK9 0
W4  2   TK9 0
W5  4   TK9 5
W6  8   TK9 0
W7  5   TK9 0
W8  7   TK9 0
W1  6   TK10    0
W2  3   TK10    0
W3  1   TK10    0
W4  2   TK10    0
W5  4   TK10    0
W6  8   TK10    5
W7  5   TK10    0
W8  7   TK10    0
W1  6   TK11    0
W2  3   TK11    0
W3  1   TK11    0
W4  2   TK11    0
W5  4   TK11    0
W6  8   TK11    0
W7  5   TK11    0
W8  7   TK11    3
W1  6   TK12    0
W2  3   TK12    0
W3  1   TK12    0
W4  2   TK12    0
W5  4   TK12    0
W6  8   TK12    0
W7  5   TK12    0
W8  7   TK12    5"), header = T)

我使用下面的代码将长格式转换为宽格式

从长到宽

library(dplyr)
library(tidyr)
df_wide <-  df %>%
  tidyr::spread(Factor, Power)

RESULT

> df_wide
  Customer Rate TK1 TK10 TK11 TK12 TK2 TK3 TK4 TK5 TK6 TK7 TK8 TK9
1       W1    6   5    0    0    0   0   0   0   1   0   0   0   0
2       W2    3   0    0    0    0   1   5   3   0   0   0   0   0
3       W3    1   0    0    0    0   0   1   0   5   0   0   1   0
4       W4    2   0    0    0    0   5   0   0   0   0   0   0   0
5       W5    4   0    0    0    0   0   0   0   1   0   0   0   5
6       W6    8   0    5    0    0   0   0   0   0   0   3   3   0
7       W7    5   0    0    0    0   0   0   0   0   5   3   0   0
8       W8    7   3    0    3    5   3   0   0   0   0   0   0   0

宽幅格式显示了Factor变量为TK1进而TK10

> levels(df$Factor)
 [1] "TK1"  "TK10" "TK11" "TK12" "TK2"  "TK3"  "TK4"  "TK5"  "TK6"  "TK7"  "TK8"  "TK9"

我希望 Factor 的级别从 TK1、TK2 到 TK12

我可以解决如下

df$Factor <- factor(df$Factor, levels = c("TK1", "TK2" , "TK3" , "TK4",  "TK5" , "TK6" , "TK7" , "TK8" , "TK9", "TK10", "TK11", "TK12"))

然而，因子变量的水平将是用户输入的函数。可能是 14、15 或 20。

QUESTION

有没有办法将 Factor 列的级别从最低到最高排列，而不管用户的输入如何？

我们可以将其更改为factor with levels指定的

df %>%
  mutate(Factor = factor(Factor, levels = paste0("TK", 1:12))) %>%
  spread(Factor, Power)

或者让它更有活力，我们extract将非数字和数字部分分成单独的列（“Factor1”、“Factor2”），将“Factor”更改为factor with levels由指定paste的序列min to max将“Factor2”中的值与“Factor1”中第一个字符值的值进行比较，删除“Factor1”和“Factor2”，并且spread.

library(tidyr)
res <- df %>%
         extract(Factor, into = c("Factor1", "Factor2"), "(\\D+)(\\d+)",
                                   remove = FALSE, convert=TRUE) %>% 
         mutate(Factor = factor(Factor, levels = paste0(Factor1[1], 
                              min(Factor2):max(Factor2)))) %>% 
         select(-Factor1, -Factor2) %>% 
         spread(Factor, Power)
head(res, 2)
#  Customer Rate TK1 TK2 TK3 TK4 TK5 TK6 TK7 TK8 TK9 TK10 TK11 TK12
#1       W1    6   5   0   0   0   1   0   0   0   0    0    0    0
#2       W2    3   0   1   5   3   0   0   0   0   0    0    0    0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tidyr

rfactor

dplyr 和 tidyr：将长格式转换为宽格式并排列列的相关文章

抑制 R 中的错误消息

我正在 R 中运行模拟研究有时我的模拟研究会产生错误消息当我在函数中实现模拟研究时当出现此错误消息时模拟停止我知道抑制错误是不好的做法但此时对我来说除了抑制错误然后继续下一个模拟直到达到我喜欢运行的模拟总数为止没有其他选择
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
Shiny可以识别用鼠标选择的文本（突出显示的文本）吗？

我需要用户将文本片段分配给 Shiny 中的类别或代码基本上我希望用户突出显示输出中的文本在下面的示例中来自table or text输出然后按一个按钮 code 并将选定的文本分配给应用程序内的对象在下面的应用程序中所选文
无法在 Document-Term-Matrix 中看到 `RTextTools::toLower()` 文本的结果

我尝试创建一个矩阵为此我想降低文本为此我使用此 R 指令 matrix create matrix tweets 1 toLower TRUE language english removeStopwords FALSE remove
从 R 到 C 处理列表并访问它

我想使用从 R 获得的 C 列表我意识到这个问题与此非常相似使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
使用 data.table 进行分组并选择最短日期

My Data df1 lt structure list ID c A A A B B C c1 1 6 c2 1 6 myDate c 01 01 2015 02 02 2014 03 01 2014 09 09 2009 10 10
jupyter 中的 r 图形 - 无法启动 png() 设备

我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
访问 R 工作区中的数据[重复]

这个问题在这里已经有答案了我是自学 R 的可能有一些非常基本的东西我可能不熟悉如果是这样我道歉我正在尝试访问外部来源提供给我的数据它作为一个工作空间出现我的流程如下 gt ls 1 2003OHT HR gt attach 20
聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac
为每个因素级别添加日期时间序列

我有一个带有因子列的数据框 s lt data frame id 901 910 s id lt as factor s id 我有一个日期时间序列 library lubridate start lt now as difftime 2
在`rmarkdown`中，如何在句子中添加图标？

In rmarkdown 如何在句子中添加图标例如如下如何添加markdown icon单词 Markdown 和 is 之间有一个很好的 R 包可以轻松下载 RMarkdown 文档并将图标添加到其中 icons https gi
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
RStudio 不会通过 rPython 调用加载所有 Python 模块

我从 Bash 和 RStudio 中运行相同的脚本时出现一些意外行为请考虑以下事项我有一个文件夹 rpython 包含两个脚本 test1 R library rPython setwd rpython python load tes
在 R 中使用逻辑 grep 抓取文本

下午好谢谢你帮我解答这个问题我有兴趣抓取一组超过 5000 个 URL 的列表我使用 lapply 和 readLines 使用下面的示例代码提取这些网页的文本 multipleURL lt c http dailymed nlm n

随机推荐

应该最终返回外部并且异常处理是否完美？

我不应该把这个方法的返回值放在finally中吗 Pylint 给出了这句话的错误 3 return statement in finally block may swallow exception lost exception def s
“ez_setup.py”语法错误

我尝试通过从命令行 64 位 Windows 机器运行 ez setup py 来安装 easy install 并在以下行中获取无效语法 except pkg resources VersionConflict e Python版本3
Linux 发行版上如何实现非 root 用户的 ping？

我正在浏览 ping 表单的代码iputils http www skbuff net iputils 适用于 Linux 的包我注意到ping 使用原始套接字 https sourceforge net p iputils code c
如何在 Java6 中禁用约束检查（Netscape 证书类型）？

我正在尝试使用内置类 com sun net httpserver HttpsServer 在 Java 6 中构建自定义 HTTPS 服务器它工作正常直到我需要客户端身份验证此时服务器上的 SSL 调试会失败并出现以下异常 sun
在sql Developer中执行异步存储过程

我想使用 Oracle SQL Developer 多次异步执行存储过程伪代码 var pStatus number var pOraErrCd varchar2 var pOraErrMsg varchar2 for i 1 1000
我如何将媒体控制器和缩略图集成到textureview android

我正在尝试在我的应用程序中的 recyclerview 适配器中创建一个视频播放选项我可以在textureview 中成功播放视频现在我正在尝试将媒体控制器和缩略图添加到textureview 视频中我尝试过谷歌搜索但我做不到请需要帮
我应该如何检测大型 C++ 项目中的编译时间瓶颈？

我想减少大型 C 项目的编译时间我尝试使用预编译头接口等但在继续之前我想知道是否有任何工具可以帮助检测编译时间为何如此长有人建议使用 pc lint 我会尝试一下我应该如何检测大型 C 项目中不必要的 include 文件 ht
Selenium 不加载重定向页面

我有一个工具可以加载网站填写信息并保存结果直到上周它都运行良好经过调试我发现原因是因为站点URL 变成了重定向重定向的顺序如下所示例如网站网址是google com google com google com someth
Mongoose 使用 $in 查找数组

Team find id in teamIds function err teamData console log teams name teamData 这段代码给了我们未定义的返回值但是在 var teamIds 中是这样的 5456
在 HTML 中选择输入和文本输入 - 使宽度相等的最佳方法？

我有一个像这样的简单表格仅用于说明目的
如何重构抛出异常的函数？

假设我正在重构这样的函数 def check ox Option Int Unit ox match case None gt throw new Exception X is missing case Some x if x lt 0 g
在多对多关系中使用 Doctrine QueryBuilder 进行 NOT IN 查询

在我的 Symfony2 项目中我有两个实体联系人和设置具有多对多关系 ORM ManyToMany targetEntity AppBundle Entity Settings cascade persist ORM JoinC
使用流来解密和解压缩以限制内存使用？

我有一个非常大的 zip 文件 2 5gb 它是加密的我无法将整个文件解密到内存中并解压缩以进行生产所以我尝试使用流来限制使用的内存量我已经连接了以下内容来执行此操作为了清楚起见省略了错误处理和流关闭 SecretKeySpec
Win 2008 r2 x64 服务器是否已安装 .net 3 sp1 软件包？

和标题一样吗我有一个带有上述操作系统的测试服务器我的应用程序基于 net 3 5 我确实想知道 win 2008 r2 是否附带 net 3 5 的 Service Pack 1 它是否附带 net 3 5 sp1 系列更新因为我下载
我无法在操作创建者文件中使用 useHistory 函数

我正在使用react router dom和redux 我在调度后使用history push 但它显示错误我希望用户在成功身份验证后导航到使用谷歌 export const googleLogin gt async dispatch
地址上方首次使用的单元格

我正在 Excel 中创建预算因此我有一些类别和子类别子类别与其各自的父类别相比有 1 个单元格子类别当然可以有自己的子类别在类别树旁边的列中我想打印类别路径 Let s say I have the following t
如何使用node.js生成excel文件？

您好我正在从数组中生成 excel 文件但我没有成功我正在使用 node js 工作并且使用 npm 包生成 excel 文件但我没有在 excel 文件中获取任何数据 excel 已生成但未在我的文件中获取任何类型的数据所以
当 RStudio 中的 ioslides 的 type=HTML 时，调整 stargarzer 表的大小

我刚开始使用 R Markdown 在 RStudio 中创建幻灯片演示文稿我无法在网上找到任何可以解决我的具体问题的内容这是close https stackoverflow com questions 15385696 how to
v8 中 Node.js 和 chrome 之间的区别

镀铬版本 49 0 2623 110 m 节点 v5 10 0 这是我的代码 var a 0 function this a 1 this b 2 console log a console log a console log b 铬给出
dplyr 和 tidyr：将长格式转换为宽格式并排列列

我正在创建一个shiny app用户将在其中上传包含多个变量的 csv 文件使用dplyr 我会select前四个变量如下所示并将它们从长格式转换 DATA df lt read table text c Customer Rate

dplyr 和 tidyr：将长格式转换为宽格式并排列列

dplyr 和 tidyr：将长格式转换为宽格式并排列列 的相关文章

随机推荐

热门标签

dplyr 和 tidyr：将长格式转换为宽格式并排列列的相关文章