在R中将长数据重塑为宽数据[重复]

2024-02-12

我正在尝试重塑 R 中的一些用户数据。我有一个会话 ID 的 data.frame。每个会话都有一个 User_ID 和日期。我想使用“User_ID”变量作为我的“密钥”，但仅限于“userType”为“新访客”的观察。因此，每个“新访客”将占一行。然后将每个后续会话 ID 作为单独的变量传递。例如，如果一个用户 ID 总共有 3 个会话 ID，则总共有 6 个变量：

例如，如果这是用户的数据框：

    date <- c('2015-01-01','2015-01-02','2015-01-02','2015-01-10')
    userID <- c('100105276','100105276','100105276','100105276')
    sessionID <- c('1452632119','1452634303','1452637067','1453600979')
    userType <- c('New Visitor','Returning Visitor','Returning Visitor','Returning Visitor')
    df <- cbind(date,userID,sessionID,userType)

相反，我想返回这个：

    userID      sessionID1  date1      SessionID2  date2      SesionID3 date3
    100105276   1452632119  2015-01-01 1452634303  2015-01-02 100105276 2015-01-02

如果存在没有后续 sessionID 的任何 userID，则在变量缺少值的情况下将传递“na”值。我已经阅读了有关使用 tidyr 或 reshape2 来执行此操作的信息，但我无法让它们完全执行我正在寻找的操作。

鉴于您的数据按以下顺序排序userID and sessionID，并且每一行都是一个唯一的会话，您可以执行以下操作：

library(data.table)

# Transform data into data.frame
df <- data.table(df)
df[, id := sequence(.N), by = c("userID")] # session sequence number per user

# Spread columns
reshape(df, timevar = "id", idvar = "userID", direction = "wide")
#     userID     date.1 sessionID.1  userType.1     date.2 sessionID.2        userType.2     date.3 sessionID.3        userType.3     
#1 100105276 2015-01-01  1452632119 New Visitor 2015-01-02  1452634303 Returning Visitor 2015-01-02  1452637067 Returning Visitor

在此输出中userType也作为变量包含在内，但之后您可以随时删除它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在R中将长数据重塑为宽数据[重复] 的相关文章

R 中的插补 MICE 仍不存在于数据集中

运行 MICE 包后 5 个完整插补集中的缺失值数量从 147428 减少到 46093 但不是应该是 0 NA 吗 Thanks 这是我的 MICR 代码 imp mice newdata imputationSet1 complete
r dplyr - 读取文件列表并使用文件名作为变量

我想用每个文件的名称替换 image annotate 下面的文本 library dplyr library purrr library magick list files path pattern png full names T g
当我创建新变量时出了什么问题？

我想根据原始变量施加的条件创建一个新变量比方说原始变量 var 是由 1 20 中的随机样本组成的向量并且当原来的 var 大于10时新变量 newvar 被设置为缺失当 var 小于10时新变量 newvar 被设置为等于
无法安装bigrf包

我在安装 bigrf R 软件包时遇到了一些极其令人沮丧的困难我已经尝试过以下方法 install packages bigrf repo https github com aloysius lim bigrf git type sour
如何在小插图中的同一 R 包中放置指向另一个小插图的链接

我有一个关于 Bioconductor 的包我正在向它添加第二个小插图我想将第二个小插图链接到第一个小插图因为一个小插图位于包的一般工作流程上第二个小插图用于针对更高级的用户的精细参数调整有没有一种干净的方法来做到这一点我发现的
查找表中第三个四分位数以上的频率

我有一个大数据框架对 57 个变量的超过 239k 观察值其中包含一些疾病描述以及针对不同年龄段的人针对这些疾病使用的药物我想在每种疾病描述的使用频率前四分之一中找到这些药物为了制作一个可重现的示例我创建了一个包含 1000 个观
加载 plyr 包时出现问题

我使用 R 2 13 1 但未能成功尝试在 R 中加载包 plyr 1 6 我已将其手动安装到目录 R library 中我的代码是 libPaths R library library plyr 我收到消息库 plyr 中的错误 pl
将一个数据框中的行（带有行名称）与另一个数据框中的匹配列名称相乘

我有两个数据框 df1 lt data frame Values c 0 01 0 05 row names c X Y df1 Values X 0 01 Y 0 05 df2 lt data frame c 0 1 1 c 1 0 0
Rshinyjsshinydashboard框在radionButtons输入上展开

基于这个问题Rshinyjsshinydashboard框在操作按钮输入时展开 https stackoverflow com questions 49659804 r shinyjs shinydashboard box uncollap
如果在循环中调用summary()命令，如何获得它的输出？

Suppose Z是特征名称的向量如何让以下 Rscript 中的摘要命令实际打印 for var in Z cat i form paste crim var lm fit lm form data Boston summary lm
获取非零数据的列意味着

R 可以获得数据帧非零值的 colMeans 吗 data lt data frame col1 c 1 0 1 0 3 3 col2 c 5 0 5 0 7 7 colMeans data 1 33 4 我想要这样的东西 mean dat
使用shinyjs通过javascript在闪亮的应用程序中操作现有的Leaflet地图

我有一个闪亮的应用程序其中包含现有的传单地图我希望能够在渲染后使用自定义 javascript 通过shinyjs包裹一个最小的例子如下 app R packages library dplyr library leaflet lib
使用 by 参数连接 data.table

我有两个数据表dx and dy dx lt data table a c 1 1 1 1 2 2 b 3 8 dy lt data table a c 1 1 2 c 7 9 我要参与dy到每一行dx 下面是所需的输出 data tabl
基于列重复数据集中的行，但增加行[重复]

这个问题在这里已经有答案了我有一个数据集其中包含项目名称开始年份和合同期限我需要将这个数据集开发成时间序列例如我的数据集中的一行是项目 A 开始年份 2003 年合同期限 5 我想根据合同期限重复每一行我的数据集如下所示
如何很好地注释 ggplot2（手册）

Using ggplot2我通常使用geom text和类似的东西position jitter注释我的情节然而对于一个漂亮的情节我经常发现手动注释是值得的像下面这样 data2 lt structure list type str
magrittr 管道中的 WOE

如何将下面的证据代码权重放入 magrittr 管道中 df gt 我尝试过的一切似乎都不起作用 df library Information library magrittr df a c aa bb cc aa aa aa bb cc
提取模型摘要并将其存储为新列

我是新来的purrr范例并正在努力解决它根据一些来源我已经设法嵌套一个数据框在嵌套数据上运行线性模型从每个 lm 中提取一些系数并为每个 lm 生成摘要我想做的最后一件事是从摘要中提取 r squared 我原以为这将是我想要实
在R中使用plotly在轴标题中换行和下标

我刚开始使用plotly对于 R 中的一些交互式散点图并且在轴标签上遇到困难通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们但这有时由于某种原因非常慢所以我想直接在中创建我的图plotly 我现在尝试更改轴标题
在另一列的字符串中搜索一列中的文本

这里是 R 新手一直在搜索此论坛尝试找到一种在同一行数据的字符串中搜索文本的方法我以前使用过 grepl 但无法让它向下查找列并对每一行应用检查我觉得这是一个简单的解决方案但我花了几个小时但似乎无法得到它基本上我有类似下面第
R + ggplot2 - 无法分配大小为 128.0 Mb 的向量

我有一个 4 5MB 9 223 136 行的文件其中包含以下信息 0 0 0 0147938 3 67598e 07 0 0226194 7 35196e 07 0 0283794 1 10279e 06 0 033576 1 470

随机推荐

如何让express从另一个上层目录提供静态文件？

如果我有一个具有以下文件夹结构的 Nodejs Express 应用程序 src client public css js views server server js 如何从 server js 文件中提供公共文件夹中的静态文件因为它位
Swift 可选 - 不一致？

我有点困惑我以为我理解Options 并且在Apple开发论坛Chris L上提到解决不可变Optional问题的方法是为可选值类型创建一个类包装器 link https devforums apple com message 99888
为什么方法重命名在 PHP 特征中不起作用？

我使用 PHP 7 1 0 假设我们有一个特征我们在类中使用它并重命名导入的方法 trait T public function A echo class C use T A as B c new C c gt B c gt A Why
如何修复 xcode 11 中的“IPA 处理失败”错误？

当我尝试使用分发应用程序选项创建 IPA 文件时它给出了 IPA 处理失败错误我检查过日志文件 IDEDistribution standard log file 2019 08 06 18 36 52 0000 警告配置问题
Android DrawerLayout - 没有重力抽屉视图

当我单击抽屉开关时出现以下异常 java lang IllegalArgumentException 没有重力抽屉视图左边这是我的activity drawer xml
从 Google Script 网站访问相机

我在访问相机时遇到问题谷歌脚本网站我努力了
简单的 Hibernate aliasToBean() 不起作用

以下代码对我不起作用 List results getSession createCriteria User class setProjection Projections projectionList add Projections pr
有意的缓冲区溢出并不总是导致程序崩溃

考虑以下最小 C 程序案例编号1 include
keydir 条目不会传播到authorized_keys

我正在尝试设置一个 gitolite 实例并遇到一个问题我按照通常的程序添加用户即将公钥文件添加到 keydir xxx pub 提交并推送到上游但后来我发现我无法使用我添加的密钥克隆存储库我已经验证我对 gitolite adm
将 Java 对象从一个 Struts 操作传递到另一个

在我的一个 Struts 操作中我在方法中包含以下代码 List retrievedListOfObjects c getListOfObjects return mapping findForward view fw view导致使用另
每次将 i 与 array.length 进行比较时，循环都会检查 array.length 吗？

我正在四处浏览然后我找到了这个 http net tutsplus com tutorials javascript ajax 24 javascript best practices for beginners var i len fo
编写 angular2 测试并更改模拟返回值 - 使其干燥？

我正在为服务编写一些测试并且正在更改模拟函数的响应以测试各种情况目前每次我想要更改模拟的响应时我都需要重置 TestBed 并再次配置测试模块将我的新模拟作为依赖项注入我觉得必须有一种更干燥的方式来编写这个规范但我无法弄清楚
使用Rhino的Javascript解析器，如何获取评论？

我有一些 javascript 文件并使用 Rhino 的 javascript 解析器解析它但我看不到评论我怎样才能得到评论这是我的代码的一部分运行此代码 comment 变量为空另外在运行 astRoot toSource
JavaScript 脚本仅在 Internet Explorer 开发人员工具栏可见时在 Internet Explorer 上运行

我的脚本可以在 Firefox 5 上运行但不能在 Internet Explorer 9 上运行当我刚打开Internet Explorer 开发人员工具栏 http en wikipedia org wiki Internet Ex
在 python 中保存依赖关系图

我在 python3 中使用斯坦福依赖解析器来解析一个句子它返回一个依赖图 import pickle from nltk parse stanford import StanfordDependencyParser parser Sta
Linux 内核 - 我可以在不同的函数中锁定和解锁 Spinlock 吗？

我是内核编程和锁编程的新手在不同的函数中锁定和解锁自旋锁是否安全我这样做是为了同步代码流另外在 schedule 中使用自旋锁锁定和解锁是否安全让调度程序等待获取锁是否安全提前致谢代替spinlock 你可以使用semap
移动 WordPress 站点后无法访问该站点

我使用的是 WordPress 后来我备份了所有数据和数据库将其移至另一台计算机上我将所有文件移入www目录在wamp服务器一切都很好但我遇到了一个错误登录数据库时出错所以在谷歌搜索后我更改了我的用户名数据库名称和密码wp c
查找最多 2 个不同位置的字符串邻居

给定一个种子字符串我想找到其邻居最多有 2 个位置不同生成字符串涉及的所有数字只有四位即0 1 2 3 这是我的意思的例子 In this example first column are neighbors with only 1
Android Studio：默认项目目录

每当我创建一个新项目时Android Studio它希望将其放在类似于以下位置的通用默认文件夹中取决于操作系统 Ubuntu home USER AndroidStudioProjects 我想将此目录更改为另一个位置除了在创建每个项目
在R中将长数据重塑为宽数据[重复]

这个问题在这里已经有答案了我正在尝试重塑 R 中的一些用户数据我有一个会话 ID 的 data frame 每个会话都有一个 User ID 和日期我想使用 User ID 变量作为我的密钥但仅限于 userType 为新访客

在R中将长数据重塑为宽数据[重复]

在R中将长数据重塑为宽数据[重复] 的相关文章

随机推荐

热门标签