R 中多个变量的分组

2024-03-01

我是一名强大的 excel 数据透视表用户，正在强迫自己学习 R。我确切地知道如何在 excel 中进行此分析，但无法找出在 R 中进行编码的正确方法。

我试图按两个不同的变量对用户数据进行分组，同时将变量分组到范围（或箱）中，然后汇总其他变量。

数据如下：

userid  visits  posts   revenue
1       25      0       25
2       2       2       0
3       86      7       8
4       128     24      94
5       30      5       18
…       …       …        …
280000  80      10      100
280001  42      4       25
280002  31      8       17

这是我试图让输出看起来像这样：

VisitRange  PostRange   # of Users  Total Revenue   Average Revenue
0           0           X            Y              Z
1-10        0           X   Y   Z
11-20       0           X   Y   Z
21-30       0           X   Y   Z
31-40       0           X   Y   Z
41-50       0           X   Y   Z
> 50        0           X   Y   Z
0           1-10        X            Y              Z
1-10        1-10        X            Y              Z
11-20       1-10        X            Y              Z
21-30       1-10        X            Y              Z
31-40       1-10        X            Y              Z
41-50       1-10        X            Y              Z
> 50        1-10        X            Y              Z

想要按访问量和发帖数按 10 分组到一定级别，然后将高于 50 的任何内容分组为“> 51”

我已经将 tapply 和 ddply 视为实现此目的的方法，但我认为它们不会按照我期望的方式工作，但我可能是错的。

最后，我知道我可以在 SQL 中使用 if/then 语句来确定访问范围和帖子范围（例如 - 如果访问次数在 1 到 10 之间，则为“1-10”），然后只需分组访问范围和发布范围，但我的目标是开始强迫自己使用 R。也许 R 在这里不是正确的工具，但我认为它是......

所有帮助将不胜感激。提前致谢。

成语中的plyr包装和ddply特别是，它与 Excel 中的数据透视表非常相似。

在您的示例中，您唯一需要做的就是cut在传递到之前，将变量分组到所需的中断中ddply。这是一个例子：

首先，创建一些示例数据：

set.seed(1)
dat <- data.frame(
  userid = 1:500,
  visits =sample(0:50, 500, replace=TRUE),
  posts = sample(0:50, 500, replace=TRUE),
  revenue = sample(1:100, replace=TRUE)
  )

现在，使用cut将分组变量划分为所需的范围：

dat$PostRange <- cut(dat$posts, breaks=seq(0, 50, 10), include.lowest=TRUE)
dat$VisitRange <- cut(dat$visits, breaks=seq(0, 50, 10), include.lowest=TRUE)

最后，使用ddply with summarise:

library(plyr)
ddply(dat, .(VisitRange, PostRange), 
      summarise, 
      Users=length(userid), 
      `Total Revenue`=sum(revenue), 
      `Average Revenue`=mean(revenue))

结果：

   VisitRange PostRange Users Total Revenue Average Revenue
1      [0,10]    [0,10]    23          1318        57.30435
2      [0,10]   (10,20]    23          1136        49.39130
3      [0,10]   (20,30]    28          1499        53.53571
4      [0,10]   (30,40]    20           923        46.15000
5      [0,10]   (40,50]    14           826        59.00000
6     (10,20]    [0,10]    23          1227        53.34783
7     (10,20]   (10,20]    17           642        37.76471
8     (10,20]   (20,30]    20           888        44.40000
9     (10,20]   (30,40]    15           622        41.46667
10    (10,20]   (40,50]    21           968        46.09524
11    (20,30]    [0,10]    23          1226        53.30435
12    (20,30]   (10,20]    19          1021        53.73684
13    (20,30]   (20,30]    23          1380        60.00000
14    (20,30]   (30,40]     8           313        39.12500
15    (20,30]   (40,50]    19           710        37.36842
16    (30,40]    [0,10]    18           782        43.44444
17    (30,40]   (10,20]    25          1308        52.32000
18    (30,40]   (20,30]    14           553        39.50000
19    (30,40]   (30,40]    26          1131        43.50000
20    (30,40]   (40,50]    20          1295        64.75000
21    (40,50]    [0,10]    20           958        47.90000
22    (40,50]   (10,20]    21          1168        55.61905
23    (40,50]   (20,30]    20          1118        55.90000
24    (40,50]   (30,40]    20          1009        50.45000
25    (40,50]   (40,50]    20           934        46.70000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Excel

r

pivottable

plyr

R 中多个变量的分组的相关文章

如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
RStudio 如何确定控制台宽度，为什么它似乎总是出错？

我刚刚发现wid lt options width在 RStudio 中它似乎是我日常控制台使用中令人烦恼的根源或者更确切地说更接近根源我应该先说一下我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
当使用公式生成超链接时，VBA 打开 Excel 超链接不起作用

使用公式生成的 Excel 超链接似乎存在错误我使用的是 Excel 2010 我有一个电子表格其中的单元格包含 URL 我的目标是执行以下两件事将这些单元格变成超链接创建一个键盘快捷键来打开这些超链接这样我就不必使用鼠标了为了
ubuntu中R的igraph包的安装

我使用以下命令在 ubuntu 中安装 R 的 igraph 包 install packages igraph 但我收到一条错误消息警告无法访问存储库的索引 http ftp iitm ac in cran src contrib h
包含列和行总计的 SQL 数据透视表

我正在尝试将行和列总计添加到该数据透视表中 create table test4 city nvarchar 10 race nvarchar 30 sex nvarchar 10 age int insert into test4 val
对 data.table 中的列表列执行操作

假设我有一个data table 例如dt lt data table foo list 1 3 4 6 bar c 2 7 如何使用 dt 框架对 foo 向量列表执行操作操作可能是将 bar 添加到 foo 返回列表 3 5 11 1
dplyr 返回每个组的全局平均值，而不是每个组的平均值

有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
在 Node.js 中解析 Json（带有数组和对象）并将数据导出到 Excel 文件中

我是 Node js 新手我的要求是我需要解析 JSON 并将数据导出到 Excel 文件中其中包含 JSON 中的所有字段我的 JSON 如下 id 1255 title The Brain and Nervous System
如何将 MySQL 查询输出保存到 Excel 或 .txt 文件？ [复制]

这个问题在这里已经有答案了如何将 MySQL 查询的输出保存到 MS Excel 工作表即使只能将数据存储在 txt文件就可以了 From 将 MySQL 查询结果保存到文本或 CSV 文件中 http www tech recipe
在二维范围内查找匹配的公式

我需要一个公式来查找二维范围内的值并返回匹配单元格的坐标或单元格地址例如 R A B C 1 John Matt Pete 2 Sara Bret Chad 3 Lila Maya Cami 我想搜索范围A1 C3 for Chad并返回
VBA中的字符串是可以迭代的数组吗？

VBA中字符串是数组吗例如我可以像在 C C 中那样迭代它吗做这样的事情 char myArray 10 for int i 0 i lt length i cout lt lt myArray i VBA 中的等价物是什么它的行为
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以

随机推荐

如何向 tkinter 标签添加左边框或右边框

下面的代码 import Tkinter as tk root tk Tk labelA tk Label root text hello grid row 0 column 0 labelB tk Label root text worl
使用隐藏 IFrame 下载 PHP 文件而不保存

我提前为令人困惑的问题措辞表示歉意但我不知道如何表达我本质上在数据库中有一个字符串我打算将其提供给用户下载我该怎么做呢我试图使用ajax 但我不知道如何去做当按下下载链接时执行以下 jquery 代码 ajax url inde
根据州级数据制作加权美国地图

我有一个州级数据列表其中包含每个州的数字例如 AL 10 5 AK 45 6 AZ 23 4 AR 15 0 我想把它做成一个加权地图最暗的地方数字最高最亮的地方数字最低有没有什么软件或者java或python库可以生成这样的图
如何在前端JavaScript中访问Python（Flask）传递的数组（JSON）？

我是一个真正使用 Flask 框架通常是客户端服务器的菜鸟所以请耐心等待我有一个基本的 HTML 模板文件其中包含一些 Flask 使用表示法从 python 文件传递 JSON 对象现在作为一个简单的健全性检查它输出
使用 GitKraken 克隆存储库时，“无法打开 '/etc/gitconfig' - 权限被拒绝”

我尝试在 Ubuntu 上使用 GitKraken 克隆存储库但它引发了错误无法打开 etc gitconfig 权限被拒绝所以我认为 GitKraken 软件需要访问 gitconfig 文件让事情顺利进行并且以某种方式尝试访问该
如何在 JavaFX 内部使用 jFrames？

我刚刚看到一篇文章Swing http javafx com samples ExercisingSwing index html在 JavaFX 中使用如何将使用 jFrame 显示图形的应用程序移植到 JavaFX 中另外 jBut
如何使用 github api 为仓库加注星标

我尝试使用github api来star一个repo curl X PUT H Authorization token https api github com user starred fulldecent system bus radi
无法将 java.lang.String 类型的属性值转换为所需类型 java.util.Date

I m getting this error when I try to input a date in a form 任务控制器 RequestMapping value docreatetask method RequestMethod
警报对话框中的 JavaFX 默认焦点按钮

从jdk 8u40开始我使用新的javafx scene control Alert用于显示确认对话框的 API 在下面的示例中默认情况下聚焦是按钮而不是否按钮 public boolean showConfirmDialog
在 webpack 中实现更好的 TreeShaking 的正确方法是什么？

我想知道以下两个选项中哪一个是更好的正确方法摇树 in webpack import someFeature from someModule Option 1 import isEmpty from lodash Example 1 Or
如何使用winget按应用程序名称的字母顺序显示已安装的应用程序？

Using winget winget list命令显示我的计算机中当前安装的应用程序列表但它不会像控制面板中那样按应用程序名称的字母顺序显示应用程序有没有办法使用应用程序名称的字母顺序显示已安装的应用程序winget 注意这两个图像
如何在 HTML5 中叠加两个图像

如何将我的徽标放在 HTML5 和或 CSS3 中的另一个图像之上我用 Photoshop 为朋友做了这个 https i stack imgur com 46DUc png https i stack imgur com 46DUc
Clojure - （读取字符串 String 调用函数

我在 clojure 文件中有以下内容 ns helloworld gen class main main defn hello world fn println Hello World defn main args eval read s
Clean Gatsby 5.2 安装为 `react-server-dom-webpack` 抛出 `NPM WARN` 标志

使用干净的 Gatsby 5 2 安装后Gatsby CLI 我需要帮助理解我的终端输出它显示了多种NPM WARN flags 我有三个问题造成这些错误的原因是什么为什么全新安装时会出现这些错误解决此类问题的首选方法是什么我在
Cassandra“无法连接到任何服务器”，错误代码为 10061

我的本地专用网络中有 cassandra 我尝试从另一台 PC 进行访问但在连接到 cassandra 服务器时出现此错误 from cassandra cluster import Cluster cluster Cluster 192
通过四舍五入限制数字的长度

我希望我的号码最大长度为 4 位数字例如 input 1 234567 should output 1 236 input 12 34567 should output 12 34 input 123 4567 should output
flutter web TypeError：dart.global.firebase.storage 不是函数

我正在 flutter 中构建一个网络应用程序试图将照片添加到 firebase 存储中我遇到了这个错误大多数帖子都说它通过添加来解决 https www gstatic com firebasejs 8 2 4 firebase d
如何在Vuejs中默认选中单选按钮？

当页面加载时单选按钮状态应检查状态需要之后更改单选按钮下面的 div 应隐藏和显示我编写了以下代码但它不起作用 html div div
Try Catch 无法捕获 UnhandledPromiseRejectionWarning

我以为我有一个很好的方法来找到我从木偶师那里得到的那些罕见的超时但有些人怎么没有捕捉到这个超时我的问题是为什么这是代码 var readHtml url gt return new Promise async resolve reje
R 中多个变量的分组

我是一名强大的 excel 数据透视表用户正在强迫自己学习 R 我确切地知道如何在 excel 中进行此分析但无法找出在 R 中进行编码的正确方法我试图按两个不同的变量对用户数据进行分组同时将变量分组到范围或箱中然后汇总其他变

R 中多个变量的分组

R 中多个变量的分组 的相关文章

随机推荐

热门标签

R 中多个变量的分组的相关文章