如何在 R 中操作（聚合）数据？

2024-03-13

我有一个数据集，如下所示：

df <- tribble(
  ~id,  ~price, ~number_of_book,        
  "1",    10,         3,        
  "1",     5,         1,         
  "2",     7,         4,
  "2",     6,         2, 
  "2",     3,         4,
  "3",     4,         1,
  "4",     5,         1,
  "4",     6,         1,
  "5",     1,         2,
  "5",     9,         3,
)

正如您在数据集中看到的，如果 id 为“1”，则有 3 本书每本书售价 10 美元，而 1 本书每本书售价 5 美元。基本上，我想查看每个价格区间的图书数量份额 (%)。这是我想要的数据集：

df <- tribble(
  ~id,    ~less_than_three,   ~three-five,  ~five-six, ~more_than_six,     
  "1",          "0%",              "25%",     "0%",         "75%",
  "2",          "0%",              "40%",     "20%",        "40%",
  "3",          "0%",              "100%",    "0%",         "0%",  
  "4",          "0%",              "50%",     "50%",        "0%",
  "5",          "40%",             "0%",      "0%",         "60%",
)

现在，我首先对价格进行聚类。为此，我运行以下代码：

out <- cut(df$price, breaks = c(0, 3, 5, 6, 10),
           labels = c("<3","3-5","5-6", ">6")) 

out = table(out) / sum(table(out))

但不幸的是，由于缺乏编码知识，我无法更进一步。你能帮我获取所需的数据吗？

我们可以用cut获取间隔，然后使用tidyr将数据转换为宽格式，最后使用janitor添加百分比。

library(dplyr)
library(tidyr)
library(janitor)

df %>% 
  mutate(interval = cut(price, c(0,3,5,6,Inf))) %>% 
  select(-price) %>% 
  pivot_wider(names_from = interval, values_from = number_of_book) %>% 
  adorn_percentages()

#>  id (6,Inf] (3,5] (5,6] (0,3]
#>   1    0.75  0.25    NA    NA
#>   2    0.40    NA   0.2   0.4
#>   3      NA  1.00    NA    NA
#>   4      NA  0.50   0.5    NA
#>   5    0.60    NA    NA   0.4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

dplyr

tidyverse

intervals

如何在 R 中操作（聚合）数据？的相关文章

循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
read.table 和 read.delim 函数之间的区别

两者有什么区别read table and read delim R语言中的函数当您不确定函数的作用时除了阅读帮助页面之外您还可以检查函数的实际代码例如输入read delim显示该函数包含以下代码 gt read delim f
R：如何根据规范更改数据框中的列名称

我有一个数据框它的开头如下 SM H1455 SM V1456 SM K1457 SM X1461 SM K1462 ENSG00000000419 8 290 270 314 364 240 ENSG00000000457 8 252
优化 R 中的嵌套 for 循环

我尝试加速下面的代码但没有成功我读到Rfast https cran r project org web packages Rfast Rfast pdf包但我也未能实现该包有没有办法优化R中的以下代码 RI lt function
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
栅格堆叠后如何写入？

我想操作几个光栅文件然后再次写入它们 rasterfiles lt list files C data envi full names TRUE d1 lt overlay stack rasterfiles fun function x
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
R lubridate：当地语言的工作日

如何获取本地语言的工作日和月份 My code library lubridate data lt c 10 02 2015 11 03 2015 data lubri lt dmy data wday data lubri label T
以编程方式触发 R 传单中的标记鼠标单击事件以获得闪亮效果

我的问题与此相同在 R 传单中触发标记鼠标单击事件以获得闪亮效果 https stackoverflow com questions 56962857 trigger marker mouse click event in r leafl
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
使用滑动窗口动画 ggplot 时间序列图

我正在寻找在不失去分辨率的情况下对长时间序列图进行动画处理的方法我希望视图能够平移数据显示从开始到结束的滑动子集假设我有以下内容 library ggplot2 library dplyr library gganimate df
R：为什么 boxplot(x,log="y") 与 boxplot(log(x)) 不同？

delme lt exp rnorm 1000 1 5 0 3 boxplot delme log y boxplot log10 delme 为什么这两个图中的胡须不同谢谢阿古斯我想说的是在您的第一个图中您只是将 y 轴更改为对
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
R texreg：如何选择要显示的 gof 统计信息？

我正在使用 texreg 通过 plm 生成面板回归的输出表我想抑制所有 gof 统计数据的输出这不是显示 R2 adj R2 和 N 我只想显示 adj R2 有谁知道一个简单的方法来做到这一点好吧这实际上很简单只需在调用中包含
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac

随机推荐

使用带有 SL 和 TP 的 CCXT 使用 Python 在 FTX 上创建市场订单

有人有如何创建带有止盈和止损的市价订单的示例吗我已经阅读了文档因为这是我第一次做这样的事情所以我真的不明白我正在尝试创建一个 API 端点该端点接收来自 TradingView 的警报并下订单我真的不想使用限价订单因为我只想以
Oracle - 带有可选参数的索引使用

我使用以下技巧来索引具有一些空值的列 create index xx people idx1 on xx people id number 1 这很好用遗憾的是当您使用可选参数时这并没有帮助 select from xx people
Autofixture构造函数注入延迟加载

我在单元测试中使用自动装置它作为自动模拟器的工作方式非常棒但是当我将延迟加载的对象注入到我的类中时我遇到了问题例如 public class MyClass IMyClass private Lazy
Facebook“点赞”会产生“更新页面时出现内部错误”。

几个月前我在我的博客中添加了一个赞按钮一切运行良好今天早上我突然添加了一篇新帖子不知出于什么原因点赞按钮现在坏了每次我点击喜欢时我都会收到此错误 There was an internal error when upd
openXmlSdk 在运行元素内插入新行

我里面有文字Run元素我正在尝试更换 r在字符串中带有line break 正文如下 This is an example project for testing purposes rThis is all sample data non
Kibana 无法在 Windows 上连接到 elasticsearch

我正在运行 Elastic Search 7 6 它工作正常http 本地主机 9200 http localhost 9200 我能够使用 REST API 将值添加到索引现在当我启动 kibana 7 6 时出现以下错误 log
Apache 和 MySQL 是多线程应用程序吗？

我想知道是否默认安装Apache and MySQL on 视窗 Linux是否是多线程的这取决于如何看待它 MySQL允许您同时运行多个线程这可用CPU RAM资源但它不允许您使用多个线程运行单个查询 Apache是多线程的这是
Azure Artifacts - 与其他项目共享项目范围的源

我们的组织内有许多项目其中一个项目创建了一个项目范围的 Azure Artifact 源他们希望与我们的其他项目共享但是当其他项目访问其工件页面时从提要下拉列表中他们只能看到组织范围的提要而项目范围的提要下没有任何内容
LoadError: 无法加载此类文件 -- 英语

我们的代码确实 require english 它在本地工作但我们在 CI 服务器上收到此错误 LoadError 无法加载此类文件英语有任何想法吗事实证明解决办法是改变 require english into require E
如何使 jquery click 事件仅在第一次单击时触发

我有两个 div basic1 和 basic2 我希望 basic1 在单击时淡出而 basic2 在我工作得很好的情况下淡出唯一的问题是一旦 basic2 淡入如果用户继续单击链接 navbar1 它将一遍又一遍地淡入该 div
在图像视图的触摸事件上填充两个图像叠加，如搜索栏

有两个图像黑色和蓝色同时触摸蓝色图像它应该像进度一样填充我在不使用画布的情况下使用多个剪切图像实现了但没有得到smoothness触摸时例如实际上我正在尝试实现类似于我上面提到的 100 个俯卧撑应用程序我得到了一个link
在递归函数中使用 .Find

我正在尝试使用以下命令查找工作表中的行号 Find递归函数中的函数我设置了一个名为Found Find 它效果很好一点点我在递归深度为 1 级时设置它然后在递归深度为 2 级时再次设置它然后我的代码找到路径的末尾并开始备份直到
覆盖 ActiveRecord 对模型和集合的查找的最简洁方法是什么？

我有重写 Ar 的 find 方法的库代码我还包括所有 Association 类的模块因此 MyModel find 和 parent my models find 都可以工作并应用正确的范围我的代码基于 will paginate
MemoryError：无法分配具有形状和数据类型对象的数组

我想在两个数据集之间执行内部联接如下所示 theme ids head id Loan Theme ID Loan Theme Type Partner ID 0 638631 a1050000000skGl General 151 1
写入 Amazon DynamoDB（PHP API）的速度慢得离谱

这个问题已经发布在AWS论坛上但仍未得到解答https forums aws amazon com thread jspa threadID 94589 https forums aws amazon com thread jspa th
静态分配的内存在静态取消初始化期间会变得无效吗？

假设我定义了一个像这样的变量 C static const char str Here is some string data 我有一个静态分配的类实例它在其析构函数中引用该数组这会出错吗例如可以吗str变量不知何故变得无效 cla
Weakreference get() 方法安全吗？（安卓，异步任务）

我正在制作一个 Android 移动应用程序我在 AsyncTask 中有一个对我的 Activity 的 WeakReference 以确保它可以被垃圾收集 When onPostExecute 接到电话我愿意 Acitivty ac
id 的值相同（浮点数）

据我所知 Python 中的一切都是对象id 应该我对吗为每个对象返回不同的数字就我而言 id 1 回报4298178968 id 2 回报4298178944但我对所有浮点类型都得到相同的值 id 1 1 回报4298189032
集合的 EF Code First 映射

我首先使用 EF 4 1 RC 代码我在连接表 Friends 中有一个使用复合 PK 的多对多关系我们明确需要一个单独的 Friends 类不要问来代表我们的联结表我们的目标是能够控制用户实体的删除过程请在阅读其余部分之前先阅
如何在 R 中操作（聚合）数据？

我有一个数据集如下所示 df lt tribble id price number of book 1 10 3 1 5 1 2 7 4 2 6 2 2 3 4 3 4 1 4 5 1 4 6 1 5 1 2 5 9 3 正如您在数据集中

如何在 R 中操作（聚合）数据？

如何在 R 中操作（聚合）数据？ 的相关文章

随机推荐

热门标签

如何在 R 中操作（聚合）数据？的相关文章