当存在平局时如何总结数据集中前 3 个最高值

2024-02-15

我有一个数据框 (my_data)，并且只想计算 3 个最高值的总和，即使可能存在平局。我对 R 很陌生并且我已经使用过dplyr.

A tibble: 15 x 3
   city      month number
   <chr>     <chr>  <dbl>
 1 Lund      jan       12
 2 Lund      feb       12
 3 Lund      mar       18
 4 Lund      apr       28
 5 Lund      may       28
 6 Stockholm jan       15
 7 Stockholm feb       15
 8 Stockholm mar       30
 9 Stockholm apr       30
10 Stockholm may       10
11 Uppsala   jan       22
12 Uppsala   feb       30
13 Uppsala   mar       40
14 Uppsala   apr       60
15 Uppsala   may       30

这是我尝试过的代码：

# For each city, count the top 3 of variable number
my_data %>% group_by(city) %>% top_n(3, number) %>% summarise(top_nr = sum(number))

预期（想要的）输出是：

# A tibble: 3 x 2
  city      top_nr
  <chr>      <dbl>
1 Lund          86
2 Stockholm     75
3 Uppsala      130

但实际的 R 输出是：

# A tibble: 3 x 2
  city      top_nr
  <chr>      <dbl>
1 Lund          86
2 Stockholm     90
3 Uppsala      160

似乎如果存在联系，则所有联系值都包含在求和中。我只想计算 3 个具有最高值的唯一实例。

任何帮助将非常感激！ :)

我们可以做一个distinct删除重复的元素。其中的方式top_n工作原理是，如果值重复，它将保留许多重复的行

my_data %>% 
   distinct(city, number, .keep_all = TRUE) %>%
   group_by(city) %>%
   top_n(3, number) %>%
   summarise(top_nr = sum(number))

Update

根据OP的新输出，之后top_n输出（这不是arranged)、将‘数字’按降序排列，得到sum前 3 个“数字”

my_data %>% 
   group_by(city) %>% 
   top_n(3, number) %>% 
   arrange(city,  desc(number)) %>% 
   summarise(number = sum(head(number, 3)))
# A tibble: 3 x 2
#  city      number
#  <chr>      <int>
#1 Lund          74
#2 Stockholm     75
#3 Uppsala      130

data

my_data <- structure(list(city = c("Lund", "Lund", "Lund", "Lund", "Lund", 
"Stockholm", "Stockholm", "Stockholm", "Stockholm", "Stockholm", 
"Uppsala", "Uppsala", "Uppsala", "Uppsala", "Uppsala"), month = c("jan", 
"feb", "mar", "apr", "may", "jan", "feb", "mar", "apr", "may", 
"jan", "feb", "mar", "apr", "may"), number = c(12L, 12L, 18L, 
28L, 28L, 15L, 15L, 30L, 30L, 10L, 22L, 30L, 40L, 60L, 30L)), 
class = "data.frame", row.names = c("1", 
"2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", 
"14", "15"))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

TopN

当存在平局时如何总结数据集中前 3 个最高值的相关文章

ggplot：按组自动化的百分位线

我找到了dplyr gt 运算符有助于简单的 ggplot2 转换无需求助于ggproto 这是必需的ggplot2 扩展 http docs ggplot2 org dev vignettes extending ggplot2 htm
来自 data.frame 每一列的随机样本

我想从 a 的每一行中抽取随机样本data frame独立于其他行这是一个例子此代码为每行选择相同的列但我需要为每行独立选择列 library plyr set seed 12345 df1 lt mdply data frame m
在 Shiny 中使用 readlines(prompt = )

我有一个代码使用以下方式获取输入readlines prompt 功能您能告诉我 Shiny 中的哪个输入函数足以将此代码适应 Shiny 应用程序吗我需要一个交互功能我无法使用简单的输入selectInput 因为我有很多read
R比例置信区间因子

我正在尝试总结家庭调查的数据因此我的大部分数据都是分类因子数据我想用对某些问题的回答频率图来总结它例如回答某些问题的家庭百分比的条形图误差线显示置信区间我发现了这个很棒的教程我认为它是我祈祷的答案 http www coo
glm() 模型的交叉验证

我正在尝试对我之前在 R 中构建的一些 glm 模型进行 10 倍交叉验证我对cv glm 函数在boot包尽管我已经阅读了很多帮助文件当我提供以下公式时 library boot cv glm data glmfit K 10 这里
R 中 write.table 文件名中的变量

请帮助我解决一个幼稚的问题已经用谷歌搜索并尝试了很多变体但失败了如何使用 R 中 write table 的文件名中的变量保存文件脚本循环遍历 dir 中的文件应用一些函数然后将结果保存到具有相同名称但附加结尾的文件中谢谢
readRDS() 加载额外的包

什么情况下会出现readRDS R 中的函数尝试加载包命名空间我很惊讶地在新的 R 会话中看到以下内容 gt loadedNamespaces 1 base datasets graphics grDevices methods sta
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
解释 survreg 中的威布尔参数

我正在尝试使用从 R 中的 survreg 估计的参数生成逆威布尔分布我的意思是对于给定的概率这将是在 MS Excel 中实现的小型模拟模型中的随机数返回使用我的参数预计出现故障的时间我理解逆威布尔分布的一般形式是 X b l
R 条形图中的 X 轴

我想问一个关于 barplot 轴的问题首先请看我的数据 SerNo DOY Rain 1 350 0 2 351 0 3 352 0 4 353 0 5 354 0 6 355 0 7 356 0 8 357 0 9 358 0 10
在 R 中修改传单弹出窗口

我想修改 R 中传单弹出窗口的外观帮助文件指出 in the popupOptions 函数需要传递给底层 Javascript 对象构造函数的额外选项 In 这个例子 https rstudio github io leaflet p
R中有字典功能吗

有没有办法在 R 中创建一个字典使其具有对一些效果 x dictionary c Hi Why water c 1 5 4 x Why 5 我问这个是因为我实际上正在寻找两个分类变量函数所以如果 x dictionary c a b
如何在 Shiny 中动态渲染的 textInput 添加样式元素

你好堆栈溢出在我最近提出的问题中我已经解决了一些与动态渲染 UI 元素相关的主要问题并在一些了不起的人的帮助下动态创建了观察者参见此处动态渲染的 UI 如何在第二次运行时删除旧的反应变量 https stackoverflow c
分割单个 SpatialPolygons 对象的多边形部分

在 R 中我有一个SpatialPolygons包含数百个多边形的对象即多个多边形我想分割这个SpatialPolygons对象放入列表中Polygons 即孔应保持连接到父多边形知道如何做到这一点吗 EDITED 使用以下提供的示
使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
在 Linux 下更改 RStudio 用户界面（不是图形等）中的字体大小

This is not关于更改使用 RStudio 生成的图表中的字体大小的问题我已经知道该怎么做了我在配备视网膜显示屏的 MacBook Pro 上的 Linux 下使用 RStudio 我使用 KDE 作为我的窗口管理器我可以
for 循环与 cor.test 在许多类别上

我正在尝试在 R 中编写一个循环它将循环遍历 3 个不同的物种以计算两个连续变量 Redness 和 VarNormAbund 之间的相关性我的循环正在运行但 3 个物种中每一个的输出都是相同的这让我认为循环卡在第一个物种上 co
R：如何更改ggvis闪亮应用程序中特定范围的绘图背景颜色

I have a simple shiny app like below and you can run it The plots are created by ggvis and user can choose student name
如何处理包内部的 R 数据？

我正在开发的 R 包需要多个 R 数据对象例如预先计算的模型和参数目前我将包的数据目录中的每个对象放在单独的 RData 文件中使用该包时用户可以使用数据功能将这些对象附加到他们的环境中我想要的行为是在加载包时数据对
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G

随机推荐

迭代配置文件中的部分

我最近接触到了 configparser 库我希望能够检查每个部分是否至少有一个布尔值设置为 1 例如 Horizontal Random Readout Size Small Readout 0 Medium Readout 0 Lar
Angular 2：如何从枚举创建单选按钮并添加双向绑定？

我正在尝试使用 Angular2 语法从枚举定义创建单选按钮并将值绑定到具有该枚举类型的属性我的 html 包含 div class from elem div
JPA：如何在独立java应用程序中持久保存后获取Id

这是一个独立的 java 应用程序而不是 Web 应用程序所以当我像这样持久化对象时 public
如何将 docker 容器绑定到特定的外部接口

我有两个网络接口 eth0 and eth1 我怎样才能将所有docker容器绑定到eth1 并让所有网络流量通过eth1 Thanks update 我尝试绑定到eth1与 133 130 60 36 但我仍然没有运气我仍然将 eth0
Shinyapps.io发布问题：webshot依赖库“PhantomJS”缺失

当我将应用程序发布到shinyapps io时我遇到了以下问题 PhantomJS 文件 con rb 无法打开连接输出 pdf 文件中的完整日志 PhantomJS not found You can install it with
文件中的错误（con，“rb”）：使用plotly在演示文稿中生成绘图时无法打开连接

我正在使用 R 3 3 3 并且正在制作 R 演示文稿尝试使用plotly 绘制 ggplot 图我在 R markdown 文件中的块代码是 r plot echo FALSE message TRUE warning TRUE G
ios Swift 致命错误：使用未实现的初始化程序“init()”

我一直在努力尝试在 StackOverflow 上查找了与此问题相关的所有类似问题但没有成功 class TimeLineTableViewController UITableViewController UIImagePickerCo
如何获取ObjectDataSource的行数

大家好如何获取 ObjectDataSource 的行数我使用 ObjectDataSource 和 DataList 我想向用户显示一些内容例如当 ObjectDataSource 返回某些行时在标签中其中一种情况是没有记录时 T
gradlew 构建冻结在 mergeDebugResources

我使用 gradlew 构建调试应用程序如谷歌教程中所示https developer android com training basics firstapp running app html https developer andro
语法：自上而下和自下而上的区别？（例子）

这是来自的后续问题语法自上而下和自下而上的区别 https stackoverflow com questions 3181960 grammar difference between a top down and bottom up 我
silverlight 打印中捕获打印对话框的取消

有谁知道是否可以查出是否单击了打印对话框的取消我见过帖子和文档说 EndPrint 打印完成或取消时触发事件但我不认为这是打印对话框被取消我认为这是如果打印作业被取消 thanks 根据文档我认为没有简单的方法 http msdn
在RStudio/RMarkdown中，如何设置？

setwdRStudio 中的 Rmd 文件中的内容似乎不会更改后续块中的目录有没有办法永久设置工作目录 Example r setwd tmp getwd r getwd Output setwd tmp getwd 1 private
如何使用 webpack 导入 npm 包子文件夹中的模块？

假设有一个包node modules称为 foo 我想在库中导入一个模块例如foo module通过 webpack 和 babel import Foo from foo works import SomeOtherModule fro
如何在 OpenGL ES 应用程序中指定立方体每面的颜色？

我在下面的代码中定义了一个立方体我想为 6 个面中的每一个指定颜色例如正面颜色1 背面颜色2 左脸颜色3 右脸颜色4 顶面颜色5 底面颜色6 请注意在 OpenGL ES 中我们只有三角形没有四边形我正在寻找可以解决
用于比较 2 个不同数组中的点的最近对算法

我想将一个数组中的点与另一个数组中的点进行比较并找到最接近的一对到目前为止我遇到的都是单个数组我不想比较同一数组中的点暴力算法可以工作但速度太慢是否有使用分而治之方法的算法或实现编辑1 点被定义为地球表面上的一对纬度经度
最接近配对算法

我想了解最接近的配对算法我理解将集合分成两半但我无法理解如何递归计算最接近的对我了解递归但不了解如何通过递归计算最接近的对如果你有 1 2 1 11 7 8 递归将如何处理这些该算法的基本思想是这样的您有一组点 P 并且您想要
禁用自动添加
标记

我正在尝试删除自动添加 p CQ5 版本5 6 0 20130125 中的标签我尝试将这些属性添加到文本组件 http dev day com docs en cq current widgets api index html class
获取一个向量在另一个向量中的值的索引？

我猜这是重复的但我找不到所以这里我想返回第一个中第二个的索引 first c a c b second c c b a result c 2 3 1 我保证第一个和第二个具有唯一的值并且两者之间的值相同获取值的索引是什么match
java：深度复制列表列表的最佳方法

我正在尝试编写一个程序来进行深层复制List
当存在平局时如何总结数据集中前 3 个最高值

我有一个数据框 my data 并且只想计算 3 个最高值的总和即使可能存在平局我对 R 很陌生并且我已经使用过dplyr A tibble 15 x 3 city month number

当存在平局时如何总结数据集中前 3 个最高值

Update

data

当存在平局时如何总结数据集中前 3 个最高值 的相关文章

随机推荐

热门标签

当存在平局时如何总结数据集中前 3 个最高值的相关文章