计算每个组的排名

2024-01-07

我有一个df具有类型和值。我想按以下顺序对它们进行排名x within type并给出有多少其他行 rown具有较高的价值x比（列pos).

e.g.

df <- data.frame(type = c("a","a","a","b","b","b"),x=c(1,77,1,34,1,8))
# for type a row 3 has a higher x than row 1 and 2 so has a pos value of 2

我可以这样做：

library(plyr)
df <- data.frame(type = c("a","a","a","b","b","b"),x=c(1,77,1,34,1,8))
df <- ddply(df,.(type), function(x) x[with(x, order(x)) ,])
df <- ddply(df,.(type), transform, pos = (seq_along(x)-1) )

     type  x pos
1    a  1   0
2    a  1   1
3    a 77   2
4    b  1   0
5    b  8   1
6    b 34   2

但这种方法没有考虑类型之间的联系a第 1 行和第 2 行。在关系具有相同值的情况下获得输出的最简单方法是什么，例如

     type  x pos
 1    a  1   0
 2    a  1   0
 3    a 77   2
 4    b  1   0
 5    b  8   1
 6    b 34   2

ddply(df,.(type), transform, pos = rank(x,ties.method ="min")-1)

  type  x pos
1    a  1   0
2    a 77   2
3    a  1   0
4    b 34   2
5    b  1   0
6    b  8   1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

plyr

ranking

计算每个组的排名的相关文章

R 在读取文件时添加额外的数字

我一直在尝试读取一个包含日期字段和数字字段的文件我的数据在 Excel 工作表中如下所示 Date X 1 25 2008 0 0023456 12 23 2008 0 001987 当我在 R 中使用readxl read xlsx函
递归累积函数

我需要在 R 中编写一个累积求和函数但我一直碰壁该函数具有以下结构 a x1 a x2 a 2 x1 a x3 a 2 x2 a 3 x1 a x4 a 2 x3 a 3 x2 a 4 x1 等等 cumsum 似乎不适用于此类功能有
为什么 as.character() 返回日期列表中的整数？

我惊讶地发现 R 中出现以下行为 as character c Sys Date gt 1 2018 02 05 as character list Sys Date gt 1 17567 为什么会出现这种情况也就是说显然 17567
R CMD 检查警告：在文档对象中使用的函数/方法...但不在代码中

我正在写一个包但一个持久的R CMD check警告阻止我完成包裹并将其发布到 CRAN 我用roxygen2对于内联文档尽管这可能不是错误的根本原因如果您知道如何删除此警告我很可能可以找到一种方法来使用roxygen2 如何删除警
通过删除连续的重复项来减少字符串长度

我有一个包含 2 个字段的 R 数据框 ID WORD 1 AAAAABBBBB 2 ABCAAABBBDDD 3 我想通过仅保留字母而不是重复中的重复项来简化具有重复字母的单词 e g AAAAABBBBB应该给我AB and ABCAA
R：install.packages 中出现错误：无法打开连接

我试图安装 RINDSEL 包但无法安装它并且不断收到以下错误 install packages 中出错无法打开连接我从以下位置下载了该软件包 rindsel 1 0 2 zip 综合养殖平台 http old ibpdev net
在闪亮的应用程序中使用传单地图作为过滤器

是否可以使用传单地图来过滤闪亮应用程序中的数据就像在 Tableau 或 Power BI 中一样方法是单击地图上的某个状态然后根据条件过滤另一个图表或表格选择 None
如何更改数据表中的少数列名称

我有一个包含 10 列的数据表 town tc one two three four five six seven total 需要生成我正在使用的列一到总计的平均值 DTmean lt DT lapply SD mean by t
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
为什么 data.table `:=` 的 knit 缓存失败？

这在精神上与this https stackoverflow com q 15267018 1900520问题但机制上一定不同如果您尝试缓存knitr包含一个块data table 分配然后它的行为就好像该块尚未运行并且后面的块看不到
将 r 数据框中的列字符串转换为数字

我有一个数据框其中有一列字符串如下所示 mydata lt c 1 356670 35 355030 1 356670 35 355030 1 356620 35 355890 1 356930 35 358660 1 357000 3
如何使用 RODBC 将数据帧保存到数据库生成的主键表

我想使用 R 脚本将数据框输入到数据库中的现有表中并且希望数据库中的表具有顺序主键我的问题是 RODBC 似乎不允许主键约束这是创建我想要的表的 SQL CREATE TABLE dbo results ID INT IDENTITY
r caret 包中的 train 函数的模型输出尺寸巨大

我正在使用 bagFDA 模型进行训练train r caret 包中的函数并将模型输出保存为 Rdata 文件输入文件大约有 300k 条记录有 26 个变量但输出 Rdata 大小为 3G 我只是运行以下命令 modelout
自定义 colorRampPalette 中的颜色条

我定义了一个 colorRampPalette my colors colorRampPalette c light green yellow orange red 如何为其绘制颜色条图例项目最好仅使用基本包我正在寻找一个充满该颜色
生成因子变量水平的预测值

我正在使用连续结果变量对多个因子变量进行回归lm 例如 fit lt lm dv factor hour factor weekday factor month factor year count data df 我想生成预测值 yhat
Openxlsx 多次验证损坏输出文件

我正在尝试添加多个验证并将公式添加到 Excel 文件这是我使用的代码 library openxlsx fileTemplate lt New01 xlsx wbTemplate lt loadWorkbook fileTemplate
在 R 中使用 gsub 删除尾随空格[重复]

这个问题在这里已经有答案了有没有人有一个技巧可以用 gsub 删除变量上的尾随空格以下是我的数据示例正如您所看到的我在变量中同时包含尾随空格和嵌入空格 county lt c mississippi mississippi cany
Rstudio 命令历史记录

这些天我经常使用 Rstudio 但最近注意到我的命令不再存储在历史记录中我不知道这是从什么时候开始的但可能是在安装最新版本时发生的关于问题可能是什么的任何想法吗 Thanks 这是我们在 v0 93 73 中引入并在 v0 93 7
为什么我必须在每次 R 升级时手动创建目录“~/R/%p-library/%v”？

每次R升级后我必须重新安装我使用的软件包来自源代码因此必须为新版本重新编译它们这是一个正确的可以理解的行为所以我调用install packages http stat ethz ch R manual R devel libr
计算 R 中数据帧的每一行中特定值的连续出现次数

我有一个data frame许多位置这么多行的变量的每月值我想计算值为零的连续月份即连续单元格的数量如果只是从左到右阅读这很容易但增加的复杂性是年底与年初是连续的例如在下面的缩短示例数据集中用季节而不是月份位置 1

随机推荐

使用 htaccess 将网站重定向到移动版网站

您好我使用以下代码重定向到移动网站从移动到移动网站移动中的domain com到m domain com 它工作正常但网址末尾的 id 9 即将到来如何删除 id 9 从 url 以及如何将移动网站 m domain com 从桌
Android 视图转换是否在光栅化后应用？

下面代码中的行 A 和行 B 应生成相同的图像然而行 A 却生成了图像怎么了光栅化后是否应用视图画布转换 import android content Context import android graphics Canvas
express.js - 单行中多个路由的单个路由处理程序

有没有办法在单个函数调用中做到这一点 var todo function req res app get todo app get blabla todo app get blablablabla todo 就像是 app get blab
Google 联系 gdata (Java) 因内容类型没有解析器而失败：application-xml[application/xml]

最近两天前当我们尝试访问联系人时我们开始在 Java 中的 google gdata 客户端中遇到异常提要 m8 feeds contacts default full 例外的是 com google gdata util Pars
如何使用 Gmail Api 获取邮件列表？

我想访问消息列表 Object 2 0 0 p481 008 gt g gmail api users messages list gt lt Google APIClient Method 0x41c948c ID gmail users
SQLite多进程访问

我们在多进程和多线程应用程序中使用 SQLite SQLite 数据库文件使用嵌入式 SQLite 加密进行加密这FAQ http sqlite org faq html q5指出 SQLite 应该能够使用锁机制来管理多进程访问我们遇
WPF - 在系统帐户下执行进程时性能低下

问题描述我有一个 WPF 应用程序通常在具有管理员权限的本地用户帐户下运行但是在某些情况下该进程是由运行在下面的服务或脚本启动的SYSTEM帐户因此该进程也在SYSTEM帐户问题是当进程运行时SYSTEM帐户时存在一些明显的
编写一个程序来计算级数的项之和

编写一个程序来计算级数项的总和 4 8 12 16 20 24 28 32 n 其中 n 是输入考虑 n 始终有效其中意味着它遵循系列模式 n int input Enter n sum 0 for i in range 4 n 4
如何使用新的 SVN 合并跟踪？

在我现有的 SVN 1 5 之前合并策略中我们在创建分支时创建主干的副本称为 BasePoint 以便稍后在合并过程中引用当我们需要将分支合并回主干时我们执行 2 个操作从 BasePoint 合并到 LatestTrunk 主
mysql 与 php 计算行数的最佳实践

1 计数记录 Connect to mysql server link mysql connect HOST USER PASSWORD if link die Could not connect to server mysql error
docker-compose 可以在具有离散端口的服务之间共享 IP 吗？

目前我们拥有使用 Supervisord 进行复杂构建的 docker 容器以便我们可以将服务分组在一起例如 nginx 和 ssh 我正在尝试使用由共享卷链接的更多服务驱动的隔离来重建这些然而无需将 IP 映射到主机我似乎找不
OrientDB ETL 在加载 CSV 文件时抛出异常

我试图将一个简单的 CSV 文件加载到 OrientDB 但它总是抛出此异常 CSV 文件内容 id name role 1 Sarath Architect 2 Anoop Project Manager 3 Nazeem Lead De
第一次更新和启动应用程序时是否会调用 applicationDidFinishLaunching: ？

Is applicationDidFinishLaunching保证在应用程序更新后调用当用户首次启动更新版本时换句话说如果旧版本在更新过程中以后台模式运行它会被杀死吗是的如果您的应用程序处于后台更新程序将在升级之前终止您的应
从 Linux 内核发送 UDP 数据包

即使类似的主题已经存在我注意到它可以追溯到两年前因此我想开一个新的主题更合适我试图弄清楚如何从 Linux 内核 3 3 4 发送 UDP 数据包以便监视随机数生成器 drivers char random c 的行为到目前为止
我们如何通过 sdk 将文件添加到用户的 files.list 中？

我们遇到的问题是有时当用户发出请求时不会返回用户可以访问的文件 files list 这可以通过多种方式发生例如 Google 群组的新成员将看不到以前共享的文件如中所述这个问题 https stackoverflow com qu
预期具体生命周期，在结构中存储 fn 时发现绑定生命周期参数

我正在尝试将函数存储在结构中 trait T lt a gt struct A struct B lt a gt a a A impl lt a gt T lt a gt for B lt a gt fn f1 lt a E T lt a
如何使用http库捕获SocketException？

这个问题已经被其他人指出过比如here https stackoverflow com questions 32810051 cannot catch socketexception 虽然我可能已经明白了原因但是在使用更高级别的时候仍然
如何比较 2 个 .csv 文件并创建一个包含两个 csv 文件中的部件的新 .csv？

我正在尝试比较 CSV 文件的两个特定部分 JobStart csv test1 test2 test3 test4 Val2Compare2 test5 test6 test7 Datafile csv line 1 Val2Compar
在 1-NN 图中查找连通分量的快速方法？

首先我得到了一个 N N 距离矩阵对于每个点我计算了它的最近邻所以我们有一个 N 2 矩阵看起来像this 0 gt 1 1 gt 2 2 gt 3 3 gt 2 4 gt 2 5 gt 6 6 gt 7 7 gt 6 8 gt
计算每个组的排名

我有一个df具有类型和值我想按以下顺序对它们进行排名x within type并给出有多少其他行 rown具有较高的价值x比列pos e g df lt data frame type c a a a b b b x c 1 77 1

计算每个组的排名

计算每个组的排名 的相关文章

随机推荐

热门标签

计算每个组的排名的相关文章