如何使R中的A列唯一并保留B列中具有最大值的行

2023-11-29

我有一个包含几列(17)的数据框。 第 2 列有几行具有相同的值,我只想保留其中一行,特别是第 17 列中具有最大值的行。

例如:

A    B
'a'  1
'a'  2
'a'  3
'b'  5
'b'  200

Would return
A    B
'a'  3
'b'  200

(加上其余的列)

到目前为止,我一直在使用 unique 函数,但我认为它会随机保留一个或仅保留第一个出现的函数。

** 更新 ** 真实数据有376000行。我已经尝试过 data.table 和 ddply 建议,但它们需要很长时间。知道哪个最有效吗?


使用包的解决方案data.table:

set.seed(42)
dat <- data.frame(A=c('a','a','a','b','b'),B=c(1,2,3,5,200),C=rnorm(5))
library(data.table)

dat <- as.data.table(dat)
dat[,.SD[which.max(B)],by=A]

   A   B         C
1: a   3 0.3631284
2: b 200 0.4042683
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使R中的A列唯一并保留B列中具有最大值的行 的相关文章

  • Pyspark - 一次聚合数据帧的所有列[重复]

    这个问题在这里已经有答案了 我想将数据框分组到单个列上 然后对所有列应用聚合函数 例如 我有一个包含 10 列的 df 我希望对第一列 1 进行分组 然后对所有剩余列 均为数字 应用聚合函数 sum 与此等效的 R 是 summarise
  • R - 加速近似日期匹配。 idata.frame?

    我正在努力有效地执行两个数据帧之间的 关闭 日期匹配 这个问题探索了一个解决方案 使用idata frame来自plyr包 但我也对其他建议的解决方案感到非常满意 这是两个数据框的非常简单的版本 sampleticker lt data f
  • 设置设备默认图形参数

    我经常喜欢在 IDE 中使用浅色文本和深色背景颜色主题 当我在 R 中绘制某些内容时 绘图的默认颜色方案是白色背景上的黑色文本 边框 点 我试图默认更改此设置 最好是默认从 R 调用的特定设备 X11cairo RStudioGD 同时保留
  • R闪亮:在渲染表格时显示“正在加载...”消息

    在 Rstudio Shiny 中 我得到了一些renderDataTable通过 RMySQL 从数据库获取信息的调用 有些查询可能需要几秒钟才能完成 我想添加一条 正在加载 消息 其中表格将在等待时最终呈现 这个问题与这个问题类似 R闪
  • ggplot:如何检索轴标签的值?

    如何提取下面的 ggplot 中用于标记 y 轴和 x 轴的数字 分别为20 30 40 and 10 15 20 25 30 35 Plot From r 统计公司 http r statistics co Top50 Ggplot2 V
  • data.table:j中的匿名函数

    我试图让匿名函数返回多列j的论证data table 这是一个例子 sample data tmpdt lt data table a c rep a 5 rep b 5 b c rep f 3 rep r 7 c 1 10 d 21 30
  • 一起使用 R6 类和 foreach() %dopar% 的问题

    当与 foreach 一起使用时 我在 R6 类上遇到问题 可能与环境有关 我使用的是 Windows 假设有两个 R6 类 class1 和 class2 class1 中的 method1 依赖于 class2 例如 请参见下面的示例代
  • 查询文本指定 use_legacy_sql:false,而 API 选项指定:true

    我将 standardSQL 与 bigrquery 一起使用 library bigrquery project lt sql lt standardSQL SELECT result lt query exec sql project
  • R 中的约束优化

    我正在尝试使用http rss acs unt edu Rdoc library stats html constrOptim html http rss acs unt edu Rdoc library stats html constr
  • 如何在R中将plot转换为ggplot?

    我是 R 新手 我正在尝试将绘图转换为 ggplot plot res s type n main title print lines res s res s output 2014 02 14 51 8460 2014 02 14 44
  • 在 R 中将时间从数字转换为时间格式

    我从 xls 文件中读取数据 显然 时间格式不正确 如下 举例 0 3840277777777778 0 3847222222222222 0 3854166666666667 确实 他们应该是 09 12 09 13 09 13 我不知道
  • 按钮:带滚动条的下载按钮仅下载几行

    我正在处理超过 100 000 行的表并使用DT包裹 开发版本0 1 56 在 Shiny App 中将其可视化 此外我正在使用DT扩展如下 Buttons 下载不同格式的数据 然而虽然Scroller扩展程序也已激活 我只能下载几行 不是
  • 无法安装bigrf包

    我在安装 bigrf R 软件包时遇到了一些极其令人沮丧的困难 我已经尝试过以下方法 install packages bigrf repo https github com aloysius lim bigrf git type sour
  • 不同元素的ggplot字体大小

    我知道在创建 ggplot 图后我可以使用theme get 返回所有主题元素的详细信息 这对于弄清楚诸如此类的事情非常有帮助strip text x等等 但我有两件事无法弄清楚 1 在下面的ggplot图形中 代表短语 被土拨鼠卡住的木头
  • 如何在函数和循环中使用 data.table?

    在评估效用时data table vs dplyr 一个关键因素是在函数和循环中使用它的能力 为此 我修改了本文中使用的代码片段 data table 与 dplyr 一个可以做得很好而另一个不能做或做得很差吗 https stackove
  • 加载 plyr 包时出现问题

    我使用 R 2 13 1 但未能成功尝试在 R 中加载包 plyr 1 6 我已将其手动安装到目录 R library 中 我的代码是 libPaths R library library plyr 我收到消息 库 plyr 中的错误 pl
  • 在 R/exams exams2nops() 中用零填充初始学生 ID

    当使用exams为 NOPS 考试生成 PDF 文件的软件包我想编辑学生可用的位数 reglength 我知道该软件包只允许至少 7 位数字 然而 我们学生的身份证号码只有5位数字 因此我想知道是否可以通过 PDF 操作来编辑模板 我尝试过
  • 将缺失的行添加到数据表中

    我有一个数据表 library data table f lt data table id1 c 1 2 3 1 2 3 id2 as factor c a a b c b d v 1 6 key c id1 id2 id1 id2 v 1
  • 在 R 中绘制决策树(插入符)

    我已经训练了一个数据集rf方法 例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
  • 如果在循环中调用summary()命令,如何获得它的输出?

    Suppose Z是特征名称的向量 如何让以下 Rscript 中的摘要命令实际打印 for var in Z cat i form paste crim var lm fit lm form data Boston summary lm

随机推荐

  • 使用 Boost Spirit X3 编写解析器的未来安全性如何?

    我正在考虑编写本质上是我的第一个解析器 自从 Uni 的编译器类以来我已经忘记了 由于我使用C 所以我正在考虑使用Boost Spirit 然后我注意到有 常规 2 5 2 还有代码名为 Spirit X3 的神奇子集 我还注意到 Boos
  • Java编译器和JVM是用什么语言编写的?

    Java 属于哪些语言compiler javac 虚拟机 JVM 和java入门写了吗 这个问题的精确措辞有点误导 它不是 JVM or 编译器 因为有多个 JVM 供应商 jrockit 是其中之一 IBM 是另一个 和多个编译器在那里
  • php 文件带有 标签[重复]

    这个问题在这里已经有答案了 可能的重复 如何启用PHP短标签 Hi 我有 Xampp 版本 1 7 3 浏览项目时显示错误 这是因为我的 php 代码以标签和 tag Thanks 您正在寻找short open tag指令 To indi
  • 估计给定句子的标记概率/逻辑,而不计算整个句子

    我有这样一句话 I like sitting in my new chair and about life 我有一组特定的令牌 例如 watch run think apple light 我想计算每个标记作为该不完整句子中的下一个单词出现
  • 如何修复打字稿错误“对象可能是‘未定义’”

    我正在构建一个云函数 它将使用 Stripe API 来处理付款 这是一个 firebase 项目 当我跑步时firebase deploy我收到错误 对象可能是 未定义 const existingSource customer sour
  • Spring Boot 默认 H2 jdbc 连接(和 H2 控制台)

    我只是想查看嵌入式 H2 数据库的 H2 数据库内容 当我没有在我的文件中指定任何内容时 spring boot 创建该数据库 application properties并从 mvn spring run 开始 我可以看到 hiberna
  • Django - 使用表单自动填充 django admin 外部的created_by 字段

    要求用户通过填写 modelformset factory 创建的表单来在 django admin 之外创建一个新实例 问题是我不知道如何将 request user 传递到表单 因此保存表单时created by 字段无效 模型 py
  • 如何在Python中运行后一段时间内禁用Raspberry Pi GPIO事件?

    每当我的 Raspberry Pi 的 GPIO 引脚出现下降沿时 我就会创建一个事件 但是 我想在每次运行后禁用此事件一段时间 例如 5 秒 我希望在该时间段之后再次启用该事件 我的第一个想法就是使用sleep 5 在实际的事件函数中 但
  • 不同 xml/root 中 JAXB 中子元素的共享类

    In JAXB当使用自动类生成时xjc from xsd scheme 阿尔法 xsd
  • c中不能将负数右移

    我正在学习 K R 的 C 语言 现在我正在做按位部分 我很难理解下面的代码 int mask 0 gt gt n 我正在尝试使用它来屏蔽另一个像这样的二进制文件的左侧 0000 1111 1010 0101 随机数 我的问题是 当我打印
  • 如何清除 JSON 的缓存

    我正在使用 jQuery 读取 JSON 文件 如果我更新该文件 get 当我读取新文件时 它仍然获取旧值 由于我每秒写入和读取文件 我该如何解决这个问题 手动清除缓存将不是一个选择 function readEye getJSON out
  • 如何在 javascript/jquery 中确定 ipad 是否处于横向/纵向模式?

    如果 ipad 处于横向模式 我想添加一个额外的 div 是否有某种 if 语句可以发现这一点 Thanks jQTouch 像这样检查它 orientation Math abs window orientation 90 landsca
  • 获取目标c中的启动时间

    我如何在 Objective C 中获取 ios 的启动时间 有办法得到吗 不知道这是否适用于 iOS 但在 OS X 本质上是相同的操作系统 中 您将使用sysctl 这就是 OS X Unix 实用程序的工作方式uptime可以 源代码
  • 如果日期无效,Spring mvc Joda 日期时间转换器将失败

    我有一个域对象 我想从包含 Joda DateTime 的 JSP 映射 public beanClass private Long id DateTimeFormat private DateTime start getters and
  • 使用 Win API 设置壁纸

    我想以编程方式设置壁纸 这是迄今为止我找到的唯一解决方案 SystemParametersInfoW SPI SETDESKWALLPAPER 1 void wallpaperImageFilePath utf16 SPIF UPDATEI
  • aria-hidden 的存在是否足够,或者是否需要将值设置为“true”(aria-hidden="true")

    html 隐藏 属性是一个布尔值 不需要设置值 只要存在就足够了 那么 aria hidden 属性呢 仅仅存在就足够了吗 或者是否需要设置值 true aria hidden必须具有 true false 值 但请注意 aria hidd
  • 应用内购买服务器模型

    我对应用内购买服务器模型有几个问题 我有我的数据库和一个存储项目描述的表 例如 我有一把剑 价格为 0 49 美元 一把狼牙棒 价格为 0 99 美元 因此表包含字段 id 名称 价格 信息 描述 我想在我的 iOs 应用程序中显示这些商品
  • 使用ANTLR 3.3?

    我正在尝试开始使用 ANTLR 和 C 但由于缺乏文档 教程 我发现它非常困难 我发现了一些针对旧版本的半心半意的教程 但此后 API 似乎发生了一些重大变化 谁能给我一个简单的例子来说明如何创建语法并在短程序中使用它 我终于成功地将我的语
  • 将流式 (utf8) 数据转换为字符串的安全方法是什么?

    假设我是一个用 objc swift 编写的服务器 客户端正在向我发送大量数据 这实际上是一个很大的 utf8 编码字符串 作为服务器 我有 NSInputStream 触发事件来表示它有数据要读取 我获取数据并用它构建一个字符串 但是 如
  • 如何使R中的A列唯一并保留B列中具有最大值的行

    我有一个包含几列 17 的数据框 第 2 列有几行具有相同的值 我只想保留其中一行 特别是第 17 列中具有最大值的行 例如 A B a 1 a 2 a 3 b 5 b 200 Would return A B a 3 b 200 加上其余