有条件地删除重复项

2023-11-30

我有一个数据集，需要根据另一列中的值有条件地删除重复的行。

具体来说，我需要删除其中的任何行size = 0除非SampleID is 重复的.

SampleID<-c("a", "a", "b", "b", "b", "c", "d", "d", "e")
size<-c(0, 1, 1, 2, 3, 0, 0, 1, 0)
data<-data.frame(SampleID, size)

我想删除行：

Sample ID   size
a           0
d           0

并保留：

SampleID   size
a          1
b          1
b          2
b          3
c          0
d          1
e          0

笔记。实际数据集非常大，所以我不是在寻找一种方法来仅删除已知的行号。

In dplyr我们可以使用group_by and filter:

library(dplyr)

data %>% 
  group_by(SampleID) %>% 
  filter(!(size==0 & n() > 1)) # filter(size!=0 | n() == 1))

#> # A tibble: 7 x 2
#> # Groups:   SampleID [5]
#>   SampleID  size
#>   <fct>    <dbl>
#> 1 a            1
#> 2 b            1
#> 3 b            2
#> 4 b            3
#> 5 c            0
#> 6 d            1
#> 7 e            0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

duplicates

subset

有条件地删除重复项的相关文章

r：按多列分组并计数

我有以下数据框 df LeftOrRight SpeedCategory NumThruLanes R 25to45 3 L 45to62 2 R Gt62 1 我想按速度类别对其进行分组并循环遍历其他列以获取每个速度类别中每个唯一代码的
在 R 中安全地计算算术表达式？

Edit 好吧由于似乎有很多混乱我将稍微简化一下问题您可以尝试回答下面的原始问题或者您可以解决此版本并忽略该行下面的所有内容我的目标是采用任意表达式并在极其受限的环境中对其进行评估该环境将仅包含具有以下类型值的变量数值向量接
R中使用余弦距离的层次聚类

我想通过使用余弦相似度与 R 编程语言对文档语料库进行层次聚类但出现以下错误 if is na n n gt 65536L stop 大小不能为 NA 或超过 65536 需要 TRUE FALSE 时缺少值我应该怎么办为了重现它
行方向变异的有效方法

我有两个数据框 dfUsers and purchases使用以下代码生成 set seed 1 library data table dfUsers lt data table user letters 1 5 startDate sam
R正则表达式获取第二个下划线之前的所有文本

s lt 1 343 43Hello 2 323 14 fdh 99H 在 R 中我想使用正则表达式来获取第二个下划线之前的子字符串如何使用一个正则表达式来完成此操作另一种方法是用分割然后粘贴前两个一些东西 paste sapp
在 Python 中伪造一个对象是否是类的实例

假设我有一堂课FakePerson它模仿基类的所有属性和功能RealPerson 不扩展它在Python 3中是否可以伪造isinstance 为了认识到FakePerson as a RealPerson只通过修改对象FakePers
R，igraph，是否可以用图案填充顶点

使用 R 和 igraph 绘制图形我使用颜色来标记顶点类型请参阅下面的代码是否可以用图案而不是颜色填充顶点以便在以彩色和黑白查看时可以区分节点类型我需要 4 种独特的颜色图案 colorbrewer 中唯一适合的调色板是这个
在ggplot2中，箱线图线的末尾代表什么？

我找不到箱线图线条端点代表什么的描述 For example here are point values above and below where the lines end 我意识到盒子的顶部和底部是第 25 个和第 75 个百分位数
使用 R Markdown 文档作为函数源

我正在研究 R Markdown 来记录我经常使用的功能我会将它们放入 R Markdown 文件中以记录它们然后如果我几个月后回来查看它就能够阅读我在函数背后的想法我的问题是如果我开始一个新的 R 项目是否可以获取 r mar
如何不显示 ggplot 轴上的所有标签？

I m trying to using ggplot2 to plot this But as you can see on the x axis you can t read anything 那么如何在 x 轴上显示每 10 年的值呢
连接树状图和热图

我有一个heatmap 一组样本的基因表达 set seed 10 mat lt matrix rnorm 24 10 mean 1 sd 2 nrow 24 ncol 10 dimnames list paste g 1 24 sep p
构造奎因（自我复制功能）

有没有人构建过 quine 生成自己源文本的副本作为其完整输出的程序 http www nyx net gthompso quine htm http www nyx net gthompso quine htm 在 R 中 quine 标
使用 R 将日期格式的字符串列表/向量转换为 posix 日期类

我有一个日期格式的字符串列表我想将其转换为可以使用 R 操作的 posix 日期列表我该怎么做这就是我所拥有的但我最终得到了一个列表 a lt c 2009 01 01 00 00 00 2009 01 01 00 00 00 z
R ggplot2 分面保持比率但覆盖/定义输出图大小

我目前正在使用 ggplot2 来比较不同组的统计数据每个组属于不同的区域这是通过运行 R 脚本的 Web 应用程序 tikiwiki CMS 插件 R 完成的每个区域我可以有 2 到 30 个或更多组相同的 R 脚本针对唯一网页中
如何使用 Facet R 添加线条[重复]

这个问题在这里已经有答案了所以我有一个多面图我希望能够向其中添加随每个面而变化的线这是代码 p lt ggplot mtcars aes x wt geom histogram bins 20 aes fill factor cyl
ggplot2 + 使用比例 X 的日期结构

我真的需要帮助因为我已经迷路了我正在尝试创建一个折线图显示几个团队一年来的表现我将一年分为几个季度 2012 年 1 月 1 日 2012 年 4 月 1 日 2012 年 8 月 1 日 12 1 12 并将 csv 数据帧加载到
R中data.frame（列表）的列平均值

Data https i stack imgur com ZYsmv jpg 请我需要计算此 data frame 中维吉尼亚币 Sepal Length 列的平均值 Sepal Length Sepal Width Petal Leng
ggplot：类似于scale_color_steps()的有序因子的色标

With scale color steps 我们可以通过设置low和high争论一个例子 df lt data frame x rnorm 99 y rnorm 99 col rnorm 99 ggplot df aes x y col
在 R 中读入原始二进制数据并将其转换为整数

我有一个二进制文件其中包含编码为不同长度主要是 2 4 字节的有符号或无符号整数的数值为了处理这些数据我将文件的所需部分读取为raw向量与readBin 然后尝试将其转换为十进制问题是 R的内置函数有限制我不太明白比如没有l
解压 R 数据框中的列表

我有一个dataframe其中一个字段包含不同长度的列表我想将该字段中列表的每个元素提取到其自己的字段中以便我可以将结果收集到一个很长的字段中dataframe每个列表元素都有一个 id 这是一个例子dataframe dat lt s

随机推荐

如何获取我不拥有的分支的未合并拉取请求？

我需要在 NServiceBus 存储库中提取特定的拉取请求尚未处理到主流中 https github com johnsimons NServiceBus commit d8524d53094e8181716e771c1023e9681
Scala future 的理解失败

我有三个连续的 Future 并在这样的理解中使用 val comF for f1 lt future1 f2 lt future2 f3 lt future3 yield something comF onSuccess comF onF
如何从 HAR 文件获取总网页响应时间？

在下图中我想要网页的总响应时间我在文件里好像找不到示例 HAR 文件即本例中的 38 79s 有谁知道如何得到这个我将使用 Selenium 以及 Firebug 和 NetExport 来导出 HAR 文件但现在我正在尝试手动执
使用 JavaScript 访问跨域 iframe 元素

我的 html 页面中有一个 iframe 我想访问此 iframe 中打开的页面中的一些内容 table border 1 width 100 height 100 tr td td tr table 在此网页的源代码中 h1 Angel
由于 Android Gradle 插件需要 Java 11 才能运行，Flutter 应用程序无法运行。您当前使用的是 Java 1.8

我正在尝试制作一个颤振应用程序但我不断收到此错误 What went wrong A problem occurred evaluating project app gt Failed to apply plugin com androi
如何迭代动态对象数组并在测试中使用每个对象作为参数？

一个月前我开始了我的空手道冒险之旅我有一个简单的 GET 测试名为获取所有汽车 feature显示当前可用的汽车列表 brandName BMW id 1 winterTires false modelName X5 brandName
如何获取更新剪贴板的应用程序的进程ID或名称？

我正在用 C 创建一个剪贴板管理器有时我会遇到剪贴板被某些应用程序设置为空的情况这发生在例如Excel取消选择刚刚复制的内容时所以我需要弄清楚剪贴板是否为空但是如何获取更新剪贴板的应用程序名称我希望我能以某种方式得到HWnd更新剪
在Python中加入int作为列表

我的输入现在看起来像这样 6 7 5 2 9 9 7 1 5 6 7 1 2 0 6 3 3 8 8 0 5 1 2 3 我想制作一个如下所示的列表 675299 71567 1206338 805123 我怎样才能做到这一点将数字列表转
Delphi 扩展到 C#

如何将浮点 10 字节十六进制字符串 Delphi 中的扩展数据类型转换为 C 数据类型例如 00 00 00 00 00 00 00 80 ff 3f在德尔福1 遇到了同样的问题分享我的解决方案有人会觉得有用 var extend
Android 运行时出现错误：android.content.res.Resources$NotFoundException：资源 ID #0x7f080058

我收到如下错误之前工作正常 2019 01 04 22 17 32 516 12750 12750 I InstantRun starting instant run server is main process 2019 01 04 2
在 Android 应用程序上创建自定义事件侦听器

我需要设置一个简单的事件侦听器来刷新ListView偶尔问题是我不知道如何生成事件我知道对于按下按键或按钮之类的事件我只需要实现Handler 但在这种特定情况下我实际上需要生成该事件每当我的应用程序的另一个正在运行的线程醒来并从
如何在node.js中使用mailgun接收电子邮件

In my application im using mailgun module to send and receive emails using node js I don t know how to receive the incom
如何拒绝直接访问 AJAX 目录中的文件

我有几个页面通过 jQuery ajax 调用内容我不希望内容在页面上可见所以这就是为什么我使用 ajax 并且不显示隐藏内容我想保护 AJAX 目录内的文件不被通过浏览器 URL 直接访问我知道 PHP 标头可能会被欺骗但不知
将标准输出重定向到文件而不显示 ANSI 警告

我一直在尝试将程序的 STDOUT 重定向到文件到目前为止这段代码运行良好 FILE output fopen output w if dup2 fileno output 1 1 An error occured exit EXIT
Fancybox2 - 工具提示和图像标题的内容不同，两者都来自标题属性？

缩略图工具提示和图库图像标题均取自同一标题 HTML 属性我希望缩略图工具提示和图像标题有不同的内容例如我希望工具提示说 Sculpture name和图片标题说 Sculpture name Height 123cm 有没有办法做到这
AVPlayer 未渲染到其 AVPlayerLayer

我有一个 AVPlayerLayer CALayer 的子类我需要进入可以传递给 QCRenderer 的图像类型 QCRenderer 接受 NSImages 和 CIImages 我可以将 CALayer 转换为 CGImageRef
如何解决谷歌地图和地理编码之间的差异？

好吧这是一个奇怪的情况长期以来我在创建的许多地图上都面临着这个问题这是一个示例地址 Hotel Tamisa Golf Camino Viejo de Co n 3 Mijas Costa M laga 29649 Spain 如果
Intellij 2016.3.2 不断将 String 导入更改为 com.sun.org.apache.xpath.internal.operations.String

由于某种未知的原因在我有返回 String 类型或接受 String 作为参数的方法的每个类中 intellij 都会自动导入 import com sun org apache xpath internal operations Str
如何将此日期格式与正则表达式匹配？

嗨所有正则表达式大师我知道你们已经解决了我的问题呵呵 02 May 2011 or 22 May 2011 or 2 May 2011 日月年 yyyy 不接受数字以外的任何其他字符 0 9 1 2 a zA Z 3 0 9 4
有条件地删除重复项

我有一个数据集需要根据另一列中的值有条件地删除重复的行具体来说我需要删除其中的任何行size 0除非SampleID is 重复的 SampleID lt c a a b b b c d d e size lt c 0 1 1 2 3

有条件地删除重复项

有条件地删除重复项 的相关文章

随机推荐

热门标签

有条件地删除重复项的相关文章