根据 R 中单行中的多个所需值匹配/查找行

2023-12-09

这肯定是重复的,但我找不到它。所以就这样吧。

我有一个包含两列的数据框。一个包含一个组,另一个包含一个标准。一组可以包含许多不同的条件,但每行只能包含一个条件。我想识别包含三个特定条件的组(但会出现在不同的行上。在​​我的例子中,我想识别包含条件“I”、“E”、“C”的所有组。组可以包含任何数字以及这些字母和其他几个字母的组合。

test <- data.frame(grp=c(1,1,2,2,2,3,3,3,4,4,4,4,4),val=c("C","I","E","I","C","E","I","A","C","I","E","E","A"))

> test
  grp val
1    1   C
2    1   I
3    2   E
4    2   I
5    2   C
6    3   E
7    3   I
8    3   A
9    4   C
10   4   I
11   4   E
12   4   E
13   4   A

在上面的示例中,我想要识别组 2 和 4,因为它们每个都包含字母 E、I 和 C。

Thanks!


这是一个dplyr解决方案。%in%被向量化,所以c("E", "I", "C") %in% val返回长度为三的逻辑向量。对于目标群体,将该向量传递给all()回报TRUE。这是我们的过滤器,我们在每个组中运行它group_by().

library(dplyr)
test %>% 
  group_by(grp) %>%
  filter(all(c("E", "I", "C") %in% val))
# Source: local data frame [8 x 2]
# Groups: grp [2]
# 
#     grp    val
#   (dbl) (fctr)
# 1     2      E
# 2     2      I
# 3     2      C
# 4     4      C
# 5     4      I
# 6     4      E
# 7     4      E
# 8     4      A

或者如果这个输出会更方便(感谢@Frank),

test %>%
  group_by(grp) %>%
  summarise(matching = all(c("E", "I", "C") %in% val))
# Source: local data frame [4 x 2]
# 
#     grp matching
#   (dbl)    (lgl)
# 1     1    FALSE
# 2     2     TRUE
# 3     3    FALSE
# 4     4     TRUE
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

根据 R 中单行中的多个所需值匹配/查找行 的相关文章

  • aggregate() 将多个输出列放入矩阵中

    我要计算某个变量的多个分位数 gt res1 lt aggregate airquality Wind list airquality Month function x quantile x c 0 9 0 95 0 975 gt head
  • ggplot 中的分层轴?

    我想知道是否可以在 GGLPOT2 或其他图形包 我只是更喜欢 ggplot 中制作分层 分段轴 我想要做的是获取下面的数据 制作一个堆积条形图 其中 x 轴上有周期 但在每个周期内 还有每种动物 那么每只动物内的条形颜色将是 颜色 变量
  • 从 R 文本中提取网站链接

    我有多个文本 每个文本都可能包含对一个或多个网络链接的引用 例如 text1 s 1212a as www abcd com asasa11 我如何提取 www abcd com 来自 R 中的这段文字 换句话说 我希望提取以www并结束于
  • Pandas:根据其他多级列对最里面的列进行分组排序

    考虑下面的 df In 3771 df pd DataFrame A a 11 B b 11 C C1 C1 C2 C1 C3 C3 C2 C3 C3 C2 C2 D D1 D2 D1 D3 D3 D2 D4 D4 D1 D2 D3 E v
  • pandas:使用运算符链接过滤 DataFrame 的行

    大多数业务在pandas可以通过操作符链接来完成 groupby aggregate apply等 但我发现过滤行的唯一方法是通过普通的括号索引 df filtered df df column value 这没有吸引力 因为它需要我分配d
  • 根据 B 列中的一系列值获取 A 列的平均值

    我的数据框有几列 如下所示 df1 lt data frame A c 1 2 4 B c 1 3 1 C c 1 1 3 我有两个条件来获取 A 列的平均值 条件1 我想在B为1时获得A列的平均值 即只对row1和row2进行平均 条件2
  • 加载 plyr 包时出现问题

    我使用 R 2 13 1 但未能成功尝试在 R 中加载包 plyr 1 6 我已将其手动安装到目录 R library 中 我的代码是 libPaths R library library plyr 我收到消息 库 plyr 中的错误 pl
  • 将一个数据框中的行(带有行名称)与另一个数据框中的匹配列名称相乘

    我有两个数据框 df1 lt data frame Values c 0 01 0 05 row names c X Y df1 Values X 0 01 Y 0 05 df2 lt data frame c 0 1 1 c 1 0 0
  • 将缺失的行添加到数据表中

    我有一个数据表 library data table f lt data table id1 c 1 2 3 1 2 3 id2 as factor c a a b c b d v 1 6 key c id1 id2 id1 id2 v 1
  • 如果在循环中调用summary()命令,如何获得它的输出?

    Suppose Z是特征名称的向量 如何让以下 Rscript 中的摘要命令实际打印 for var in Z cat i form paste crim var lm fit lm form data Boston summary lm
  • R中的预测和预测函数之间的区别

    两者之间有什么区别吗predict and forecast R 中的函数 如果是 在哪些具体情况下应该使用它们 Intro predict 适用于多种 R 对象 模型 基础库的一部分 forecast 对于时间序列 预测包的一部分 参见示
  • 在 R 中根据时间序列数据制作 3D 曲面

    我有一个大型数据集 我想从中制作 3D 表面 我希望 x 轴为日期 y 轴为时间 24 小时 z 轴 高度 为我的值 我是 R 初学者 所以越简单越好 http www quantmod com examples chartSeries3d
  • R:从本地 tar.gz 安装 R 软件包时找不到“make”

    R 包ConvCalendar不再位于 Cran 存储库中 请参阅here https cran r project org web packages ConvCalendar index html 然而 因为我在之前的项目中大量使用了这个
  • 使用两列数据分割数据帧并对结果数据帧列表应用通用转换

    我想根据两列中的值将一个大数据帧拆分为一个数据帧列表 然后 我想对结果列表中的所有数据帧应用通用数据转换 滞后转换 我知道 split 命令 但只能让它一次处理一列数据 您需要将所有想要分割的因素放在一个列表中 例如 split mtcar
  • 成对散点图;一对多[重复]

    这个问题在这里已经有答案了 有没有一种简洁的方法来创建pairs仅将一个变量与许多其他变量进行比较的图 换句话说 我可以只绘制标准的一行或一列吗 pairs不使用循环的散点图矩阵 融化你的数据 然后使用带有facet的ggplot libr
  • 根据用户输入将 n 个反应式单选按钮添加到闪亮的应用程序

    我正在尝试创建一个闪亮的应用程序 用户可以在其中从数据框中选择变量以便对数据进行子集化 输出 最终 将是包含用户子集的数据表 我需要根据用户为子集选择的变量数量创建 n 个输入框 理想情况下 输入框将是动态单选按钮 用于子集因子 我还没有开
  • 使用不同的阈值替换多列中的值

    我有一个包含多个列的数据集 其中包含我想要转换为二进制的定量数据 为此 我想使用每列不同的阈值 Example Input antigen1 antigen2 antigen3 antigen4 1 215 421 2 12 2 1524
  • 基于列重复数据集中的行,但增加行[重复]

    这个问题在这里已经有答案了 我有一个数据集 其中包含项目名称 开始年份和合同期限 我需要将这个数据集开发成时间序列 例如 我的数据集中的一行是 项目 A 开始年份 2003 年 合同期限 5 我想根据合同期限重复每一行 我的数据集如下所示
  • 提取模型摘要并将其存储为新列

    我是新来的purrr范例并正在努力解决它 根据一些来源 我已经设法嵌套一个数据框 在嵌套数据上运行线性模型 从每个 lm 中提取一些系数 并为每个 lm 生成摘要 我想做的最后一件事是从摘要中提取 r squared 我原以为这将是我想要实
  • 在R中使用plotly在轴标题中换行和下标

    我刚开始使用plotly对于 R 中的一些交互式散点图 并且在轴标签上遇到困难 通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们 但这有时由于某种原因非常慢 所以我想直接在中创建我的图plotly 我现在尝试更改轴标题

随机推荐

  • CompositeDisposable.clear 导致 OkHttp 抛出 java.lang.IllegalStateException: 不平衡的进入/退出

    所以我有一个使用 OkHttp 的简单 http 请求 我在 Android 上使用 RxJava 执行此操作 我将此 RxJava 调用添加到CompositeDisposable然后我就清楚了onStop 由于某种原因触发了下面的异常
  • 如何从c程序中终止exe

    我正在使用 system 来调用可执行程序 服务器 现在 经过一段时间后 我想从我的 c 程序本身终止该程序 有谁知道如何做到这一点 运行操作系统 http rcn ee net deb rootfs precise ubuntu 12 0
  • 查找 xslt 中字符串中子字符串的出现次数

    我正在编写一个脚本来查找 XSLT 字符串中子字符串的出现次数 当我想要遍历超过 200k 条记录时 它花费了太多时间 任何人都可以帮助我指出一些更改以使其更快 或者使用其他方法来获取出现次数 我说的是一个子字符串 而不是一个字符 所以我不
  • Magento SOAP API - PHP 登录方法调用引发异常:“看起来我们没有 XML 文档”

    我在通过 PHP 的 SoapClient 连接到 Magento SOAP API 时遇到问题 我的开发服务器上有一个小型测试 PHP 文件设置 代码如下 PHP 文件与我的 magento 开发版本位于同一服务器上 当我通过命令行运行
  • Python 3 安装失败“注册的密钥集无效”

    我一直在尝试安装Python 3 但出现此错误 我在 Windows 8 64 位上运行它 我会继续努力 谢谢您的帮助 我没有找到任何有关此事的文章 所以我来到这里 我对所有应用程序都遇到了这个问题 这意味着当我尝试安装应用程序时 会弹出相
  • Coldfusion如何将pdf文件保存在数据库中并在浏览器中获取它

    插入到 MS SQL 2008 数据库
  • V8 执行解释器生成的字节代码还是涡轮风扇编译器生成的二进制代码? [关闭]

    Closed 这个问题需要多问focused 目前不接受答案 我对 v8 的工作原理以及它如何执行 js 代码感到困惑 据我了解 v8 首先解析代码并创建 AST 然后将此 AST 引入解释器作为输入并生成字节代码 然后将此字节代码引入到
  • 如何连接 Jenkins 和 Gieta

    我有一个问题 我想在 Gitea Repo 和 Jenkins 之间建立 CI CD 管道 到目前为止 我使用 Jenkins 的 Gitea API 创建了一个 Webhook 不幸的是 当我尝试将测试包从 Gitea 发送到 Jenki
  • 按时区转换日期

    在上面的代码中 我想将服务器时区 GMT 02 00 的日期转换为我设备中的时区 GMT 03 00 但我总是有相同的服务器日期 我做错了什么 TimeZone timeZoneServer TimeZone getTimeZone tim
  • 在循环中保存 Matplotlib 绘图时出现内存溢出

    我正在使用 Matplotlib 使用迭代循环来绘制 soame 数据 当代码保存了大约 768 个绘图时 它会抛出以下异常 RuntimeError Could not allocate memory for image 我的电脑有大约
  • 对声明的 C++ 静态成员变量的“未定义引用”[重复]

    这个问题在这里已经有答案了 我已经开始使用 Java 进行编程 我刚刚达到了我认为在语言知识方面 良好 的水平 为了好玩 我决定开始使用 C 编程 我对这种语言相当陌生 但我学得很快 而且我认为它与 Java 相差不远 我创建了一个测试类
  • 控制台宽度存储在 Windows 注册表中的哪个位置?

    我的默认控制台宽度是 80 但是当我查看HKCU Console没有一个名称具有此值 唯一与 with 有关的是 WindowSize但它的值为 0x190050 即 dec 1638480 它的最后两位数字是否代表我正在搜索的值 在 HK
  • Python:同名函数和变量

    为什么我无法再次调用该函数 或者说 我怎样才能做到呢 假设我有这个功能 def a x y z if x return y else return z 我这样称呼它 print a 3 gt 2 4 5 I get 4 但想象一下我声明了一
  • 没有点击就触发onclick事件

    这是一个简单的骰子投掷事件 6 个骰子 由随机数生成 一切正常 我正在控制台中获取数据 但我希望它仅在单击按钮时触发 在此代码中 在没有我点击的情况下触发了 onclick 事件 在控制台中 我该如何解决这个问题 h1 Dice Proje
  • 犰狳线性系统求解器(带 openblas)

    我一直在测试各种开源代码来求解 C 中的线性方程组 到目前为止 我发现最快的是犰狳 也使用 OPENblas 包 为了解决密集线性 NxN 系统 其中 N 5000 在我的系统上大约需要 8 3 秒 这真的非常快 没有安装 openblas
  • 辅助功能 - Android Talkback 不会在 HTML 内容上触发焦点事件

    我正在尝试执行 接收onfocus在 Android 设备 Moto G Android 4 4 3 上选择 HTML 页面时使用 Talkback 的 HTML 事件input field 我在单个输入文本上创建了onfocusevent
  • 如何在 Visual Studio Code 中搜索文件?

    我习惯使用 Resharper 我可以在其中搜索文件 不是内容 而是文件名 这使得打开新文件变得更快 此功能是否在 Visual Studio Code 中实现 是否有快捷方式 Using 转到文件 这是在Go菜单或使用键盘快捷键 On W
  • JQuery:隐藏孩子,显示第n个孩子?

    这真的很奇怪而且应该很简单 我在 div 的标签内有一组图像 例如 div a href img src img1 jpg a a href img src img2 jpg a a href img src img3 jpg a div
  • PHP Duck 示例 - 首先 - 设计模式 - 第一章

    这是我向许多其他人提出的第一个问题 这里有人可能会说我疯了 因为我正在使用 PHP OO 关注问题标题中提到的书 在第一章中 作者介绍了一个名为 SimUDuck 的简单项目 尽管我已经用 Java 重现了相同的项目 但我想使用 PHP 重
  • 根据 R 中单行中的多个所需值匹配/查找行

    这肯定是重复的 但我找不到它 所以就这样吧 我有一个包含两列的数据框 一个包含一个组 另一个包含一个标准 一组可以包含许多不同的条件 但每行只能包含一个条件 我想识别包含三个特定条件的组 但会出现在不同的行上 在 我的例子中 我想识别包含条