检查一个数据帧的值是否按确切顺序存在于另一个数据帧中

2024-01-05

我有 1 个数据数据框和多个“参考”数据框。我正在尝试自动检查数据帧的值是否与参考数据帧的值匹配。重要的是，这些值的顺序也必须与参考数据帧中的值相同。这些列是重要的列，但我的真实数据集包含更多列。

下面是一个玩具数据集。

Dataframe

group   type    value
1       A       Teddy
1       A       William
1       A       Lars
2       B       Dolores
2       B       Elsie
2       C       Maeve
2       C       Charlotte
2       C       Bernard


Reference_A

type    value
A       Teddy
A       William
A       Lars

Reference_B

type    value
B       Elsie
B       Dolores

Reference_C

type    value
C       Maeve
C       Hale
C       Bernard

例如，在玩具数据集中，group1 的得分为 1.0（100% 正确），因为它在 A 中的所有值都与 reference_A 中 An 的值和值顺序匹配。但是，group2 得分为 0.0，因为 B 中的值与 reference_B 相比是无序的，并且 0.66 是因为 C 中的 2/3 值与 reference_C 中的值和值的顺序匹配。

所需输出

group   type    score
1       A       1.0
2       B       0.0
2       C       0.66

这很有帮助，但没有考虑顺序：检查一个数据框列中的值是否存在于第二个数据框中 https://stackoverflow.com/questions/13774773/check-whether-values-in-one-data-frame-column-exist-in-a-second-data-frame

更新：感谢所有提供解决方案的人！这些解决方案非常适合玩具数据集，但尚未适用于具有更多列的数据集。同样，就像我在帖子中所写的那样，上面列出的列很重要 - 如果有必要，我不想删除不需要的列。

我们也可以这样做mget返回一个list of data.frames，将它们绑定在一起，然后进行分组mean逻辑向量的

library(dplyr)
mget(ls(pattern = '^Reference_[A-Z]$')) %>%
    bind_rows() %>% 
    bind_cols(df1) %>% 
    group_by(group, type = type...1) %>% 
    summarise(score = mean(value...2 == value...5))
# Groups:   group [2]
#  group type  score
#  <int> <chr> <dbl>
#1     1 A     1    
#2     2 B     0    
#3     2 C     0.667

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

检查一个数据帧的值是否按确切顺序存在于另一个数据帧中的相关文章

R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple
从 df 中提取具有两列的重叠行对

我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
R、Rcpp 与 Armadillo 中矩阵 rowSums() 与 colSums() 的效率

背景来自 R 编程我正在扩展到 C C 形式的编译代码Rcpp 作为循环交换以及一般的 C C 效果的实践练习我实现了 R 的等效项rowSums and colSums 矩阵的函数Rcpp 我知道它们以 Rcpp 糖的形式存在并
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
绘制 Cox 回归的 Kaplan-Meier 图

我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率添加协变量 A B 和 C 只是为了避免混淆即年龄性别种族但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t

随机推荐

I/计数器：超出了 FrameTime 日志中的样本计数

我最近开始看到这个日志I 计数器超出了帧时间中的样本计数在我的应用程序 logcat 中多次我知道它来自 Google 地图知道这意味着什么吗以及如何摆脱它尝试禁用小部件的几个层例如通过使用 myLocationEnabled
SortableJS 从嵌套列表中获取顺序

我尝试获取可以订购的嵌套列表的顺序可排序JS https github com SortableJS Sortable 我的清单如下所示 div class list group col nested sortable div class
如何在 vbscript 中使用剪贴板？ [复制]

这个问题在这里已经有答案了 Editor s note While this question is specifically about copying a file reference to the clipboard its gene
如何让 Spring MVC 视图 (JSP) 的一个简单案例能够正常工作？

我的应用程序使用 Spring MVC 最新 3 2 2 创建一个返回 JSON 的 RESTful API 到目前为止我根本不需要视图层但现在除了 API 之外我还需要一个简单的实用程序页面纯动态 HTML 并希望使用 JSP 来
使用 Google Analytics 进行 Javascript 重定向

我需要帮助弄清楚如何在包含 Analytics 代码的同时成功重定向我有一个子域设置http buuf fractalsystems org http buuf fractalsystems org 子域实际上只是一个子文件夹http f
将“memberOf”属性添加到 ApacheDS

我正在尝试在 Apache Directory 中模拟 Active Directory 的 memberOf 属性我已将 memberOf 的以下条目添加到我的 LDIF 文件中 dn m oid 1 3 6 1 4 1 18060 0
检查 url 是否包含 http:// 或 https:// [重复]

这个问题在这里已经有答案了可能的重复检查 url 是否包含 http 或 https https stackoverflow com questions 7334491 check if the url is contains the
如何在加载时打开 React Native Maps 标记的标注

我希望在安装屏幕组件时打开所有标记的所有标注目前它仅在单击标记时打开如何在功能组件中使用 useRef 来执行此操作 const markerRef useRef React createRef return
使用 C++17 Constexpr 查找数组

我正在尝试编写一个 constexpr find 函数它将返回包含特定值的 std array 的索引下面的函数似乎工作正常除非包含的类型是const char include
哪个班级设计比较好？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案哪个类设计更好为什么 public class User public String UserName public String
在 OS X 上以管理员权限运行脚本

我已经尽力在 Stack Overflow 和互联网上找到许多脚本问题的解决方案但我似乎找不到我需要的解决方案我想要做的是创建一个更加自动化且点击次数更少的解决方案来删除系统上的所有移动缓存用户帐户我一直在登录并手动转到用户帐户然后
如何设置 clojureScript 项目以使用规范并在运行时测试 clojure.core 函数？

Clojure 1 9 推出specs https clojure org guides spec clojure core 库中的函数现在有规范如何设置 clojurescript 项目以使用规范并在运行时测试 clojure core
我可以采取什么措施来加快 S3 上传/更新速度？

今天我一整天都在尝试向 s3 上传一些小东西 500 个目录中约有 20k 个文件总计约 3GB 对于名为简单存储服务的服务来说这是绝对合理的我可以平均以大约 500k s 1mb s 1 8 到 3 6 GB h 之间的速度上
Java 中最好的企业购物车是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
未针对早午餐编译供应商 CSS 文件

我对 b 有疑问电子邮件受保护 cdn cgi l email protection不编译 Bower Component CSS 文件如同在 Brunch 中分离应用程序和供应商 CSS https stackoverflow com
在 C 中创建数组时出现分段错误

我最近迁移到一台新笔记本电脑 HP dv6119tx 英特尔酷睿 i5 4 GB RAM 它安装了 Windows 7 Home Premium 64 位我正在尝试创建一个类型的数组int长度为 10 6 的 C Dev C 我曾经在我的
在 React Native 中使用 PanResponder 锁定移动

使用本机反应泛响应器 https facebook github io react native docs panresponder html 当屏幕触摸坐标超出一定值范围时如何阻止移动例如如何防止用户将组件移动到屏幕上某个 y 位置
比较堆转储 (HPROF) 文件

是否可以比较两个 HPROF 文件如何根据我的发现您只能比较对象的直方图为此请转到直方图视图然后单击与另一个堆转储比较并选择另一个 hprof 文件 Here is screenshot
获取孩子的所有孩子等等

我使用 MongoDb 作为数据库我想要所有孩子的孩子等等让我们假设 A 有 B 和 C 孩子 B 有 D 和 E 孩子 D 有 F 和 G 孩子所以当我查询子节点时A 我将所有孩子作为输出例如 B C D E F G C Cust
检查一个数据帧的值是否按确切顺序存在于另一个数据帧中

我有 1 个数据数据框和多个参考数据框我正在尝试自动检查数据帧的值是否与参考数据帧的值匹配重要的是这些值的顺序也必须与参考数据帧中的值相同这些列是重要的列但我的真实数据集包含更多列下面是一个玩具数据集 Dataframe g

检查一个数据帧的值是否按确切顺序存在于另一个数据帧中

检查一个数据帧的值是否按确切顺序存在于另一个数据帧中 的相关文章

随机推荐

热门标签

检查一个数据帧的值是否按确切顺序存在于另一个数据帧中的相关文章