假设我想通过两列的键合并两个不同的数据帧。
Dataframe One 有 70000 个 obs,共 10 个变量。
Dataframe Two 有 4500 个 obs,共 5 个变量。
现在,我使用此代码检查了新数据框中的观察结果是如何留下的。
所以我意识到我的数据帧 Two 中的列现在只有 10 个变量的 4490 个 obs。
没关系。
我的问题是:
有没有办法把我在这个过程中丢失的数据帧二中的 5 个观察结果还给我。名字就足够了。
谢谢 :)
我想你可以使用dplyr::anti_join
为了这。从它的文档来看:
返回 x 中 y 中没有匹配值的所有行,仅保留 x 中的列。
你可能必须传递你的数据框TWO
as x
.
编辑:正如评论中提到的,其语法by
说法不同。
Example:
df1 <- data.frame(Name=c("a", "b", "c"),
Date1=c(1,2,3),
stringsAsFactors=FALSE)
df2 <- data.frame(Name=c("a", "d"),
Date2=c(1,2),
stringsAsFactors=FALSE)
> dplyr::anti_join(df2, df1, by=c("Name"="Name", "Date2"="Date1"))
Name Date
1 d 2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)