我有两个制表符分隔的 CSV 格式的数据文件。这些文件的格式如下:
EP Code EP Name Address Region ...
101654 Alpha York Street Northwest ...
103628 Beta 5th Avenue South ...
EP 代码是唯一的。我想要做的是比较两个文件的 EP 代码,确定不同的行并将它们写入一个新文件。
例如,file1.csv 有 800 行,file2.csv 有 850 行。 file2 可以是完全包含 file1 加上 50 行的文件;或者它可能是file1 - 10 rows + 60 rows
。我想确定两个数据集之间的差异。我对相互争吵不感兴趣。
我怎样才能在 R 中做到这一点?
有很多方法可以做到这一点,包括setdiff
, intersect
, the %in%
功能,is.element
。只需找到相交集并使用排除它即可!
:
diff1 <- file1[setdiff(file1$ep.code, file2$ep.code),]
or
diff2 <- file2[!(intersect(file2$ep.code, file1$ep.code)),]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)