所以目的是通过距离来比较每个ID与其他ID。
考虑以下数据框Df
ID AN AW
a white green
b black yellow
c purple gray
d white gray
为了进行比较,我需要如下所示的组合:
ID AN AW ID2 AN2 AW2
a white green b black yellow
a white green c purple gray
a white green d white gray
b black yellow c purple gray
b black yellow d white gray
c purple gray d white gray
基本上,我试图实现所有组合,以便确定属于每个 ID 的特征之间的距离。
说到这里我现在实在不知道如何开始。有什么见解吗?我可以使用 R 中的哪些工具?
一种可能的解决方案是使用组合和匹配。
ids <- combn(unique(df$ID), 2)
data.frame(df[match(ids[1,], df$ID), ], df[match(ids[2,], df$ID), ])
# ID AN AW ID.1 AN.1 AW.1
# 1 a white green b black yellow
# 1.1 a white green c purple gray
# 1.2 a white green d white gray
# 2 b black yellow c purple gray
# 2.1 b black yellow d white gray
# 3 c purple gray d white gray
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)