我有一个大数据框,正在尝试查找一行中的重复元素,然后用空字符串替换所有重复值:
X1 X2 X3 X4 X5
x 1 2 3 3 4
y 1 1 2 3 4
应该成为
X1 X2 X3 X4 X5
x 1 2 4
y 2 3 4
我可以在单个向量上执行此操作:
x <- c(1,2,3,3,4)
x[x %in% x[duplicated(x) == TRUE]] = ""
x
[1] "1" "2" "" "" "4"
但我无法让它适用于数据框中的所有行。
我已尝试以下操作但无法使其工作:
apply(df,2,function(x) x[x %in% x[duplicated(x) == TRUE]] = "")
有任何想法吗 ?
像这样的事情,
找出数据框中重复的索引并将其替换为空格。
df[which(t(apply(df,1,function(x)
duplicated(x) | duplicated(x, fromLast = T))), arr.ind = T)] <- ""
df
# X1 X2 X3 X4 X5
#x 1 2 4
#y 2 3 4
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)