如何对数据帧进行子集化,以便仅包含包含其值在其他行中显示一定次数的列的行。
例如,如果我有一个标记为“食物”的列,我将如何过滤掉在整个数据框中出现少于 5 次的食物的所有行?
这是一个简单的例子:
dat <- data.frame(x=runif(50),y=sample(letters,50,replace = TRUE))
dat[dat$y %in% names(table(dat$y))[table(dat$y) > 2],]
这将选择包含出现两次以上的字母的所有行。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)