我有一个数据框,其中一列中有重复的条目。我想根据该专栏总结其他专栏。我希望摘要在进行摘要时考虑每个唯一条目而不是总数。
例如,在下面的数据框示例中,如果我想回答以下问题受访者中有多少人是年轻人、中年人和老年人?“RefID”1-1 在总结“ageclass”=young 时被视为 1 的计数,而不是解释为 5 的计数。
RefID Altitude Sex ageclass
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-7 Low F old
1-7 Low F old
1-7 Low F old
1-7 Low F old
1-8 Low F old
1-8 Low F old
1-9 Low F old
1-9 Low F old
1-9 Low F old
谢谢。
The plyr
包对此很有用。例如。你可以这样做:
> require(plyr)
> ddply( df, .(ageclass), summarise, Num = length(unique(RefID)))
ageclass Num
1 midage 1
2 old 6
3 young 1
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)