我试图弄清楚如何分析我最近进行的一项调查中的多个选择/多个响应(即“选择所有适用的”)问题。
SPSS 具有分析在线调查数据和此类问题的出色功能,因此我猜测 R 具有该功能以及更多功能。在 Excel 中处理这些调查答案有点棘手。例如,按年龄显示每个喜欢草莓和巧克力冰淇淋的人的直方图/分布。
如何构建数据集以及执行频率、帕累托和逻辑 AND OR 函数的一些基本列表的命令是什么?
我还没有发现任何东西比 SPSS 中的多重响应集更方便。但是,您可以根据常见的列名称相对轻松地创建组,然后使用任何apply()
函数或朋友来迭代每个组。这是一种使用的方法adply()
来自plyr
包裹:
library(plyr)
set.seed(1)
#Fake data with three "like" questions. 0 = non selected, 1 = selected
dat <- data.frame(resp = 1:10,
like1 = sample(0:1, 10, TRUE),
like2 = sample(0:1, 10, TRUE),
like3 = sample(0:1, 10, TRUE)
)
adply(dat[grepl("like", colnames(dat))], 2, function(x)
data.frame(Count = as.data.frame(table(x))[2,2],
Perc = as.data.frame(prop.table(table(x)))[2,2]))
#-----
X1 Count Perc
1 like1 6 0.6
2 like2 5 0.5
3 like3 3 0.3
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)