我在使用 dplyr 时遇到了一些问题group_by
功能。
执行此操作后:
datasetALL %>% group_by(YEAR,Region) %>% summarise(count_number = n())
这是结果:
YEAR Region count_number
<int> <int> <int>
1 1946 1 2
2 1946 2 3
3 1946 3 1
4 1946 5 1
5 1947 3 1
6 1947 4 1
我想要类似的东西:
YEAR Region count_number
<int> <int> <int>
1 1946 1 2
2 1946 2 3
3 1946 3 1
4 1946 5 1
5 1946 4 0 #order is not important
6 1947 1 0
7 1947 2 0
8 1947 3 1
9 1947 4 1
10 1947 5 0
我尝试使用complete()
来自 tidyr 包,但它没有成功......
Using complete
tidyr 包中的应该可以工作。您可以找到有关它的文档here https://www.rdocumentation.org/packages/tidyr/versions/0.6.0/topics/complete.
可能发生的情况是您没有删除分组。然后完成尝试添加每个组合YEAR
and Region
每个组内。但所有这些组合都已在分组中。因此,先删除分组,然后再完成。
datasetALL %>%
group_by(YEAR,Region) %>%
summarise(count_number = n()) %>%
ungroup() %>%
complete(Year, Region, fill = list(count_number = 1))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)