之前今天我发布了这个问题here https://stackoverflow.com/questions/72461943/how-can-i-add-missing-month-value-and-remove-duplicate-in-dplyr-in-r/72462277#72462277但我还有一个问题被提出。
如果我必须在原始数据框中添加更多变量(loc,高度):
var = c(rep("A",3),rep("B",2),rep("C",5));var
date = c(as.Date("2022/01/01"),as.Date("2022/02/01"),as.Date("2022/03/01"),
as.Date("2022/01/01"),as.Date("2022/03/01"),
as.Date("2022/01/01"),as.Date("2022/01/01"),as.Date("2022/02/01"),as.Date("2022/02/01"),as.Date("2022/03/01"))
loc = c(rep("london",3),rep("berlin",2),rep("cairo",5))
height =c(13,14,15,13,15,16,12,14,13,15)
data = tibble(var,date,loc,height);data
如何保留 loc 变量的相应值和每个月的高度总(和)(另外在前面回答的问题中)?
理想情况下,它现在必须看起来像这样:
var |
Quarter |
Month |
Condition |
loc |
height |
A |
1 |
1 |
TRUE |
London |
13 |
A |
1 |
2 |
TRUE |
London |
14 |
A |
1 |
3 |
TRUE |
London |
15 |
B |
1 |
1 |
TRUE |
berlin |
13 |
B |
1 |
2 |
FALSE |
berlin |
0 |
B |
1 |
3 |
TRUE |
berlin |
15 |
C |
1 |
1 |
TRUE |
cairo |
28 |
C |
1 |
2 |
TRUE |
cairo |
27 |
C |
1 |
3 |
TRUE |
cairo |
15 |
有什么帮助吗?我如何使用 dplyr 在 R 中做到这一点?