我有一个csv
包含日期、repair_id、现场维修次数和异地维修次数的文件,以便我的数据如下所示:
data repair_id num_onsite num_offsite
2016-02-01 A 3 0
2016-02-01 B 2 1
2016-02-01 D 0 4
2016-02-02 A 1 3
2016-02-02 C 1 1
2016-02-02 E 0 6
...
2016-02-14 A 1 3
2016-02-14 B 0 4
2016-02-14 D 2 0
2016-02-14 E 3 0
有5种不同repair_id
,即:A, B, C, D, E
。如果修理工(repair_id
) 在给定日期没有工作,那么它们不在该日期的 csv 文件中。我想通过包括他们来改变这一点并有一个0
价值
为了num_onsite
and num_offsite
这样我的桌子就会类似于:
data repair_id num_onsite num_offsite
2016-02-01 A 3 0
2016-02-01 B 2 1
2016-02-01 C 0 0 # added
2016-02-01 D 0 4
2016-02-01 E 0 0 # added
2016-02-02 A 1 3
2016-02-02 B 0 0 # added
2016-02-02 C 1 1
2016-02-02 D 0 0 # added
2016-02-02 E 0 6
...
2016-02-14 A 1 3
2016-02-14 B 0 4
2016-02-14 C 0 0 # added
2016-02-14 D 2 0
2016-02-14 E 3 0
我看过:
Pandas DataFrame 插入/填充之前日期中缺失的行 https://stackoverflow.com/questions/40093971/pandas-dataframe-insert-fill-missing-rows-from-previous-dates
缺少数据,在 Pandas 中插入行并用 NAN 填充 https://stackoverflow.com/questions/25909984/missing-data-insert-rows-in-pandas-and-fill-with-nan
将缺失的日期添加到 pandas 数据框中 https://stackoverflow.com/questions/19324453/add-missing-dates-to-pandas-dataframe
但我无法让它正确输出