我有一个数据集,如下所示:
shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-12,12
在由“shop_id”和“item_id”定义的每个组中,都缺少日期。
我希望将这个不规则的时间序列扩展到每组内具有连续日期的规则:
shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-12,0 # <~~ added
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-11,0 # <~~ added
150,2,2015-07-12,12
对于添加的日期,相应的值应为零。我读过非常类似的问题(使用 R 或 SQL 合并),但我见过的大多数解决方案都不涉及 GROUP BY。
基本上我可以访问 SQL 数据库/我可以导出为 CSV 以便最好在 C# 中进行操作。希望找到可以执行此类数据操作的 C# 库,但没有找到。
任何建议或帮助表示赞赏!