我有一个在线购物平台的订单数据库。
我正在使用的表格如下所示,其中每一行对应于一个客户/项目/日期。
OrderHistory <- data.frame(date=c("2015-02-01", "2015-03-01", "2015-04-01", "2015-03-01", "2015-04-01", "2015-05-01", "2015-05-01"),
customer=c("A","A","A","B","B","B","B"),
item=c("Candy", "Coffee", "Coffee", "Candy", "Candy", "Candy", "Coffee" ))
我想要得到的是每个会员订购特定商品的次数的运行计数,这样我就可以分析哪些商品被同一客户重复订购,哪些商品只订购了一次,就不再订购了。
输出看起来像
out <- data.frame(date=c("2015-02-01", "2015-03-01", "2015-04-01", "2015-03-01", "2015-04-01", "2015-05-01", "2015-05-01"),
member=c("A","A","A","B","B","B","B"),
item=c("Candy", "Coffee", "Coffee", "Candy", "Candy", "Candy", "Coffee" ),
count=c(1,1,2,1,2,3,1))
我想要一个 dplyr 解决方案,但我愿意接受任何建议!平台上的具体项目不断变化,因此解决方案必须是动态的才能解决这一问题。