Mahout在MapReduce上实现了Item-Based Collaborative Filtering,这里我尝试运行一下。
安装Hadoop
从下载Mahout并解压
准备数据 下载1 Million MovieLens Dataset,解压得到ratings.dat,用
sed ‘s/: