1.聚类的概念:
有一堆数据,讲这堆数据分成几类称为聚类。
举个例子,
比如有一堆水果,我们按着不同的特征分为:苹果,橘子,香蕉三类叫做分类。
2.分类的概念:
在聚类的前提下,拿来一个新水果,我们按着他的特征,把他分到橘子或者香蕉那类中,叫做分类。
3.训练集和测试集
一般就是把数据分成10份,9:1
9份作为训练数据,来学习一个模型;
1份作为测试数据,来测试这个模型。