So a 最近的问题 https://stackoverflow.com/questions/1248373/apriori-algorithm让我意识到相当酷先验算法 http://en.wikipedia.org/wiki/Apriori_algorithm。我知道它为什么有效,但我不确定实际用途。据推测,计算相关物品集的主要原因是能够根据某人自己的购买(或拥有的物品等)为他们提供建议。但是,如何从一组相关的项目集转变为单独的推荐呢?
维基百科文章结束:
第二个问题是生成
来自那些大的关联规则
项集的约束为
最小的信心。假设其中之一
大项集是 Lk,Lk = {I1, I2, …
, Ik}, 与此的关联规则
项集生成于
如下:第一条规则是{I1,
I2, … , Ik-1}⇒ {Ik},通过检查
可以确定该规则的置信度
有趣与否。然后是其他规则
是通过删除最后一个生成的
先行词中的项目和插入
其结果是,进一步
新规则的置信度是
检查以确定
他们的有趣程度。那些
迭代过程直到
先行词变为空
不过,我也不确定关联规则集如何帮助确定最佳推荐集。也许我没有抓住重点,apriori 不适合这种用途?在这种情况下,什么is它的目的是什么?
因此,apriori 算法不再是最先进的算法市场篮子分析 (aka 关联规则挖掘 http://en.wikipedia.org/wiki/Association_rules)。尽管 Apriori 原理(子集的支持度上限是集合的支持度)仍然是驱动力,但这些技术已经得到了改进。
无论如何,关联规则用于生成推荐的方式是,给定一些历史项集,我们可以检查每个规则的先行词以查看是否包含在历史记录中。如果是这样,那么我们可以推荐规则的结果(当然,排除结果已经包含在历史中的情况)。
我们可以使用各种指标对我们的推荐进行排名,因为使用大量规则,将它们与历史记录进行比较时,我们可能会得到很多命中,并且我们只能做出有限数量的推荐。一些有用的指标是support规则(与前件和后件的并集的支持相同),信心规则的支持(规则的支持对先行词的支持),以及lift规则的支持(规则的支持与前件和后件的支持的乘积)等等。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)