例题:(信息检索导论-修订版 习题12-7)
假定某文档集有如下4篇文档组成
为该文档集建立一个查询似然模型。假定采用文档语言模型和文档集语言模型的混合模型,权重均为0.5.采用MLE来估计两个一元模型。
计算在查询click、shears以及click shears下每篇文档模型对应的概率,并利用这些概率来对返回的文档排序。将这些概率填在下表中。
对于查询click shears来说,最后得到的文档次序是?
答案
1、 查询似然模型:
2、 计算在查询click、shears以及click shears下每篇文档模型对应的概率,并利用这些概率来对返回的文档排序。将这些概率填在下表中.
3、 查询click shears 的文档排序为:Doc1、Doc4、Doc2、Doc3