我正在建立一个博客聚合器,例如Techmeme http://techmeme.com它可以从多个博客中查找最受欢迎的帖子。与 Techmeme 不同,我首先从各种 RSS 源聚合博客文章,然后将标题和相关 URL 保存在数据库中。之后,我必须找到什么最受欢迎的博客文章 are.
为了定义顶级博客文章标题,我跟踪每个博客的每篇文章的 Facebook 和 Twitter 分享计数,并根据分享计数对博客文章进行排名。但这并不是最好的解决方案,因为一些博主可以通过欺诈性分享来增加分享数量来进行欺骗。
所以我的问题是我可以使用什么标准来定义最受欢迎的帖子是什么?
对博客文章进行排名的更好算法是什么?
由于“流行”一词在这种情况下是模糊的,我会根据我的标准来定义帖子的流行度。结合所有建议的答案,为博客文章制定合理的声誉系统。例如,基本上我会做这样的事情。
- 脸书分享 x 2
- 推特分享 x 3
- 域的页面排名 x 2
- 50 000 / 全球 Alexa 评级
- 等等
最后,大家可以总结一下,进行比较。此外,您可以制定一些标准,考虑帖子的大小、帖子中的图像数量等。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)