我的高级项目是确定网页的主导类别。我抓取了 dmoz。现在我正在尝试构建arff。之后我将使用一些特征提取方法和分类算法。您知道哪种特征提取方法与用于网络挖掘的任何分类算法表现良好吗?
u分类 http://www.uclassify.com/ uses Bayesian http://en.wikipedia.org/wiki/Naive_Bayes_classifier Networks http://en.wikipedia.org/wiki/Bayesian_network并声称能够对网页进行分类。
uClassify 是一项免费的网络服务,您可以在其中轻松创建自己的文本分类器。例子:
- 垃圾邮件过滤器
- 网页分类
- 自动电子邮件支持
- 语言检测
- 书面文本性别识别
- Mood
- 情绪
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)