我想知道是否可以使用Stanford CoreNLP
检测句子是用哪种语言写的?如果是这样,这些算法的精确度如何?
几乎可以肯定的是,斯坦福 COreNLP 目前还没有语言识别功能。 “几乎”——因为不存在更难证明。
编辑:尽管如此,以下是间接证据:
- 也没有提到语言识别主要的
页, nor 核心自然语言处理页面,也不在FAQ(虽然有
问题“我如何在其他语言上运行 CoreNLP?”),也不在2014年
纸CoreNLP 的作者;
- 结合多个 NLP 库的工具
包括斯坦福 CoreNLP 使用另一个语言库
身份识别,例如DKPro 核心 ASL; also 其他
用户谈论语言识别和CoreNLP并没有提到这个能力
- CoreNLP的源文件包含
Language
类,但与语言识别无关 - 你可以
手动检查所有 84 次出现的“语言”单词here
Try TIKA, or TextCat, or Java 语言检测库(他们报告“53 种语言的准确率超过 99%”)。
一般来说,质量取决于输入文本的大小:如果它足够长(例如,至少几个单词并且不是专门选择的),那么精度可能会相当不错 - 大约 95%。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)