就目前情况而言,这个问题不太适合我们的问答形式。我们希望答案得到事实、参考资料或专业知识的支持,但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放,访问帮助中心 以获得指导。
我开始使用NLTK库 ,我想检查一个英文句子是否正确。
Example:
“他看到鲍勃”——不正确
“他看到鲍勃” - 正确
I read this ,但这对我来说很难。
我需要一个更简单的例子。
语法检查是 NLP 研究的一个活跃领域,因此目前还没有 100% 的答案(甚至可能不是 80% 的答案)。最简单的方法(或至少是合理的基线)是 n-gram 语言模型(标准化话语长度的 LM 概率并为“语法”或“不语法”设置启发式阈值。
您可以使用 Google 的 n-gram 语料库,或者根据域内数据训练您自己的语料库。您也许可以使用 NLTK 来做到这一点;使用 LingPipe、SRI 语言建模工具包或 OpenGRM 绝对可以。
也就是说,n-gram 模型的表现不会那么好。如果它满足您的需求,那就太好了,但如果您想做得更好,您就必须训练机器学习分类器。语法分类器通常会使用句法和/或语义处理中的功能(例如词性标签、依存关系和选区解析等)。您可以查看 Joel Tetrault 和他在 ETS 工作的团队或 Jennifer 的一些工作福斯特和她在都柏林的团队。
抱歉,没有一个简单直接的答案......
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)