如何找到句子的主语? [关闭]

2024-04-05

我是 NLP 新手,正在研究应该使用哪种语言工具包来执行以下操作。我想做两件事之一来完成同样的事情:

  1. 我基本上想对文本进行分类,通常是一个包含 15 个单词的句子。想要对句子是否谈论特定主题进行分类。

  2. 有没有一个工具,给出一个句子,它找出句子的主语。

我使用 PHP 和 Java,但该工具可以是在 Linux 命令行上运行的任何工具

非常感谢。


最基本的方法是创建一组带标签的训练数据并使用它来训练分类器。分类器的工作原理是一个更复杂的问题 - 对于垃圾邮件过滤和许多其他事情,仅查看词频就可以很好地工作。

这是一个基本示例:

编写朴素贝叶斯分类器很简单;像 MALLET 这样的软件包也会有这个以及更好的机器学习方法。灵笛也会有这种东西。

您真正应该关心的是数据的质量和您的功能是什么。我所说的数据质量是指没有那么多边界情况的大量数据,而我所说的特征是指您只选择单词、单词组合(单词 ngram)、依赖特征或更复杂的东西。您需要一种方法来创建特征数据并实际进行学习!从这个意义上说,Lingpipe 很好,因为您可以首先进行标记化等操作,而不是编写自己的函数来执行此操作或必须将其他工具拼凑到您自己的特征生成代码中。

您可以在此处找到 MALLET 指南:http://courses.washington.edu/ling570/fei_fall10/11_15_Mallet.pdf http://courses.washington.edu/ling570/fei_fall10/11_15_Mallet.pdf

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何找到句子的主语? [关闭] 的相关文章

随机推荐