如何在 NLTK 中进行依存解析？

2024-02-14

翻阅 NLTK 书，并不清楚如何从给定的句子生成依存树。

本书的相关部分：依存语法子章节 https://www.nltk.org/book/ch08.html#dependencies-and-dependency-grammar给出一个示例图 https://www.nltk.org/book/ch08.html#fig-depgraph0但它没有展示如何解析一个句子来得出这些关系——或者也许我错过了 NLP 中的一些基本知识？

EDIT:我想要类似的东西斯坦福解析器 http://nlp.stanford.edu:8080/parser/做：给定一个句子“我在睡梦中射杀了一头大象”，它应该返回如下内容：

nsubj(shot-2, I-1)
det(elephant-4, an-3)
dobj(shot-2, elephant-4)
prep(shot-2, in-5)
poss(sleep-7, my-6)
pobj(in-5, sleep-7)

我们可以使用 NLTK 的斯坦福解析器。

要求

您需要从他们的网站下载两个东西：

The 斯坦福 CoreNLP 解析器 https://nlp.stanford.edu/software/lex-parser.shtml#Download.
语言模型 http://nlp.stanford.edu/software/corenlp.shtml为您想要的语言（例如英语语言模型 http://nlp.stanford.edu/software/stanford-english-corenlp-2018-02-27-models.jar)

Warning!

确保您的语言模型版本与斯坦福 CoreNLP 解析器版本相匹配！

截至 2018 年 5 月 22 日，当前 CoreNLP 版本为 3.9.1。

下载这两个文件后，将 zip 文件解压到您喜欢的任何位置。

Python代码

接下来，加载模型并通过NLTK使用

from nltk.parse.stanford import StanfordDependencyParser

path_to_jar = 'path_to/stanford-parser-full-2014-08-27/stanford-parser.jar'
path_to_models_jar = 'path_to/stanford-parser-full-2014-08-27/stanford-parser-3.4.1-models.jar'

dependency_parser = StanfordDependencyParser(path_to_jar=path_to_jar, path_to_models_jar=path_to_models_jar)

result = dependency_parser.raw_parse('I shot an elephant in my sleep')
dep = result.next()

list(dep.triples())

Output

最后一行的输出是：

[((u'shot', u'VBD'), u'nsubj', (u'I', u'PRP')),
 ((u'shot', u'VBD'), u'dobj', (u'elephant', u'NN')),
 ((u'elephant', u'NN'), u'det', (u'an', u'DT')),
 ((u'shot', u'VBD'), u'prep', (u'in', u'IN')),
 ((u'in', u'IN'), u'pobj', (u'sleep', u'NN')),
 ((u'sleep', u'NN'), u'poss', (u'my', u'PRP$'))]

我想这就是你想要的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NLP

grammar

NLTK

如何在 NLTK 中进行依存解析？的相关文章

对于 `mouseMoveEvent()` 来说鼠标移动太快

以下是 Python 3 版本 UI XML 代码显示 4QProgessBar对于每个鼠标方向标记为 X X Y Y 快速移动鼠标以圆圈形式将使 4QProgessBar上升到 99 然后是一些QProgessBar休息一下直到鼠
如何在 Heroku 中安装 NLTK 模块

嘿我想在我的 Heroku 服务器上安装 NLTK pos tag 我该怎么办呢请给我一些步骤因为我是 Heroku 服务器系统的新手我刚刚添加了官方nltk支持构建包只需添加一个nltk txt文件包含要安装的语料库列表一切都
Numpy 中矩阵乘以另一个矩阵的每一行

我有一个大小为 4x4 的齐次变换矩阵和一个大小为 nx3 的轨迹该轨迹的每一行都是一个向量我想将齐次变换矩阵乘以轨迹的每一行下面是代码 append zero column at last trajectory np hstack
Python groupby 无法按预期工作[重复]

这个问题在这里已经有答案了我正在尝试读取一个 Excel 电子表格其中包含以下格式的一些列 column1 column1 AccountName column1 SomeOtherFeature column2 blabla colu
倒计时：01:05

如何在 Python 中创建一个看起来像 00 00 分钟和秒的倒计时时钟它独立成一行每次减少一actual秒则应将旧计时器替换为低一秒的新计时器 01 00变成00 59它实际上击中了00 00 这是我开始使用但想要改造的基本计时
Django 和 VirtualEnv 开发/部署最佳实践

只是好奇人们如何结合 virtualenv 部署 Django 项目更具体地说如何使生产虚拟环境与开发计算机正确同步我使用 git 进行 scm 但 git 存储库中没有 virtualenv 我应该这样做还是最好使用 pip fr
如何在Python中拟合阶跃函数

我有一个关于使用 curve fit 等 scipy 例程拟合阶跃函数的问题我很难将其矢量化例如 import numpy as np from scipy optimize import curve fit import matplo
Python NameError，变量“未定义”

它返回的错误是 NameError name lives is not defined 我知道代码并不是尽可能高效这是我的第一个项目但是无论我尝试做什么都会弹出这个错误我尝试为其创建一个全局变量但这没有帮助我真的很感激一些帮助
是否有像 python 的 issubclass 这样的东西，如果第一个参数不是类，它将返回 False？

我想要issubclass 1 str 返回 false 1不是的子类str 因为它根本不是一个类所以我收到了 TypeError 有没有一个好的方法来测试这个而不诉诸try except try if issubclass value
MAMP Python-MySQLdb 问题：调用 Python 文件后 libssl.1.0.0.dylib 的路径发生变化

我正在尝试使用 python MySQLdb 访问 MAMP 服务器上的 MySQL 数据库当我最初尝试使用 python sql 调用 Python 文件来访问 MAMP 上的数据库时我得到了image not found关于错误li
在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数

这是这个问题的后续如何根据 pandas 数据框中其他列中的子字符串创建新列 https stackoverflow com questions 70086559 how to create new column based on sub
替换 Python 列表/字典中的值？

好的我正在尝试过滤传递给我的列表字典并稍微清理它因为其中有某些值我需要删除所以如果它看起来像这样 records key1 AAA key2 BBB key3 CCC key4 AAA 我如何快速轻松地运行所有内容并将 AAA
在 Django 视图中访问其他项目中的模型导致“表不存在”错误

基地项目结构 baseproject baseapp models py class BaseModel models Model 其他项目结构 project app views py urls py 项目 app views py im
使用 Parsec 解析正则表达式

我正在尝试通过实现一个小型正则表达式解析器来学习秒差距在 BNF 中我的语法类似于 EXP EXP LIT EXP LIT 我尝试在 Haskell 中实现这一点 expr try star lt gt try litE lt gt l
何时在 Gevent 中使用线程池

我注意到 Gevent 有线程池对象有人可以向我解释何时使用线程池以及何时使用常规池吗 gevent threadpool 和 gevent pool 有什么区别当你有一段需要很长时间运行几秒钟并且不会导致 greenlet 切换的
TypeError: 'module' 对象不可调用错误 driver=webdriver("C:\\Python34\\Lib\\site-packages\\selenium\\webdriver\\chromedriver.exe")

我在 Pycharm 中遇到类似错误 Traceback most recent call last File C PycharmProjects DemoPyth PythonPack1 Prg1 py line 3 in
PDB.run - 重新启动 pdb 会话

我对 python 和 pdb 比较陌生但我对 gdb 有很多经验我的问题是如果我在代码中设置了多个断点我会想要更改一些内容并重新运行我的调试会话并保留这些断点但是在我的 pdb 会话中输入 run 会导致我的会话终止并显示以下
Python代码检测OS X El Capitan中的暗模式以更改状态栏菜单图标

我有目标 C 代码来检测暗模式以更改状态栏 NSDistributedNotificationCenter defaultCenter addObserver self selector selector darkModeChanged n
Python Flask 不更新图像[重复]

这个问题在这里已经有答案了这里有一些关于图像的 Flask 问题但没有一个能解决我的问题我有一个应用程序可以创建图像保存它然后显示它一次它应该多次执行此操作每次更改图像时它应该加载新图像它不是它只显示与其显示的文件名关
从多个 .csv 文件创建混淆矩阵

我有很多具有以下格式的 csv 文件 338 800 338 550 339 670 340 600 327 500 301 430 299 350 284 339 284 338 283 335 283 330 283 310 282 3

随机推荐

如何使.rdlc报告中的tablix从右侧开始并向左扩展？

我正在开发一个项目 Windows 窗体并且有一个包含多个列的 rdlc 报告当所有列都可见时列从右到左完美显示但当隐藏某些列时每个隐藏列的右侧都会留下一个空白换句话说每个隐藏列都有不可见的内容但其位置仍然存在我尝试了几乎
Python copy.deepcopy() 失败，但没有引发警告、异常或错误

这个问题与另一个问题 https stackoverflow com questions 22683755 issue while trying to copy pyside object我昨天发布了尽管它本质上更普遍由于我提到的线程
如何判断IPv6地址是否私有？

我试图确定给定的 IPv6 地址在 C 中是否是私有的并且我很想简单地使用 IPAddress 类上的 IsIPv6SiteLocal 属性然而正如本节中所解释的comment https stackoverflow com ques
使用 PDFBox 填充横向 PDF

我尝试使用 PDFBox 填写 PDF 表单并成功地使用纵向文档完成了这一工作但我在横向模式下填写文档时遇到问题字段已填满但文本方向不好它看起来是垂直的就像它仍然是纵向的但旋转了 90 度这是我的简化代码 PDDocumen
如何在没有 xml 配置的情况下使用 JasperReportsPdfView

我想要一个控制器方法从 JasperReports jrxml 文件返回 PDF 而不使用任何 xml 配置我想用一个JasperReportsPdfView 这有可能吗我知道这可以只用 Java 代码来完成就像这个博客中一样 htt
为什么fragment中的生命周期方法是公开的，而activity的生命周期方法是受保护的？

该活动被保护封装在框架包 android app 和子类中这个链接 https stackoverflow com questions 20161662 why are lifecycle methods in activity class
当父元素有最小高度/最大高度值但没有高度值时，为什么子元素上的 height: 100% 不适用？

假设我们有以下设置 container background color red width 500px min height 300px child background color blue width 500px height 100
日期范围内的 SQL 分割数

我有一个表例如这个数据 ID start date end date amount a1 2013 12 01 2014 03 31 100 我想要一个分割日期的查询这样我就可以将全年的金额分割出来如下所示 ID org start
c# - 数组从哪里继承（即 .int[] ）

创建数组时例如int 它是否继承自任何东西我认为它可能继承自 System Array 但查看编译后的 CIL 后发现并非如此我认为它可能继承自 System Array 或类似的东西考虑到您可以调用方法并访问数组上的属性 I e
使用 C 编程频谱图 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在尝试用 C 语言制作音频频谱图
向量数学，求角度

我试图通过编写一个小型 2D 游戏来学习 XNA 它是一个自上而下的视角我尝试进行双重移动使用左右和上下键沿轴移动以及向右看鼠标光标以便玩家可以同时奔跑和瞄准我有一个用于玩家位置的向量 m PlayerPos 一个用于鼠标位置的向
如何在 NestJS 中为每个新的 HTTP 请求使用新实例？

我有一个 API 并且正在尝试发送请求这是有效的但我注意到在收到回复后这些类并没有被销毁我目前正在使用 NestJS 但是当我尝试测试时 nodeJS ExpressJS 也遇到了这个问题我正在使用以下代码 Injectable
如何计算两个地点之间的时差

我在计算两个时区之间的时差时遇到问题如果我在位置 A 我知道纬度和经度以及当前时间我去位置B我知道纬度和经度以及当前时间如何计算当前两个点之间的时间差以UTC为单位首先获取一个可以转换纬度经度以获取国家地区和州省的数据库或库
为什么我的 SQL“NOT IN”子句产生与“NOT EXISTS”不同的结果

当我期望两个 SQL 查询产生相同的结果时它们会产生不同的结果我正在尝试查找没有相应位置的事件的数量所有位置都有事件但事件也可以链接到非位置记录以下查询生成计数 16244 这是正确的值 SELECT COUNT DISTINCT
定义双感叹号？

我理解双感叹号的作用或者我认为我理解但我不确定它是如何在随机对象上定义的例如下面的代码片段 Assignment a if getAssignment query a return false hasSolution a if a r
uint 和 unsigned int 之间的区别？

有什么区别吗uint and unsigned int 我正在查看此网站但所有问题都涉及 C 或 C 我想要一个关于C语言的答案如果相关的话请注意我在 Linux 下使用 GCC uint不是标准类型 unsigned int is
关闭 GPS 时广播接收器调用了 2 次？

显现
将 UTF-8 编码的 NSData 转换为 NSString

我有UTF 8编码NSData来自 Windows 服务器我想将其转换为NSString对于iPhone 由于数据包含在两个平台上具有不同值的字符如度数符号如何将数据转换为字符串如果数据不是空终止的您应该使用 initWithDa
当只有插件源可用时，如何在 sbt 项目中使用插件？

我想使用sbt 斯克鲁奇 https github com bancek sbt scrooge插件但它的存储库现在不可用 http koofr github com http koofr github com 我想我应该将这个插件的源代
如何在 NLTK 中进行依存解析？

翻阅 NLTK 书并不清楚如何从给定的句子生成依存树本书的相关部分依存语法子章节 https www nltk org book ch08 html dependencies and dependency grammar给出一个示例图

热门标签