如何使用 Python 在 NLTK 中使用斯坦福解析器

2023-11-22

是否可以在 NLTK 中使用斯坦福解析器？（我不是在谈论斯坦福 POS。）

请注意，此答案适用于 NLTK v 3.0，而不适用于更新的版本。

当然，请在 Python 中尝试以下操作：

import os
from nltk.parse import stanford
os.environ['STANFORD_PARSER'] = '/path/to/standford/jars'
os.environ['STANFORD_MODELS'] = '/path/to/standford/jars'

parser = stanford.StanfordParser(model_path="/location/of/the/englishPCFG.ser.gz")
sentences = parser.raw_parse_sents(("Hello, My name is Melroy.", "What is your name?"))
print sentences

# GUI
for line in sentences:
    for sentence in line:
        sentence.draw()

Output:

[树('ROOT', [树('S', [树('INTJ', [树('呃', ['你好'])]), 树(',', [',']), 树('NP', [树('PRP$', ['我的']), 树('NN', ['名称']）]），树（'VP'，[树（'VBZ'，['是']），树（'ADJP'，[树（'JJ'， ['Melroy'])])]), Tree('.', ['.'])])]), Tree('ROOT', [Tree('SBARQ', [树（'WHNP'，[树（'WP'，['什么']）]），树（'SQ'，[树（'VBZ'， ['是']), 树('NP', [树('PRP$', ['你的']), 树('NN', ['名称'])])]), 树（'。'， ['？']）]）]）]

Note 1:在此示例中，解析器和模型 jar 都位于同一文件夹中。

Note 2:

stanford解析器的文件名为：stanford-parser.jar
stanford模型的文件名是：stanford-parser-x.x.x-models.jar

Note 3:可以找到englishPCFG.ser.gz文件insidemodels.jar 文件（/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz）。请使用存档管理器“解压缩”models.jar 文件。

Note 4:确保您使用的是 Java JRE（运行时环境）1.8也称为 Oracle JDK 8。否则您将得到：不支持的 Major.minor 版本 52.0。

安装

从以下位置下载 NLTK v3：https://github.com/nltk/nltk。并安装NLTK：

sudo python setup.py 安装
您可以使用 NLTK 下载器来使用 Python 获取斯坦福解析器：
```
import nltk
nltk.download()
```
试试我的例子吧！（不要忘记更改 jar 路径并将模型路径更改为 ser.gz 位置）

OR:

下载并安装NLTK v3，与上面相同。
从 (当前版本文件名是 stanford-parser-full-2015-01-29.zip）：http://nlp.stanford.edu/software/lex-parser.shtml#Download
提取 stanford-parser-full-20xx-xx-xx.zip。
创建一个新文件夹（在我的示例中为“jars”）。将提取的文件放入此 jar 文件夹中：stanford-parser-3.x.x-models.jar 和 stanford-parser.jar。

如上所示，您可以使用环境变量（STANFORD_PARSER 和 STANFORD_MODELS）指向此“jars”文件夹。我使用的是 Linux，所以如果您使用 Windows，请使用类似以下内容的内容：C://folder//jars。
使用存档管理器 (7zip) 打开 stanford-parser-3.x.x-models.jar。
浏览 jar 文件内部； edu/斯坦福/nlp/models/lexparser。再次提取名为“englishPCFG.ser.gz”的文件。请记住提取该 ser.gz 文件的位置。
创建StanfordParser实例时，您可以提供模型路径作为参数。这是模型的完整路径，在我们的示例中为 /location/of/englishPCFG.ser.gz。
试试我的例子吧！（不要忘记更改 jar 路径并将模型路径更改为 ser.gz 位置）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

NLP

NLTK

stanfordnlp

如何使用 Python 在 NLTK 中使用斯坦福解析器的相关文章

python 中 matlibplot 中散点图的缩放轴

我正在使用 matlibplot 进行数据可视化我的绘图共有 6502 个数据值运行良好但值接近且密集例如我的 y 轴值范围在 3 到 10 之间我需要清楚地获取它们之间的每个点即像 9 2 和 9 8 这样的值至少要以 1
如何从Python请求库正确返回http响应（想要一个Python反向代理）

这个问题继续自here https stackoverflow com questions 48635552 how to programmatically communicate with apache 我想创建一个反向代理它允许我托管
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
如何配置 VS Code 以便能够单步执行调试 Python 脚本时加载的共享库 (.so)？

从命令行使用 gdb 我可以在加载共享库时中断知道我有共享库的源代码如何在 VS Code 中获得相同的行为对我来说它以某种方式起作用这是我的设置 Ubuntu 18 04 调试我从 Python3 加载的 C 共享库更具体地说
Python：如何使用 f 字符串进行数学运算

我正在尝试使用 python 3 6 的新 f 字符串功能编写自己的 99 瓶啤酒实现但我被困住了 def ninety nine bottles for i in range 10 0 1 return f i bottles of b
将 for 循环转换为列表理解

我有一个for循环将字符串列表中每个元素的子字符串与另一个字符串列表中的元素进行比较 mylist for x in list1 mat False for y in list2 if x 14 in y mat True if not
Python正则表达式查找所有单个字母字符

我想找到字符串中单个字母字符每次出现的所有索引我不想捕获单个字符 html 代码这是我的代码 import re s fish oil B stack peanut c b words re finditer S s has alpha
使用 lxml 和 xpath 解析 xml 文件时如何保留 &

我试图从输入 xml 文件中提取一些信息并使用 lxml 和 xpath 指令将其打印到输出文件中我在读取如下所示的 xml 标签时遇到问题
为什么tcl/tkinter只支持BMP字符？

我正在尝试在基于 tkinter 和 tcl 构建的 gui 中查询和显示 utf 8 编码字符但是我发现 tkinter 无法显示 4 字节字符即大于 U FFFF 的 unicode 代码点为什么会这样呢实现非 BMP 字符对
Flask / Werkzeug - 套接字卡在 CLOSE_WAIT 中

我遇到过一种情况 API 构建于Flask 宁静 https github com flask restful flask restful间歇性变得无反应目前它从 Werkzeug 运行我知道它仅用于非生产用途并且是单线程的让事情变
测试 python 列表的所有元素是否为 False

如何返回False如果所有元素都在列表中False 给定的列表是 data False False False Using any https docs python org 2 library functions html any gt
Django：在管理界面中显示多对多项目的列表

这可能是一个简单的问题但我似乎无法理解我在 models py 中有两个简单的模型 Service 和 Host Host services 与 Service 具有 m2m 关系换句话说一台主机有多个服务一个服务可以驻留在多个主
如何获取 Flask 中当前的基本 URI？ [复制]

这个问题在这里已经有答案了在下面的代码中我想将 URL 存储在变量中以检查发生 URL 错误的错误 app route flights methods GET def get flight flight data mongo db fl
在 python 中以半小时为增量创建选择列表

我正在尝试创建一个
如何使绘图的 xtick 标签成为简单的绘图？

我不想用单词或数字作为 x 轴的刻度标签而是想绘制一个简单的绘图由直线和圆圈组成作为每个 x 刻度的标签这可能吗如果是这样在 matplotlib 中处理它的最佳方法是什么我会删除刻度标签并将文本替换为patches http
在 C++ 中运行 python [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个用 C 编写的应用程序和一个测试系统也是用 C 编写的测试系统非常复杂并且很难改变我只想做一些小的改变我的班级是这样的
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
python 格式日期时间，带有“st”、“nd”、“rd”、“th”（英文序数后缀），如 PHP 的“S”

我想要一个 python datetime 对象来输出并在 django 中使用结果如下所示 Thu the 2nd at 4 30 但我在python中找不到输出的方法st nd rd or th就像我可以使用 PHP 日期时间格式一
python - 从完整地址获取邮政编码

我有一个数据框其中一列中有完整地址我需要创建一个仅包含邮政编码的单独列有些地址只有五位数字的邮政编码而其他地址则有额外的四位数字如何拆分列以获取邮政编码示例数据 d name bob john address 123 6th S
阅读 setup.py 中的 README

所以我想要long description我的设置脚本的内容是我的README md文件但是当我这样做时源代码发行版的安装将失败因为python setup py sdist不复制自述文件有没有办法让distutils core

随机推荐

Fragment 和 FragmentStatePagerAdapter 内带有 ViewPager 的 Fragment 会导致异常（带有完整示例）

我有一个带有 ViewPager 的简单片段我正在使用最新的支持库 v4 rev18 如果我第一次显示子片段一切正常如果我返回并再次显示它应用程序会崩溃并出现以下异常我有一个完整的示例显示何时发生以下异常 java lang
Javascript 提供哪些调试日志记录工具？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我想创建一个通用调试日
Func<> 与委托和 lambda 表达式之间的区别[重复]

这个问题在这里已经有答案了在深入了解 C 的更高级功能时我遇到了一些代码但我并不完全知道其中的区别这是关于这两行 Func
关闭主窗体

我正在使用 C Windows 表单开发一个简单的应用程序主窗体打开另一个窗体但我不想要这两种窗体我希望当第二个表单打开时第一个表单关闭由于第一种形式主要使用 this Close 显示第二个表格后将关闭两者所以我用这个代替 pr
在 C/C++ 中向指针添加 1 个字节的正确方法是什么？

我现在正在使用这段代码将指针移动 1 个字节但我感觉有些不清楚 int a int malloc sizeof int void b char a 1 char是 1 个字节但未定义用于字节操作目的我相信还有另一种方法可以做到这一点
有没有办法在 Azure DevOps CI/CD 构建管道中设置日期和时间（时区）

我在 CI CD 构建管道中运行了自动化测试但 DevOps 中的时间是 UTC 我的断言测试检查本地时间有没有办法在我的构建管道中设置时区使用 Powershell 您可以执行以下操作 Get TimeZone Set TimeZo
无法将数据库状态与会话同步

无法将数据库状态与会话同步 org hibernate exception GenericJDBCException 无法更新我在尝试更新数据库时收到此错误我的数据库中没有定义唯一键但 id 字段已定义为主键这是更新函数的代码 pu
Chrome 打印预览不加载 @media 仅打印字体

我想要一个与屏幕不同的打印字体不幸的是 Google Chrome 打印预览适用于其他浏览器不会加载字体也不会显示文本但如果您第二次尝试字体将被加载然后 Google Chrome 打印预览将显示文本这是一个可以重现问题的小
从字符串中删除字符及其后的所有内容

我知道要替换字符串的字符串但只有当我确切知道要删除的内容时这才有效如果我有一个如下所示的字符串嗨那里这是一个测试功能嗨那里如何删除 feature 及其后的所有内容任何帮助将不胜感激提前致谢编辑如果绝对需要使用
从 NodeJS 中的 keycloak 会话获取用户名

有没有类似的东西 request getUserPrincipal getName Java 在Node中我们使用时获取用户名连接钥匙斗篷使用快速中间件我也遇到了这个问题我确实深入研究了中间件代码并试图找到类似的东西事实证明 requ
CSS 导入字体

我需要在网站上使用 4 种字体并且我的网站文件夹中有这些文件 Baskerville ttc BellGothicstd Black otf BellGothicstd Bold otf JennaSue ttf 我尝试使用 Import
如何解析 shell 脚本中的符号链接

给定绝对或相对路径在类 Unix 系统中我想在解析任何中间符号链接后确定目标的完整路径同时解决用户名符号的奖励积分如果目标是一个目录则可以 chdir 进入该目录然后调用 getcwd 但我真的想从 shell 脚本中执行此操
声纳违规：安全性 - 数组直接存储

存在声纳违规声纳违规安全性数组直接存储 public void setMyArray String myArray this myArray myArray 解决方案 public void setMyArray String new
如何在 React Native 中抑制由于第三方 PropTypes 库而产生的警告

在 React Native 中使用样式表时我收到了大量警告如下图所示 iOS 模拟器上的警告怎么抑制呢无法禁用特定组件的警告但您可以在应用程序中禁用不同类型的警告要禁用所有警告请使用 console disableYello
外部硬盘上的 MySQL 表

我有大量文本数据需要导入MySQL 我在 MacBook 上执行此操作但没有足够的空间因此我想将其存储在外部硬盘驱动器中目前我并不真正关心速度这只是为了测试最好的方法是什么在外部硬盘上安装 MySQL 这在 Mac 上可行吗在
动态设置局部变量[重复]

这个问题在这里已经有答案了如何在Python中动态设置局部变量变量名是动态的与已发布的其他答案相反您无法修改locals 直接并期望它能起作用 gt gt gt def foo lcl locals lcl xyz 42 print
UserPrincipal.FindByIdentity() 始终返回 null

我正在使用 LdapAuthentication 将用户登录到 Active Directory 我想找到该用户所属的所有组我正在使用以下代码 string adPath LDAP OU HR Controlled Users OU Al
用 Perl 读取精美的文件

我正在寻找在 Perl 中读取文件的有效方法并发现了这一非常有趣的行 my text do local ARGV file lt gt 我的问题是这到底是如何运作的通常在读取您设置的文件时 undef 但我不明白这是如何做到的事实证
通过收集多列来整理数据集？ [复制]

这个问题在这里已经有答案了我想通过这样操作数据来整理数据集 age gender education previous comp exp tutorial time qID 1 time taken 1 qID 2 time taken
如何使用 Python 在 NLTK 中使用斯坦福解析器

是否可以在 NLTK 中使用斯坦福解析器我不是在谈论斯坦福 POS 请注意此答案适用于 NLTK v 3 0 而不适用于更新的版本当然请在 Python 中尝试以下操作 import os from nltk parse impor

如何使用 Python 在 NLTK 中使用斯坦福解析器

安装

如何使用 Python 在 NLTK 中使用斯坦福解析器 的相关文章

随机推荐

热门标签

如何使用 Python 在 NLTK 中使用斯坦福解析器的相关文章