如何从NLP Tree中提取元素？

2024-03-13

我正在使用NLP包来解析句子。我怎样才能从Tree创建的输出？例如，我想抓住名词短语（NP）来自下面的示例：

library(NLP)
library(openNLP)

s <- c(
    "Really, I like chocolate because it is good.", 
    "Robots are rather evil and most are devoid of decency"
)
s <- as.String(s)


sent_token_annotator <- Maxent_Sent_Token_Annotator()
word_token_annotator <- Maxent_Word_Token_Annotator()
a2 <- annotate(s, list(sent_token_annotator, word_token_annotator))

parse_annotator <- Parse_Annotator()

p <- parse_annotator(s, a2)
ptexts <- sapply(p$features, `[[`, "parse")
ptexts

ptrees <- lapply(ptexts, Tree_parse)

ptrees

## [[1]]
## (TOP
##   (S
##     (S
##       (S
##         (ADVP (RB Really))
##         (, ,)
##         (NP (PRP I))
##         (VP
##           (VBP like)
##           (NP (NN chocolate))
##           (SBAR (IN because) (S (NP (PRP it)) (VP (VBZ is) (ADJP (JJ good)))))))
##       (. .)
##       (, ,)
##       (NP (NNP Robots))
##       (VP (VBP are) (ADJP (RB rather) (JJ evil))))
##     (CC and)
##     (S (NP (RBS most)) (VP (VBP are) (ADJP (JJ devoid) (PP (IN of) (NP (NN decency))))))))

我想从Tree但无法从文档中找出Tree_parse。使用str表明这应该很容易做到，但我无法实现。

我希望它返回类似的内容：

[1] "I"      "Robots"

Or as a list而不是向量。

这可能需要有openNLPmodels.en安装自：http://datacube.wu.ac.at/src/contrib/ http://datacube.wu.ac.at/src/contrib/

下载并运行

install.packages(
    "http://datacube.wu.ac.at/src/contrib/openNLPmodels.en_1.5-1.tar.gz",  
    repos=NULL, 
    type="source"
)
              `

如果有帮助的话大家可以参考一下Tree直接使用curl我的 Dropbox 中的包：

library(curl)
ptrees <- source(curl("https://dl.dropboxusercontent.com/u/61803503/Errors/tree.R"))[[1]]

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

NLP

opennlp

如何从NLP Tree中提取元素？的相关文章

R data.table fread 使用不带标题的命名 colClasses（例如没有 col.names？）

更新 2016 年 6 月 col names 已添加到 data table 1 9 6 所以问题已经结束每个人都非常高兴我想我现在可以将所有 read csv 调用转换为 fread 调用而不必担心破坏原问题使用数据表1 9
将 r 数据框中的列字符串转换为数字

我有一个数据框其中有一列字符串如下所示 mydata lt c 1 356670 35 355030 1 356670 35 355030 1 356620 35 355890 1 356930 35 358660 1 357000 3
如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中进行主题提取以便我能够根据主题获得情感我在用nltk在 python2 7 中用于此目的以下面的句子为例 Donald Trump is the worst president of USA but Hillary
带有 geom_errorbar 的position_dodge

我有以下代码 require ggplot2 pd lt position dodge 0 3 ggplot dt aes x Time y OR colour Group geom errorbar aes ymin CI lower y
如何在 switch 语句中将向量作为参数传递

我对问题的谷歌搜索没有返回有用的结果和文档 switch没有告诉我如何做所以我希望我能在这里得到答案假设我有一个向量 cases lt c one two three 我想使用 switch 语句并将这些元素作为 switch 语句的参
dmvnorm MVN 密度 - RcppArmadillo 实现比 R 包慢，包括一些 Fortran

The solution现已上线RCPP画廊 http gallery rcpp org articles dmvnorm arma 我从 RcppArmadillo 中的 mvtnorm 包重新实现了 dmvnorm 我有点喜欢犰狳但我
r caret 包中的 train 函数的模型输出尺寸巨大

我正在使用 bagFDA 模型进行训练train r caret 包中的函数并将模型输出保存为 Rdata 文件输入文件大约有 300k 条记录有 26 个变量但输出 Rdata 大小为 3G 我只是运行以下命令 modelout
如何安装和管理多个版本的 R 包

我正在开发一个使用 R 进行可重现计算的框架我正在努力解决的一个问题是某些 R 代码可能在包的 X Y Z 版本中完美运行但是为什么你在 3 年后尝试重现它这些包已经更新了一些功能发生了变化代码不再运行此问题还会影响使用包的
在 R 中使用 gsub 删除尾随空格[重复]

这个问题在这里已经有答案了有没有人有一个技巧可以用 gsub 删除变量上的尾随空格以下是我的数据示例正如您所看到的我在变量中同时包含尾随空格和嵌入空格 county lt c mississippi mississippi cany
Rstudio 命令历史记录

这些天我经常使用 Rstudio 但最近注意到我的命令不再存储在历史记录中我不知道这是从什么时候开始的但可能是在安装最新版本时发生的关于问题可能是什么的任何想法吗 Thanks 这是我们在 v0 93 73 中引入并在 v0 93 7
R：为什么 kable 不在 for 循环内打印？

我正在使用 rmarkdown 和 Latex 编写报告我需要使用打印一组表格knitr kable 但在 for 循环内时不会打印这是我的代码 title project title author Mr Author date 201
无重叠的抖动点

My data a lt sample 1 5 100 replace TRUE b lt sample 1 5 100 replace TRUE c lt sample 1 10 100 replace TRUE d lt sample
字边界正则表达式问题

我在使用单词边界时遇到问题 b在我的正则表达式中我正在使用 R 但当我尝试时问题也存在http regexr com http regexr com 我使用的模式是 bs l b 虽然我预计下面的第 1 行和第 3 行能够匹配此模式但只
如何融合颜色和形状？

当我有一个超过 6 个值的变量时我的麻烦就开始了因为这是 ggplot2 中 scale shape 函数的当前最大值由于这个问题我尝试使用另一个变量来解决这个问题我只是将原始变量的长度包裹起来这是我的示例代码 dataf lt
再现频率矩阵图

我想在 R 中重新创建一个情节情节如下来源 Boring E G 1941 作为动态平衡的统计频率心理学评论 48 4 279 这略高于我的工资等级能力因此在这里询问无聊的状态第一次 A 只能出现从不 0 或总是 1 在
R Data.Table 创建带有条件的变量

我需要在下面的数据集中创建一个新变量 A X a 1 b 2 c 3 d 4 e 5 f 6 g 7 h 8 i 9 j 10 The newvar如果X等于 2 5 7 或 9 否则 newvar应该是 0 Code dt1 lt dat
R-在多个图的外缘绘制居中图例

我想在具有多个绘图的设备中的绘图区域之外绘制居中图例 SO 中提出了许多关于更改 R 图中图例位置的问题略有不同例如 1 R 组合图的通用标题和图例 https stackoverflow com questions 8736966 r
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
将天气 iframe 嵌入到 Shiny Dashboard 中

我正在尝试将 Forecast io 的天气预报嵌入到闪亮的仪表板中我最初在使用符号时遇到了麻烦但看到一篇文章提供了如何使用特殊字符格式化 HTML 代码的示例但是当我运行该应用程序时我看到一个简单的未找到即使我知道该链接有

随机推荐

完全隐藏 Chart.js 中的空条

In my Chart js 条形图每个标签大约有 6 个数据集其中一些数据集的值为 0 这会导致 x 轴上出现空白请参阅我想删除这些空白我该怎么做从数据库呈现我的代码后它看起来像这样请注意为了简单起见我大大减少了代码
如何将系统分解为模块？

模块化的有效性取决于将系统划分为模块所使用的标准我想要的是提出一些可用于将系统分解为模块的标准 Cohesion http en wikipedia org wiki Cohesion computer science 模块中的功能是
如何在 Dragover/dragenter HTML 5 拖放过程中更改图标

如何在 Dragover 或 Dragenter 过程中更改 DnD 拖放图标有可能吗如果拖放源位于 html 页面内部例如将一个 div 拖到另一个 div 中我可以在拖拽启动期间更改图标这是我的代码我正在使用角度我已经设
在 if 语句中展开多个选项

我想在一个 if 语句中解开两个选项但编译器抱怨密码常量运算符后的预期表达式可能是什么原因 if let email self emailField text let password self passwordField text d
如何强制 Google Charts vAxes 渲染？

目前我在页面上渲染两个图表我正在使用谷歌的可视化图表库由于页面大小问题 vAxes 在某些大部分时间拒绝渲染如果我给它足够的空间它就会很好地渲染轴但如果它稍微偏离即使有足够的空间容纳这些该死的轴它们也会拒绝渲染我不能这样
Windows Phone IE 移动 bug 具有透明背景图像和底部绝对定位

我在使用 WP IE 时遇到两个问题透明背景图像的透明边框上有伪影绝对定位的 div 到页面底部在浏览器导航栏和页面底部之间留下约 5px 的白色间隙请注意我使用 div 而不是 img 来处理CSS 视网膜图像替换 http co
透明状态栏不适用于 windowTranslucentNavigation="false"

我正在开发一个Activity我需要在运行 5 0 API 21 的设备上使导航栏不透明并使状态栏透明下面是我使用的样式以及对我的问题的解释 AppTheme延伸Theme AppCompat Light NoActionBar
从非托管 C 调用托管代码

因此经过大约一天半的时间我的进展为零我需要用 C 语言编写一个 DLL 用作现有应用程序的插件 DLL 必须由 Visual Studio 2008 编译器使用以下选项进行编译 cl DNT40 DPOMDLL DCRTAPI1 cd
MySQL 多 ID 查找

我正在尝试向系统添加全文搜索我想要编写的查询需要涉及多次查找然后进行搜索如果可能的话我有一张教师表和一张科目表 teacherProfile teacherId int primary key subjectOneId int su
读取时出现 Ruby CSV UTF8 编码错误

这就是我正在做的 csv CSV open file name r 我用它来测试 line csv shift while not line nil puts line line csv shift end 我遇到了这个 ArgumentE
html中有vr（垂直规则）吗？

我知道html中有hr 水平规则但我不相信有vr 垂直规则我错了吗如果没有为什么没有垂直规则不没有垂直规则编辑现在是 2021 年我回答这个问题十二年后我不再认为我原来的解释是正确的原文解释拥有一个没有逻辑意义 HT
具有相同名称/路径的多个 cookie 的浏览器行为

我对当存在多个具有相同名称和路径且对当前域有效的 cookie 时各种浏览器的行为感兴趣例如浏览器存储了这两个cookie key value path domain foo bar baz key value path domain
为什么 svn import 选项无法检测文件重复

如果我想签入 SVN 中已存在的同名文件在这种情况下我将无法提交例如 Name doc and name doc 但是在这种情况下我将能够导入这种情况甚至适用于文件夹名称这可以防止将来进行结账操作有没有办法防止文件或文件夹重复
运行桌面版 libgdx 示例 gdx-invaders 时出现 java.lang.NoClassDefFoundError

我正在构建 libgdx 的 gdx invaders 示例有两个项目 gdx入侵者基础项目作为桌面 Java 应用程序运行gdx 入侵者 android项目依赖于 gdx invaders 并作为 Android 应用程序运行我
Golang反射：无法设置包装结构的接口字段

我正在尝试实现一种方法该方法可以更改可以具有任意结构的对象中的字段值当我有指向结构的指针时字段的遍历没有问题但是当我有一个接口不包装指向结构的指针而是包装结构本身时我无法设法更改字段简而言之 The following doe
我什么时候必须声明 session_start(); ？

所以我是 PHP 的初学者所以我需要一些帮助我正在尝试确定何时开始会议我应该在用户首次注册时执行此操作还是在用户登录时执行此操作另外会话是否通用意味着当我检查会话时它会起作用还是我必须在所有页面中包含一个文件来检查某人是否有会
.NET 中的 DDD / 聚合

我一直在阅读 Evans 关于 DDD 的书并且正在思考应该如何在 NET 中实现聚合目前我只能想出一种方法将聚合隔离在单独的类库中然而这似乎有点矫枉过正我更愿意将所有域对象保留在一个库中我想知道是否有不同的方法 1 lib
使用 Criteria API 从 NHibernate 获取不同的结果集？

我试图使用 NHibernate 中的 Criteria API 获得不同的结果我知道使用 HQL 可以做到这一点但我更喜欢使用 Criteria API 来执行此操作因为我的应用程序的其余部分仅使用此方法编写我找到这个论坛帖子 h
使用 NEON 对 ARM 汇编中的四字向量中的所有元素求和

我对组装相当陌生尽管手臂信息中心通常很有帮助但有时这些说明可能会让新手感到有点困惑基本上我需要做的就是对四字寄存器中的 4 个浮点值求和并将结果存储在单个精度寄存器中我认为 VPADD 指令可以满足我的需要但我不太确定你可以尝
如何从NLP Tree中提取元素？

我正在使用NLP包来解析句子我怎样才能从Tree创建的输出例如我想抓住名词短语 NP 来自下面的示例 library NLP library openNLP s lt c Really I like chocolate because

如何从NLP Tree中提取元素？

如何从NLP Tree中提取元素？ 的相关文章

随机推荐

热门标签

如何从NLP Tree中提取元素？的相关文章