如何在斯坦福 CoreNLP 中获取短语标签？

2023-12-06

如果我想获取每个单词对应的短语标签，如何获取？

例如：

在这句话中，

我的狗也喜欢吃香肠。

我可以在斯坦福 NLP 中得到一个解析树，例如

(ROOT (S (NP (PRP$ My) (NN dog)) (ADVP (RB also)) (VP (VBZ likes) (NP (JJ eating) (NN sausage))) (. .)))

在上面的情况下，我想获得与每个单词对应的短语标签，例如

(My - NP), (dog - NP), (also - ADVP), (likes - VP), ...

有没有什么方法可以简单地提取短语标签？

请帮我。

//I guess this is how you get your parse tree.
Tree tree = sentAnno.get(TreeAnnotation.class);

//The children of a Tree annotation is an array of trees.
Tree[] children = parent.children() 

//Check the label of any sub tree to see whether it is what you want (a phrase)
for (Tree child: children){
   if (child.value().equals("NP")){// set your rule of defining Phrase here
          List<Tree> leaves = child.getLeaves(); //leaves correspond to the tokens
          for (Tree leaf : leaves){ 
            List<Word> words = leaf.yieldWords();
            for (Word word: words)
                System.out.print(String.format("(%s - NP),",word.word()));
          }
   }
}

该代码尚未经过充分测试，但我认为它大致可以满足您的需要。更重要的是，我没有写任何有关递归访问子树的内容，但我相信您应该能够做到这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP

stanfordnlp

phrase

parsetree

如何在斯坦福 CoreNLP 中获取短语标签？的相关文章

browserify :- 未捕获类型错误：fs.readFileSync 不是函数

我试图在我的代码中使用natural js 在客户端使用它我使用browserify 但它给出了一个错误 Uncaught TypeError fs readFileSync is not a function at loadDictio
NLTK 中的 FreqDist 未对输出进行排序

我是 Python 新手我正在尝试自学语言处理 python 中的 NLTK 有一个名为 FreqDist 的函数可以给出文本中单词的频率但由于某种原因它无法正常工作这是教程让我写的 fdist1 FreqDist text1 vo
使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数？

我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
word2vec gensim 多种语言

这个问题完全超出了我的想象我正在使用 gensim 训练 Word2Vec 模型我提供了多种语言的数据即英语和印地语当我试图找到最接近人的词时我得到的是 model wv most similar positive man O
日语/字符的编程技巧[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个想法可以编写一些网络应用程序来帮助我也许还有其他人更好地学习日语因为我正在学习日语我的问题是该网站主要是英文的所以
doc2vec 获得良好性能所需的最小数据集大小是多少？

在不同大小的数据集上进行训练时 doc2vec 的表现如何原始语料库中没有提到数据集大小所以我想知道从 doc2vec 中获得良好性能所需的最小大小是多少有很多东西被称为 doc2vec 但它似乎最常指的是 Le 和 Mikolov
NLTK CoreNLPDependencyParser：无法建立连接

我正在尝试通过 NLTK 使用斯坦福解析器按照示例here http www nltk org api nltk parse html nltk parse corenlp CoreNLPDependencyParser 20tutori
在Python或Sklearn中用整数值对具有字符串值的列变量进行编码

如何用整数值对数据表中字符串类型的列值进行编码例如我有两个特征变量颜色可能的字符串值 R G 和 B 和技能可能的字符串值 C Java SQL 和 Python 给定数据表有两列 Color gt R G B B G R B G
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试例如给定一个句子这本书很好请提供任意数量的意思相反的替代句子例如这本书不好甚至这本书不好显然以高精度实现这一点可能超出了当前 NLP 的范围但我确信在这个主题上已经有了一些工作
语音识别中如何处理同音词？

对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的我提供以下示例我们的是嗨和高到太二在使用时语音API https developer apple com docume
如何训练斯坦福 NLP 情感分析工具

地狱大家我正在使用斯坦福核心 NLP 包我的目标是对推文直播进行情感分析按原样使用情感分析工具对文本态度的分析非常差许多积极因素被标记为中性许多消极因素被评为积极我已经在文本文件中获取了超过一百万条推文但我不知道如何实际获
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
如何对德语文本进行词形还原？

我有一篇德语文本我想对其应用词形还原如果不可能进行词形还原那么我也可以接受词干提取 Data 这是我的德语文本 mails Hallo Ich spielte am fr hen Morgen und ging dann zu ein
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
阻止斯坦福核心 NLP 服务器输出它收到的文本

我正在运行一个斯坦福核心自然语言处理 http stanfordnlp github io CoreNLP server java mx4g cp edu stanford nlp pipeline StanfordCoreNLPServe
NLTK：包错误？朋克和泡菜？

基本上我不知道为什么会收到此错误只是为了获得更多图像这里有一个代码格式的类似消息由于是最新的该帖子的答案已经在消息中提到 Preprocessing raw texts LookupError Traceback most rec
PHP 和 NLP：嵌套括号（解析器输出）到数组？

想要将带有嵌套括号的文本转换为嵌套数组以下是 NLP 解析器的输出示例 TOP S NP PRP I VP VBP love NP NP DT a JJ big NN bed PP IN of NP NNS roses 原文我喜欢一大床
斯坦福 CoreNLP：使用部分现有注释

我们正在尝试利用现有的代币化句子分割和命名实体标记同时我们希望使用斯坦福 CoreNlp 额外为我们提供词性标注词形还原和解析目前我们正在尝试以下方式 1 为 pos lemma parse 创建一个注释器 Propert

随机推荐

在运行时设置 ConnectionString

我是 C 编程的初学者我需要编辑设置更改我存储在我的连接字符串app config 我正在使用 VS 数据库向导来创建查询如果你能写出代码那就太好了像这样的事情应该让你开始 using System Configuration v
设置为“通知”时正在裁剪大图片

我想在 Android 通知栏中显示大图片样式图像但我遇到了问题 gt 当我使用以下代码在通知栏中设置图像时 PendingIntent resultPendingIntent stackBuilder getPendingIntent
使用外部 smtp 服务器发送电子邮件时达到 Amazon EC2 邮件限制

Hi我使用 grails MailSender 服务使用下面的 Java Mail API 从 Amazon EC2 Linux 实例发送大量电子邮件我已将邮件 API 配置为使用端口 25 上的外部 smtp 服务器来发送电子邮件并
向动态收件人发送电子邮件 SSIS 发送邮件任务

我有一个 SSIS 包将在测试登台和最终生产中部署它有几个发送邮件任务比如 10 个作为开发人员我将我的电子邮件地址作为电子邮件的收件人目前对于测试人员我需要将所有脚本任务中的所有 To 更改为例如电子邮件受保护如果
Oracle SQL：使用 REGEXP_SUBSTR 表达式的插入查询非常长（分割字符串）

我必须插入表 2 字段第一个主键关于文章第二个涉及它们的大小这些文章在源环境中我有表主键 TK 文章和第二个字段的大小串联但是我必须将 TK 文章和文章的几种大小插入到目标表中例如来源 ART SIZE 1 28 3
在 JavaScript 中，为什么我通常更喜欢“const”而不是“let”？

为什么大部分时间我应该使用const代替let在 JavaScript 中众所周知如果我们使用const那么我们以后就无法重新分配值了那为什么不使用let代替const 基本上 use let如果变量的值在代码期间会改变 use co
如何在bash中获取变量配置的值？ [复制]

这个问题在这里已经有答案了我有一个 linux 配置文件其格式如下 VARIABLE 5753 VARIABLE2 我怎样才能得到f e 使用标准 Linux 工具或正则表达式计算 VARIABLE2 的值我需要从文件解析目录路径提
当返回 2xx 以外的代码时，如何使用 HttpURLConnection 获取响应正文？

当服务器返回错误时我在检索 Json 响应时遇到问题请参阅下面的详细信息我如何执行请求 I use java net HttpURLConnection 我设置请求属性然后执行以下操作 conn HttpURLConnection
Rails 实例变量如何传递给视图？

在我的 Rails 应用程序中我有一个像这样的控制器 class MyController lt ApplicationController def show blog post BlogPost find params id end e
“启用 Clickonce 安全设置”不断自行启用

我取消选中启用 Clickonce 安全设置然后发布然后它重新启用为什么它会重新启用以及可以采取哪些措施来阻止它自行重新启用我已经能够在禁用 clickonce 的情况下发布此应用程序以及其他应用程序但现在突然之间它不允许我
如果在 JFrame 代码中调用 repaint()，JPanel 不会重新绘制

我有课Forest and CellularJPanel 这延伸了JPanel并显示Forest 我编写了一个原始代码来创建JFrame Forest CellularJPanel并添加CellularJPanel to the JFram
CHLS“最里面的反引号形式应该首先扩展”含义

反引号上的 CLHS指出如果反引号语法是嵌套的则应首先扩展最里面的反引号形式这意味着如果连续出现多个逗号则最左边的逗号属于最里面的反引号但是当我在 SBCL 中评估以下嵌套反引号表达式时 outer inner no list c
在 Visual Studio 中链接 dll

我怎样才能添加一个 dll在 Visual Studio 2010 中我只是找不到那里的选项在 Windows 上您不链接 dll直接文件您必须使用随附的 lib文件代替要做到这一点请转到Project gt Propertie
unionAll 导致 StackOverflow

我自己的问题取得了一些进展如何从正在下载 csv 文件的 python 请求流加载数据帧在 StackOverflow 上但我收到了 StackOverflow 错误 import requests import numpy as n
更新一行，但如果 codeigniter 中不存在该行则插入

我想在表中插入行如下所示 this gt db gt update batch this gt table name update image id if this gt db gt affected rows 0 this gt db
无法摆脱使用套接字java发送文件中的接收文件循环

我正在开发客户端服务器应用程序从客户端我将文件发送到服务器这是我关于在服务器上读取文件的代码 private void readfile throws Exception String filename data xml FileOu
为什么 Spring 框架不赞成使用 Guava 缓存？

我想将 spring cache 与 guava 缓存一起使用但我发现 guava 缓存已被 spring 官方文档标记为已弃用我想知道为什么他们没有给出一些解释 https docs spring io spring boot do
属性和实例变量声明

我注意到您可以通过以下方式双重声明变量 interface A NSString instanceVariable property nonatomic retain NSString instanceVariable end 这与刚才
从shell脚本中的字符串查找变量值

在 bash 中如果我有 y 10 x y echo x prints y 现在我想得到 y via x echo x error bad substitution I want to print 10 如何查找带有名称的变量值 x 参见
如何在斯坦福 CoreNLP 中获取短语标签？

如果我想获取每个单词对应的短语标签如何获取例如在这句话中我的狗也喜欢吃香肠我可以在斯坦福 NLP 中得到一个解析树例如 ROOT S NP PRP My NN dog ADVP RB also VP VBZ likes NP J

如何在斯坦福 CoreNLP 中获取短语标签？

如何在斯坦福 CoreNLP 中获取短语标签？ 的相关文章

随机推荐

热门标签

如何在斯坦福 CoreNLP 中获取短语标签？的相关文章