当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？

2024-04-05

网站corenlp.run http://corenlp.run它应该是 CoreNLP 演示站点，显示的结果与我在本地计算机上运行 CoreNLP 管道时的结果截然不同。

网站上确实显示了正确的结果，而本地机版本却没有。我想知道是否有任何接近 CoreNLP 项目的人可以解释这些差异？

举个例子 - 这就是当我使用它作为输入时发生的情况”给我一家位于 Soquel Drive 的供应美味法国菜的餐厅“（这来自 RestQuery 数据集）

在 CoreNLP（本地机器，使用斯坦福大学的默认模型）上，我得到以下结果：

root(ROOT-0, Give-1)
iobj(Give-1, me-2)
det(restaurant-4, a-3)
dobj(Give-1, restaurant-4)
case(Drive-7, on-5)
compound(Drive-7, Soquel-6)
nmod:on(Give-1, Drive-7) <--- WRONG HEAD
nsubj(serves-9, that-8)
acl:relcl(Drive-7, serves-9) <--- WRONG HEAD
amod(food-12, good-10)
amod(food-12, french-11)
dobj(serves-9, food-12)

在 corenlp.run 上时，我得到以下结果：

root(ROOT-0, Give-1)
iobj(Give-1, me-2)
det(restaurant-4, a-3)
dobj(Give-1, restaurant-4)
case(Drive-7, on-5)
compound(Drive-7, Soquel-6)
nmod:on(restaurant-4, Drive-7) <--- CORRECT HEAD
nsubj(serves-9, that-8)
acl:relcl(restaurant-4, serves-9) <--- CORRECT HEAD
amod(food-12, good-10)
amod(food-12, french-11)
dobj(serves-9, food-12)

你会注意到本地机版本中有两个错误的头。我不知道为什么 - 特别是如果这是一个模型问题（我目前正在尝试调试每个注释器的输出以查看进程返回的内容）

这些是我使用的注释器：“tokenize，ssplit，pos，lemma，ner，parse，openie”。这些模型直接来自 CoreNLP 版本 3.6.0

那么谁能帮助我理解为什么我的结果与演示网站的结果不同？

CoreNLP 附带多个解析器来获取选区和依赖树。默认解析器是PCFG 选区解析器 http://nlp.stanford.edu/~manning/papers/unlexicalized-parsing.pdf它输出选区树，然后将其转换为依赖树。

corenlp.run http://corenlp.run，另一方面，使用神经网络依存解析器 http://nlp.stanford.edu/software/nndep.shtml它直接输出可能与默认管道的输出不同的依赖关系树。

为了在本地计算机上获得相同的输出，请使用以下注释器：

tokenize,ssplit,pos,lemma,ner,depparse,openie

(lemma, ner, and openie如果您只需要依赖项解析，那么这些都是可选的。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP

stanfordnlp

当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？的相关文章

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

我正在做一个长文本分类任务文档中有超过 10000 个单词我计划使用 Bert 作为段落编码器然后将段落的嵌入逐步输入 BiLSTM 网络如下输入 batch size max paragraph len max tokens pe
运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
理解含义的算法[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想知道是否有任何特定的算法可以遵循
如何获取与某个单词相关的相似单词？

我正在尝试解决一个 nlp 问题其中我有一个单词字典例如 list 1 phone android chair netflit charger macbook laptop sony 现在如果输入是 phone 我可以轻松地使用 in
Attention机制中的“源隐藏状态”指的是什么？

注意力权重计算如下我想知道什么h s指在tensorflow代码中编码器RNN返回一个元组 encoder outputs encoder state tf nn dynamic rnn 正如我所想 h s应该是encoder sta
browserify :- 未捕获类型错误：fs.readFileSync 不是函数

我试图在我的代码中使用natural js 在客户端使用它我使用browserify 但它给出了一个错误 Uncaught TypeError fs readFileSync is not a function at loadDictio
NLTK 中的 FreqDist 未对输出进行排序

我是 Python 新手我正在尝试自学语言处理 python 中的 NLTK 有一个名为 FreqDist 的函数可以给出文本中单词的频率但由于某种原因它无法正常工作这是教程让我写的 fdist1 FreqDist text1 vo
使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数？

我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
doc2vec 获得良好性能所需的最小数据集大小是多少？

在不同大小的数据集上进行训练时 doc2vec 的表现如何原始语料库中没有提到数据集大小所以我想知道从 doc2vec 中获得良好性能所需的最小大小是多少有很多东西被称为 doc2vec 但它似乎最常指的是 Le 和 Mikolov
如何在 python-gensim 中使用潜在狄利克雷分配（LDA）来抽象二元组主题而不是一元组？

LDA 原始输出一元语法主题1 水肺水蒸汽潜水主题2 二氧化物植物绿色碳所需输出二元组主题主题1 水肺潜水水蒸气主题2 绿色植物二氧化碳任何想法鉴于我有一个名为docs 包含文档中的单词列表我可以使用 n
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
IOB 准确度和精密度之间的差异

我正在使用命名实体识别和分块器对 NLTK 进行一些工作我使用重新训练了分类器nltk chunk named entity py为此我采取了以下措施 ChunkParse score IOB Accuracy 96 5 Precisi
如何有效计算文档流中文档之间的相似度

我收集文本文档在 Node js 中其中一个文档i表示为单词列表考虑到新文档以文档流的形式出现计算这些文档之间相似性的有效方法是什么我目前对每个文档中单词的归一化频率使用余弦相似度我不使用 TF IDF 词频逆文档频率因为我
词干函数错误：词干需要一个位置参数

这里的stem函数显示错误指出stem需要循环中的一个位置参数如所讨论的 from nltk stem import PorterStemmer as ps text my name is pythonly and looking fo
否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试例如给定一个句子这本书很好请提供任意数量的意思相反的替代句子例如这本书不好甚至这本书不好显然以高精度实现这一点可能超出了当前 NLP 的范围但我确信在这个主题上已经有了一些工作
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
CoreNLP 如何识别小写的命名实体，例如 kobe bryant？

我遇到一个问题 CoreNLP 只能识别以大写字符开头的命名实体例如科比布莱恩特 Kobe Bryant 但无法识别科比布莱恩特 kobe bryant 作为一个人那么CoreNLP如何识别以小写字符开头的命名实体赞赏它首先您
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
斯坦福自然语言处理：如何对单个单词进行词形还原？

我知道如何注释一个句子并获取每个单词的引理但如果我只想对一个单词进行词形化我不知道该怎么做single单词我试过 Annotation tokenAnnotation new Annotation wedding List

随机推荐

在 Java 中用货币符号解析价格

我想将我拥有的字符串解析为数字这是我正在使用但不起作用的代码 NumberFormat getCurrencyInstance Locale GERMAN parse EUR 0 00 这会导致 java text ParseExcept
百分号 (%) 在 Objective C 中的数学作用是什么？

我非常困惑百分号在 Objective C 中的作用有人能用像我这样的普通白痴能理解的语言向我解释吗谢谢是模运算符因此例如 10 3 将得到 1 如果你有一些数字a and b a b只给你剩下的a除以b 所以在例子中10 3 10
如何判断当前TD是否是TR中最后一个TD

我有单行和多行 td 就在里面在我的一个职能中我遇到了一种情况我必须找出我的currentSelectedTD是最后一个 td 放在行中以便我可以以不同的方式对待它 I tried currentSelectedTD is last
Html 文本悬停在每个单词上进行翻译

您好我有一个 HTML 页面其中包含文本正文我希望能够将鼠标悬停在文本中的单词上然后一小朵云显示文本中该单词的翻译知道我该怎么做吗我将提供我需要知道哪种是在悬停时将每个单词从文本中分离出来的最佳方法并使用单词或翻译列表进行检查
如何在 ConstraintLayout 中显示 GoogleMap？

我创建了一个新项目 MapsActivity 我从 Google 获取了 API 密钥并将 API 密钥放置在 YOUR KEY HERE 区域内的 google maps API xml debug 中我在 AndroidManife
泛型方法的可重用非泛型方法

我有以下基本界面 public interface IHandler void Handle IMessage message 以及继承基接口的通用接口 public interface IHandler
基于 OpenID 的 SSO 和 WSO2 身份服务器

无法使用 WSO2 身份服务器获得基于 OpenID 的 SSO 我关注了 Suresh Aththanayaka 给出的博客文章但是进入后https localhost 9443 openid admin作为您的 OpenID 标识符
PHP 类中的错误处理

嘿这里有个问题要问你们我有很多次为 PHP 中的类选择错误处理例如在 Ajax PHP 处理类中我这样做 public function setError msg this gt errors msg public functio
ASP.net 必需字段验证器 VisualStudio 2012

我正在使用 ASP net c 开发一个项目我希望RequiredFieldValidator 检查我的文本框我正在添加验证器它在 Visual Studio 2010 中工作得很好但是一旦我做了同样的事情完全相同的事情它就无法
整数比较值的输出错误

我有以下代码 public static void doIntCompareProcess int a 100 int b 100 Integer c 200 Integer d 200 int f 20000 int e 20000 Sy
如何创建波浪形状 CSS？

请参阅下图了解我正在尝试创建的内容到目前为止我有以下内容但它需要更加频繁例如增加正弦波或余弦波的频率 wave position relative height 70px width 600px background e0efe3
SwiftUI 可从 NavigationView 向下搜索多个视图？

我遇到了相关问题 searchable我想知道它是否与我的应用程序的视图层次结构有关我可以找到的使用 Searchable 的示例说直接在 NavigationView 上使用它并像这样显示它 var body some View Na
如何对 React 组件的 shouldComponentUpdate 方法进行单元测试

我有一个 React 组件它实现了应该组件更新 https facebook github io react docs react component html shouldcomponentupdate方法我想对其进行单元测试理想情
Vapor 3 - 如何在保存对象之前检查类似的电子邮件

我想创建一条路线来让用户更新他们的数据例如更改他们的电子邮件或用户名为了确保用户不能使用与其他用户相同的用户名我想检查数据库中是否已存在具有相同用户名的用户我已经使用户名在迁移中唯一我有一个如下所示的用户模型 struct Use
Three.jsmaterialLoader不加载嵌入的纹理图像

我使用 Material toJSON 提供的方法导出 Three js 材质结果如下 metadata version 4 5 type Material generator Material toJSON uuid 8E6F9A32
Task.ContinueWith 没有按照我的预期工作

考虑以下代码我从一个不执行任何操作的任务开始然后使用ContinueWith 启动对递增计数器的方法的10 次调用当我运行这个程序时它打印 0 表明increment 方法根本没有被调用我预计它会被调用 10 次因为这就是我调用
从 Excel 粘贴到 WPF DataGrid

我有一个 DataGrid 称为 TheGrid 我想在其上实现复制和粘贴功能复制功能很好用但我不知道如何实现粘贴我只需要从剪贴板获取数据并自己解析吗命令绑定
奇怪的 Firefox 溢出/浮动行为

我有一个简单的布局 http 195 228 155 116 szilk public templates globallog bemutatkozas html它在 Chrome Safari 甚至 Opera OS X 中运行良好让我
Terraform 无法使用 Amazon EC2 导入密钥对

使用 Terraform 0 7 7 我有一个简单的 Terraform 文件其中包含以下内容 provider aws access key var access key secret key var secret key region
当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？

网站corenlp run http corenlp run它应该是 CoreNLP 演示站点显示的结果与我在本地计算机上运行 CoreNLP 管道时的结果截然不同网站上确实显示了正确的结果而本地机版本却没有我想知道是否有任何接近

当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？

当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？ 的相关文章

随机推荐

热门标签

当我在本地运行 CoreNLP 时，为什么“corenlp.run”会产生不同的结果？的相关文章