当我在本地运行 CoreNLP 时,为什么“corenlp.run”会产生不同的结果?

2024-04-05

网站corenlp.run http://corenlp.run它应该是 CoreNLP 演示站点,显示的结果与我在本地计算机上运行 CoreNLP 管道时的结果截然不同。

网站上确实显示了正确的结果,而本地机版本却没有。我想知道是否有任何接近 CoreNLP 项目的人可以解释这些差异?

举个例子 - 这就是当我使用它作为输入时发生的情况”给我一家位于 Soquel Drive 的供应美味法国菜的餐厅“(这来自 RestQuery 数据集)

在 CoreNLP(本地机器,使用斯坦福大学的默认模型)上,我得到以下结果:

root(ROOT-0, Give-1)
iobj(Give-1, me-2)
det(restaurant-4, a-3)
dobj(Give-1, restaurant-4)
case(Drive-7, on-5)
compound(Drive-7, Soquel-6)
nmod:on(Give-1, Drive-7) <--- WRONG HEAD
nsubj(serves-9, that-8)
acl:relcl(Drive-7, serves-9) <--- WRONG HEAD
amod(food-12, good-10)
amod(food-12, french-11)
dobj(serves-9, food-12)

在 corenlp.run 上时,我得到以下结果:

root(ROOT-0, Give-1)
iobj(Give-1, me-2)
det(restaurant-4, a-3)
dobj(Give-1, restaurant-4)
case(Drive-7, on-5)
compound(Drive-7, Soquel-6)
nmod:on(restaurant-4, Drive-7) <--- CORRECT HEAD
nsubj(serves-9, that-8)
acl:relcl(restaurant-4, serves-9) <--- CORRECT HEAD
amod(food-12, good-10)
amod(food-12, french-11)
dobj(serves-9, food-12)

你会注意到本地机版本中有两个错误的头。我不知道为什么 - 特别是如果这是一个模型问题(我目前正在尝试调试每个注释器的输出以查看进程返回的内容)

这些是我使用的注释器:“tokenize,ssplit,pos,lemma,ner,parse,openie”。这些模型直接来自 CoreNLP 版本 3.6.0

那么谁能帮助我理解为什么我的结果与演示网站的结果不同?


CoreNLP 附带多个解析器来获取选区和依赖树。默认解析器是PCFG 选区解析器 http://nlp.stanford.edu/~manning/papers/unlexicalized-parsing.pdf它输出选区树,然后将其转换为依赖树。

corenlp.run http://corenlp.run,另一方面,使用神经网络依存解析器 http://nlp.stanford.edu/software/nndep.shtml它直接输出可能与默认管道的输出不同的依赖关系树。

为了在本地计算机上获得相同的输出,请使用以下注释器:

tokenize,ssplit,pos,lemma,ner,depparse,openie

(lemma, ner, and openie如果您只需要依赖项解析,那么这些都是可选的。)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

当我在本地运行 CoreNLP 时,为什么“corenlp.run”会产生不同的结果? 的相关文章

随机推荐

  • 在 Java 中用货币符号解析价格

    我想将我拥有的字符串解析为数字 这是我正在使用但不起作用的代码 NumberFormat getCurrencyInstance Locale GERMAN parse EUR 0 00 这会导致 java text ParseExcept
  • 百分号 (%) 在 Objective C 中的数学作用是什么?

    我非常困惑百分号在 Objective C 中的作用 有人能用像我这样的普通白痴能理解的语言向我解释吗 谢谢 是模运算符 因此例如 10 3 将得到 1 如果你有一些数字a and b a b只给你剩下的a除以b 所以在例子中10 3 10
  • 如何判断当前TD是否是TR中最后一个TD

    我有单行和多行 td 就在里面 在我的一个职能中 我遇到了一种情况 我必须找出我的currentSelectedTD是最后一个 td 放在行中 以便我可以以不同的方式对待它 I tried currentSelectedTD is last
  • Html 文本悬停在每个单词上进行翻译

    您好 我有一个 HTML 页面 其中包含文本正文 我希望能够将鼠标悬停在文本中的单词上 然后一小朵云显示文本中该单词的翻译 知道我该怎么做吗 我将提供我需要知道哪种是在悬停时将每个单词从文本中分离出来的最佳方法 并使用单词或翻译列表进行检查
  • 如何在 ConstraintLayout 中显示 GoogleMap?

    我创建了一个新项目 MapsActivity 我从 Google 获取了 API 密钥 并将 API 密钥放置在 YOUR KEY HERE 区域内的 google maps API xml debug 中 我在 AndroidManife
  • 泛型方法的可重用非泛型方法

    我有以下基本界面 public interface IHandler void Handle IMessage message 以及继承基接口的通用接口 public interface IHandler
  • 基于 OpenID 的 SSO 和 WSO2 身份服务器

    无法使用 WSO2 身份服务器获得基于 OpenID 的 SSO 我关注了 Suresh Aththanayaka 给出的博客文章 但是进入后https localhost 9443 openid admin作为您的 OpenID 标识符
  • PHP 类中的错误处理

    嘿 这里有个问题要问你们 我有很多次为 PHP 中的类选择错误处理 例如 在 Ajax PHP 处理类中 我这样做 public function setError msg this gt errors msg public functio
  • ASP.net 必需字段验证器 VisualStudio 2012

    我正在使用 ASP net c 开发一个项目 我希望RequiredFieldValidator 检查我的文本框 我正在添加验证器 它在 Visual Studio 2010 中工作得很好 但是一旦我做了同样的事情 完全相同的事情 它就无法
  • 整数比较值的输出错误

    我有以下代码 public static void doIntCompareProcess int a 100 int b 100 Integer c 200 Integer d 200 int f 20000 int e 20000 Sy
  • 如何创建波浪形状 CSS?

    请参阅下图了解我正在尝试创建的内容 到目前为止 我有以下内容 但它需要更加 频繁 例如增加正弦波或余弦波的频率 wave position relative height 70px width 600px background e0efe3
  • SwiftUI 可从 NavigationView 向下搜索多个视图?

    我遇到了相关问题 searchable我想知道它是否与我的应用程序的视图层次结构有关 我可以找到的使用 Searchable 的示例说直接在 NavigationView 上使用它 并像这样显示它 var body some View Na
  • 如何对 React 组件的 shouldComponentUpdate 方法进行单元测试

    我有一个 React 组件 它实现了应该组件更新 https facebook github io react docs react component html shouldcomponentupdate方法 我想对其进行单元测试 理想情
  • Vapor 3 - 如何在保存对象之前检查类似的电子邮件

    我想创建一条路线来让用户更新他们的数据 例如更改他们的电子邮件或用户名 为了确保用户不能使用与其他用户相同的用户名 我想检查数据库中是否已存在具有相同用户名的用户 我已经使用户名在迁移中唯一 我有一个如下所示的用户模型 struct Use
  • Three.jsmaterialLoader不加载嵌入的纹理图像

    我使用 Material toJSON 提供的方法导出 Three js 材质 结果如下 metadata version 4 5 type Material generator Material toJSON uuid 8E6F9A32
  • Task.ContinueWith 没有按照我的预期工作

    考虑以下代码 我从一个不执行任何操作的任务开始 然后使用ContinueWith 启动对递增计数器的方法的10 次调用 当我运行这个程序时 它打印 0 表明increment 方法根本没有被调用 我预计它会被调用 10 次 因为这就是我调用
  • 从 Excel 粘贴到 WPF DataGrid

    我有一个 DataGrid 称为 TheGrid 我想在其上实现复制和粘贴功能 复制功能很好用 但我不知道如何实现粘贴 我只需要从剪贴板获取数据并自己解析吗 命令绑定
  • 奇怪的 Firefox 溢出/浮动行为

    我有一个简单的布局 http 195 228 155 116 szilk public templates globallog bemutatkozas html它在 Chrome Safari 甚至 Opera OS X 中运行良好 让我
  • Terraform 无法使用 Amazon EC2 导入密钥对

    使用 Terraform 0 7 7 我有一个简单的 Terraform 文件 其中包含以下内容 provider aws access key var access key secret key var secret key region
  • 当我在本地运行 CoreNLP 时,为什么“corenlp.run”会产生不同的结果?

    网站corenlp run http corenlp run它应该是 CoreNLP 演示站点 显示的结果与我在本地计算机上运行 CoreNLP 管道时的结果截然不同 网站上确实显示了正确的结果 而本地机版本却没有 我想知道是否有任何接近