创建 .conll 文件作为斯坦福解析器的输出

2024-04-27

我想使用斯坦福解析器创建一个 .conll 文件以进行进一步处理。到目前为止，我设法使用以下命令解析测试句子：

stanford-parser-full-2013-06-20/lexparser.sh  stanford-parser-full-2013-06-20/data/testsent.txt > output.txt

我希望在 .conll 中有一个文件，而不是 txt 文件。我很确定这是可能的，因为文档中提到了这一点（请参阅here http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/trees/GrammaticalStructure.html）。我可以以某种方式修改我的命令还是我必须编写 Java 代码？

感谢帮助！

如果您正在寻找以 CoNLL X (CoNLL 2006) 格式打印的依赖项，请从命令行尝试以下操作：

java -mx150m -cp "stanford-parser-full-2013-06-20/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn" edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz stanford-parser-full-2013-06-20/data/testsent.txt >testsent.tree

java -mx150m -cp "stanford-parser-full-2013-06-20/*:" edu.stanford.nlp.trees.EnglishGrammaticalStructure -treeFile testsent.tree -conllx

这是第一个测试句子的输出：

1       Scores        _       NNS     NNS     _       4       nsubj        _       _
2       of            _       IN      IN      _       0       erased       _       _
3       properties    _       NNS     NNS     _       1       prep_of      _       _
4       are           _       VBP     VBP     _       0       root         _       _
5       under         _       IN      IN      _       0       erased       _       _
6       extreme       _       JJ      JJ      _       8       amod         _       _
7       fire          _       NN      NN      _       8       nn           _       _
8       threat        _       NN      NN      _       4       prep_under   _       _
9       as            _       IN      IN      _      13       mark         _       _
10      a             _       DT      DT      _      12       det          _       _
11      huge          _       JJ      JJ      _      12       amod         _       _
12      blaze         _       NN      NN      _      15       xsubj        _       _
13      continues     _       VBZ     VBZ     _       4       advcl        _       _
14      to            _       TO      TO      _      15       aux          _       _
15      advance       _       VB      VB      _      13       xcomp        _       _
16      through       _       IN      IN      _       0       erased       _       _
17      Sydney        _       NNP     NNP     _      20       poss         _       _
18      's            _       POS     POS     _       0       erased       _       _
19      north-western _       JJ      JJ      _      20       amod         _       _
20      suburbs       _       NNS     NNS     _      15       prep_through _       _
21      .             _       .       .       _       4       punct        _       _

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Parsing

format

stanfordnlp

创建 .conll 文件作为斯坦福解析器的输出的相关文章

如何在 PHP 中从serializeArray 获取 POST 值？

我正在尝试这个我见过的新方法serializeArray with ajax var data form input serializeArray post var action process data data ajax etc 这样我
如何从 C# 解析/简单分析 C/C++ 代码以获取方法列表

我需要浏览 C C 文件并提取类和方法的列表以及它们在文件中的位置 libclang 是最好的选择吗或者对于这项任务来说太多了只寻找配对支架会更好吗如果选择 libclang 有没有办法从 c 调用它 Thanks 你可以考虑cta
Lisp 格式和强制输出

我不明白为什么这段代码在不同的实现中表现不同 format t asdf setq var read 在 CLISP 中它的行为与预期一致先打印提示然后读取但在 SBCL 中它显示 then输出我在网上查了一下修改了一下 fo
CSV 损坏，如何修复？

我正在尝试解析 CSV 我想将它放入数据库或只是用 JavaScript 解析它但由于语法损坏任何一种方法都会失败我的整个 CSV 文件在这里 https gist github com 1023560 https gist gith
格式化 XmlGregorianCalendar 时区问题

我需要将 java XmlGregorianCalendar 格式化为 yyMMdd 字符串我的实现 XMLGregorianCalendar date getDate getting the date if date null Simp
PDF解析提取CheckBox字段值

我有一个 PDF 文档想要从 PDF 和 Chackbox 和单选按钮类型字段值中提取内容 PDF 文件的版本为 1 4 Acrobat 5 x 可以从网络浏览器生成 CheckBox appear such types in PDF 我
Gson解析没有键值对的字符串

我正在尝试使用 Gson 库解析字符串但没有成功这是我的字符串 1 816513 52 5487566 1 8164913 52 548824 此示例中的问题是没有键值对我查看了其他示例但它们都有键值对看起来不像我的问题我的解决
使用正则表达式或其他解析从文件中读取值

我有一个记录带有时间戳的值的文件我必须在特定时间后读取特定值例如文件有 2013 03 03 19 08 22 car 2001 Ford 2013 03 03 19 08 27 Truck 2012 Chevy 2013 03 03
Python：如何检索每年的谷歌学术引用？

我正在尝试从 Google Scholar 个人资料中检索信息我有url from bs4 import SoupStrainer BeautifulSoup from urllib2 import Request urlopen url
VBA COM 库中的这些 _B_var_Xxxxx 和 _B_str_Xxxxx 成员到底是什么？

想象一下以下函数调用 foo UCase bar 我正在解析这段代码并确定UCase是一个函数调用现在我想将该函数调用解析为定义它的 COM 库中函数的声明这个想法是实现一个代码检查来确定何时Variant当使用内置函数时String
C# 中的 DateTime.Parse 抛出异常

我不知道为什么抛出异常这是工作代码 DateTime Parse 1 12 2012 12 00 00 AM 这是抛出异常的一个 DateTime Parse 1 13 2012 12 00 00 AM 抛出的异常是格式异常包括此消息
能否使用 jQuery 的 $(responseXML) 语法可靠地解析 XML？

我目前正在寻找一种使用 JavaScript 从服务器 XML 响应中提取信息的简单方法 jQuery 似乎是一个很好的候选者当谈到使用 jQuery 解析 XML 时我不断遇到类似于以下代码片段的代码示例 function parse
java格式化表格输出

所以我正在尝试格式化我的输出 System out println Menu nItem tItem t tPrice tQuantity for int i 0 i
Java 中的递归下降解析器

我想在序言中说这是我三年级编程语言课的家庭作业我正在寻求一些帮助我的作业如下截止日期 2013年2月22日晚上11点55分提交请将以下内容上传到CMS 1 源代码2 程序执行的屏幕截图包括您使用的输入文件使用您喜欢的任何编程语言
在Python中从feedparser解析不同的日期格式？

我正在尝试通过以下方式获取两个不同 RSS 提要中的条目的日期feed解析器 http feedparser org 这是我正在做的事情 import feedparser as fp reddit fp parse http www re
正则表达式是否用于构建解析器？

这只是出于好奇的一个问题因为我最近需要越来越多地解析和使用正则表达式似乎对于我在搜索中遇到的有关某种解析的问题有人总是最终说当问一些与正则表达式相关的问题正则表达式对此不好请使用这样那样的解析器因为我已经更好地理解了正则表达
是否有一个实用程序可以在给定 ANTLR 语法的情况下生成匹配的字符串？

我有一个 ANTLR 语法我想模糊我的解析器您是否正在寻找 CFG 语法的生成 IE 语法接受的字符串的生成这可能是检查语法正确性的好主意但请记住可接受的字符串集很可能是无限的任何真正严重的错误应该已经在语法规范中显而易见并
如何在 powershell 中使用正则表达式选择“catch”代码块？

我正在尝试分析多个目录中的大量 powershell 脚本并且希望将任何 Catch 代码块拉入列表变量中我正在尝试编写一个正则表达式来选择以下格式的任何块 Catch write Host Function MyInvocation
“单词的正则表达式”（语义替换）-任何示例语法和库吗？

我正在寻找在给定过程语言的情况下对单词而不是字符进行正则表达式样式转换的常用技术的语法示例例如为了追踪复制人们可能想要创建一份具有相似含义但具有不同单词选择的文档我希望能够简洁地定义这些可以应用于文本流的可能的转换例如快速地no
构建一个简单的解析器，能够使用 PyParse 解析不同的日期格式

我正在构建一个简单的解析器它接受如下查询显示 fizi 从 2010 年 1 月 1 日到 2006 年 2 月 11 日的提交到目前为止我有 class QueryParser object def parser self stmn

随机推荐

为什么我的 BST 根指针由于某种未知原因而发生变化？

我正在尝试用 C 语言实现二叉搜索树数据结构但遇到了一个错误我的指针值由于我不明白的原因而发生变化请参阅帖子底部的奇怪输出删除函数和主要函数澄清输出来自何处我的测试功能如下 int main void Bst bst Bst ca
如何在 Dart 和 Flutter 中将时间四舍五入到最接近的一刻钟？

我有一个DateTime并愿意四舍五入至 15 秒或其他间隔例如 2020 03 16 12 23 53 756 到 2020 03 16 12 23 45 000 和 2020 03 16 12 24 01 1234 到 2020 0
如何缩进现有 OCaml 代码

我有大约 30 000 行缩进严重的 OCaml 代码包括 mly 和 mll 文件并且想要缩进它们我尝试在谷歌上搜索 ocaml indent 的变体我能得到的最接近的结果是使用 Omlet vim 并一次缩进一行代码在插入模式
我的 React 项目中 Firestore 数据库的读取次数非常多

我正在使用 React 和 firebase firestore 制作一个简单的 CRUD 应用程序我目前有一组产品有四条记录主页循环显示产品 import React useEffect useState from react i
如何从模板类中的方法返回 NULL

我有一个如下所示的方法 template
从恶意 PDF 中提取 JavaScript

我有一个 PDF 文件据我所知它包含一个 JavaScript 脚本文件该文件会执行恶意操作但目前还不确定具体是什么我已经成功解压缩了 PDF 文件并获得了纯文本 JavaScript 源代码但它的代码本身隐藏在我以前从未见过的
为什么 OpenSSL 给我一个“调用了不应调用的函数”错误？

我正在努力向我的服务器程序添加 OpenSSL 支持通常它运行得很好但我遇到了一个问题首先一些背景知识服务器是单线程的使用非阻塞 I O 和 select 循环来同时处理多个客户端服务器链接到 libssl 0 9 8 dyl
如何在 OSX .pkg 中设置背景图像？

我正在为我的 OSX 应用程序创建一个 pkg 安装程序但我无法弄清楚如何设置背景图像我在构建脚本中创建安装程序如下所示 pkgbuild root APP FOLDER identifier com company product
如何关闭 iOS 键盘？

我有一个 UITextfield 我想关闭键盘无论我使用什么代码我似乎都无法让键盘消失如果您有多个文本字段并且不知道哪个是第一响应者或者您根本无法从编写此代码的任何位置访问文本字段您可以调用endEditing 在包含文本字段的父
App Engine 日志中的 /_ah/queue/__deferred__

我有一个使用 Google Cloud SQL 的 App Engine 应用程序并且从我的应用程序的页面中我正在执行一些数据库操作每当访问此页面时它都无法执行所有数据库操作当我进入控制台时我看到的只是 ah queue defe
Selenium find_elements_by_css_selector 返回一个空列表

我正在尝试选择包含以下内容的所有 idcoupon link关键字与以下脚本 from selenium import webdriver from selenium webdriver common keys import Keys dr
如何在 Xamarin.Android 的 AXML 上启用智能感知？

由于这个很棒的工具对所有人免费我尝试了它并且我喜欢它尤其是 Visual Studio Android 模拟器但是我遇到了一个问题因为 Visual Studio 智能感知根本不适用于 axml 文件我尝试了这篇文章 http
如何使用php取消设置mongodb中的所有记录字符串？

我的数据库记录了这样的事情 id ObjectId 50118b145e69ef2c0e007a2 class customer dbid 1829 value email protected cdn cgi l email protect
Android Volley StringRequest 有时不工作

我使用下面的代码从 API 获取一些本地视频 URL public void getVideoAds String serverURL String url http serverURL video StringRequest string
如何将 Headless chrome 与水豚和硒一起使用

Chrome版本 59 0 3071 104 使用Cucumber Capybara Selenium实现Headless Chrome的自动化测试功能支持 env rb require rubygems require capybar
我们建议使用较新的 Android Gradle 插件来使用compileSdkPreview =“Tiramisu”

我正在使用 Android Studio Dolphin 2021 3 1 JEtpack Compose 的 Canary 8 操作系统 Windows 10 最新版本更新 Android Studio 后我的 Preview 停止工
jQuery：追加到父级

我似乎无法让appendTo 工作我做错了什么 div nth child 2n img appendTo parent 当前标记 div class container img src 123 jpg p Hey p div div c
将工作表合并为一张

我有一些Excel工作表其风格为组织1 姓名职业克里斯承包商简员工组织2 姓名职业鲍勃设施 Trey 软件开发人员并希望将这些工作表合并到具有以下格式的主工作表中组织名称职业 1 克里斯承包商 1 简员工 2
有没有办法在 JetBrains“运行配置”中仅运行“外部工具”

JetBrains IDE 中的所有或几乎所有运行配置都提供了一个选项来运行外部工具作为其执行的一部分有没有办法only在运行配置中运行外部工具不知道为什么你需要它我可以建议尝试 Bash 支持插件 http plugins
创建 .conll 文件作为斯坦福解析器的输出

我想使用斯坦福解析器创建一个 conll 文件以进行进一步处理到目前为止我设法使用以下命令解析测试句子 stanford parser full 2013 06 20 lexparser sh stanford parser full

创建 .conll 文件作为斯坦福解析器的输出

创建 .conll 文件作为斯坦福解析器的输出 的相关文章

随机推荐

热门标签

创建 .conll 文件作为斯坦福解析器的输出的相关文章