Antlrworks - 无关输入

2024-01-01

我是这方面的新手，因此我需要你的帮助。我正在尝试解析 Wikipedia Dump，我的第一步是将它们定义的每个规则映射到 ANTLR，不幸的是我遇到了第一个障碍：

第 1 行：8 外部输入 ''''' 需要 '\'\''

我不明白发生了什么事，请帮助我。

My code:

grammar Test;

options {
    language = Java;
}

parse
    :  term+ EOF
    ;

term 
    :  IDENT
    |  '[[' term ']]'
    |  '\'\'' term '\'\''
    |  '\'\'\'' term '\'\'\''
    ;    

IDENT
    :  ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')*
    ;

Input'''''你好世界'''''

词法分析器规则必须始终匹配至少 1 个字符。你的规则：

IDENT : ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')*;

匹配一个空字符串（其数量是无限的）。改变* to a +:

IDENT : ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')+;

EDIT

Input '''''Hello World'''''

尽管您将文字标记放入解析器规则中（'\'\'\'', '\'\''等），你必须明白它们是not根据解析器的要求创建。词法分析器遵循严格的规则来创建标记：

它尝试尽可能多地匹配
如果 2 个不同的词法分析器规则匹配相同数量的字符，则第一个定义的规则将优先

让我们为您的文字标记命名：

BRACKET_OPEN  : '[[';
BRACKET_CLOSE : ']]';
Q3            : '\'\'\'';
Q2            : '\'\'';
IDENT         :  ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')+;

现在，由于规则#1（尽可能多地匹配），输入'''''Hello World'''''将被标记如下：

Q3
Q2
IDENT
Q3（是的，一个Q3!)
Q2

但是你的解析器规则term只会接受Q3 Q2 IDENT Q2 Q3，因此您的输入无法正确解析是正确的。

另外，我建议您不要使用解释器：它有很多问题。不过，调试器的工作方式就像一个魅力！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ANTLR

wikipedia

antlrworks

Antlrworks - 无关输入的相关文章

来自 bison 的 ANTLR 语法

我正在尝试将语法从 bison 翻译为 ANTLR 野牛的语法本身非常简单但我找不到简单的方法来做到这一点野牛语法 expr expr or expr expr and expr expr 欢迎任何提示链接指针谢谢尤利安在AN
ANTLR2 与 ANTLR3

您使用过其中一个或两者吗您更喜欢哪一个出于什么原因例如我最近学习了 v2 并且由于 netbeans 团队提供的高性能实现是的我被 java 困住了我可能会坚持使用它在这种情况下是否有任何令人信服的理由进行转换要了解 v
ANTLR如何在输入结束时检测垃圾数据

当使用 ANTLR 编写的语法时解析器可以正确识别输入流中的数据但如果我在输入末尾有一些垃圾文本不应该由语法解析解析器不会抱怨我想这种行为是可以的我的意思是解析器完成了它的工作并解析了我所说的它应该解析的任何内容但是有什么技巧
ANTLR：“规则范围内缺少属性访问”问题

我正在尝试构建一个 ANTLR 语法来解析标记句子例如 DT The NP cat VB ate DT a NP rat 并有语法 fragment TOKEN A Z a z fragment WS t WSX WS DTTOK DT
ANTLR 歧义问题

我有这个语法 grammar MyGrammar prog lexeme lexeme TOK INTLIT 0 9 Identifiers Letter Letter Digit fragment Letter a zA Z fragme
xtext 中的终端/数据类型/解析器规则

我正在使用 xtext 2 4 我想做的是类似 SQL 的语法让我困惑的是我不确定哪些东西应该被视为终端数据类型解析器规则到目前为止我的语法相关MyTerm is Model terms MyTerm MyTerm constant
将 Antlr 语法树转换为有用的对象

我目前正在考虑如何最好地获取使用 Antlr 生成的 AST 并将其转换为可以在我的程序中使用的有用对象我语法的目的除了学习之外是创建一种可执行运行时解释语言例如我将如何获取属性子树并实例化特定的属性类例如以下代码用我的语
编写对空格敏感的解析器规则，同时从词法分析器中跳过 WS

我在处理空白时遇到一些麻烦在以下语法摘录中我设置了词法分析器以便解析器跳过空格 ENTITY VAR user resource INT DIGIT DIGIT ID LETTER LETTER DIGIT SPECIAL ENTIT
删除这种左递归方式来定义 SELECT 语句

我正在尝试解析以下内容SELECT陈述 select 1 union all select 1 union all with cte as select 1 select 1 from tbl limit 1 union all selec
使用 ANTLR 通过 Python 解析一些 Java 代码

我想在 Python 中使用 ANTLR 构建一个 Java 解析器我从 ANTLR 存储库下载了语法 Lexer https github com antlr grammars v4 blob master java java Java
ANTLR：乘法省略“*”符号

我正在尝试创建一个用于乘法和除法的语法其中不需要包含符号我需要它来输出 AST 所以对于这样的输入 1 2 3 4 我希望 AST 是 1 2 3 4 我发现了以下内容它使用 java 代码来创建适当的节点 grammar Test
如何从维基百科文章中提取数据？

我有一个关于为我的 Android 应用程序解析维基百科数据的问题我有一个脚本可以通过读取源代码来下载 XMLhttp en wikipedia org w api php action parse prop text format x
ANTLRWorks 1.4.3 无法正确读取扩展 ASCII 字符

我正在开发一个相当标准的编译器项目我选择 ANTLR 作为解析器生成器在将现有语法从 v2 更新到 v3 时我注意到 ANTLRWorks ANTLR 的官方 IDE 无法正确显示文件中的任何扩展 ASCII 字符即使使用 Note
ANTLR4 相当于什么！在词法分析器规则中？

我正在努力将旧的 ANTLR 2 语法转换为 ANTLR 4 但我在字符串规则方面遇到了问题 STRING r n 这创建了一个STRING其文本包含字符串内容的标记但是不含开始和结束引号因为引号文字后面的符号 ANTLR 4 扼流圈
解析维基百科的出生和死亡日期？

我正在尝试编写一个 python 程序可以在维基百科中搜索人们的出生和死亡日期例如阿尔伯特爱因斯坦出生于 1879 年 3 月 14 日逝世日期 1955 年 4 月 18 日我开始于使用 Python 获取维基百科文章 htt
维基百科与 Python

我有这个非常简单的 python 代码来读取 wikipedia api 的 xml import urllib from xml dom import minidom usock urllib urlopen http en wikipe
Antlr 处理异常

我使用 Antlr 3 和 AST 树开发了一个复杂的语法 ANTLR 生成词法分析器和解析器问题是例如当用户输入无效的语法时该语法需要用户没有输入此内容然后在我的 Eclipse IDE 中出现以下异常 line 1 24 m
从 Wikipedia XML 转储获取静态 HTML 文件

我希望能够从巨大的即使是压缩的英语维基百科 XML 转储文件中获取相对最新的静态 HTML 文件enwiki 最新 pages articles xml bz2 http download wikimedia org enwiki la
有没有使用 ANTLR 或类似语言实现的简单语言？

我正在尝试构建一种简单的解释语言以用于学习目的我读过无数关于 ANTLR 和 JavaCC 的理论和教程但我不知道如何真正让它做一些有用的事情我通过把东西拆开然后重新组合起来来学得最好那么是否有任何在 ANTLR 或类似工具的
导出维基百科翻译标题的简单方法

有没有一种简单的方法可以导出维基百科的翻译标题以获得这样的集合 russian title gt english title 我试图从ruwiki 最新页面 meta current xml bz2 and ruwiki 最新 pages

随机推荐

Perl 无法在具有 32 GB RAM 的 Snow Leopard Mac 服务器上分配超过 1.1 GB 的空间

我有一台具有 32GB RAM 的 Mac 服务器雪豹当我尝试在 Perl v 5 10 0 中分配超过 1 1GB RAM 时出现内存不足错误这是我使用的脚本 usr bin env perl My snow leopard MA
学习 JavaScript 最好、最有效的书是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
从 pandas 数据帧生成 sas7bdat 文件

我想知道是否有任何Python库支持这种转换目前我找到的选项是SASpy csv或SQL数据库但不成功这实际上不是一个编程问题但希望这不会成为问题我找到了这个帖子将 pandas 数据框导出为 SAS sas7bdat 格式 h
pandas 相当于对多列使用 STRING_AGG 进行分组

那么有没有一种方法可以对 DataFrame 对象进行分组然后对于剩余的列将所有条目放入一个集合或具有过滤的唯一值的列表中所以像这样的事情 Name Date Amount purchase 0 Jack 2016 01 31 1
绘制日志（n 除以 k）

我以前从未使用过 Matlab 我真的不知道如何修复代码我需要绘制 log 1000 over k 其中 k 从 1 到 1000 y x log nchoosek 1000 x fplot y 1 1000 Error Warning
为什么 C# 中的字典对象不能进行 XmlSerialized？

看来序列化是非常简单的假设键和值都是可序列化的还有什么比用 XML 表示键值对更简单的呢对于所有评论者首先我很欣赏您的回答但是我对 workoraunds 不太感兴趣网络上确实有很多 SerializedDictionary
jQuery 电子表格/网格插件，可从 Excel 复制/粘贴到 Excel [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个用于电子表格或网格之类的 jQuery 插件我发现了很多 jQuery Gridplugins https stackov
我可以使用自定义标签名称而不使用 Web 组件，仅用于样式设置吗？

令我惊讶的是如果我使用自定义标签名称然后将这些标签的样式设置为普通 html 标签的样式现代浏览器似乎不会抱怨它们的行为就像 span 元素并且像 div 元素如果我设置display block 我的意思是即使我不使用聚合物
如何在android中的表格布局中删除表格行

void init intcolumnwidth1 int scr wd 55 intcolumnwidth1 intcolumnwidth1 100 for int i 0 i lt strarr length 1 i strinarr
如何绕过守夜测试中的验证码人工检查？

我正在为 Backbone View 编写一个 Nightwatch 测试其中包括谷歌的 recaptcha 人工检查 https www google com recaptcha intro index html 显然测试是一个机器人
制作一个编译 Tensorflow 二进制文件的 Dockerfile 以使用：SSE4.1、SSE4.2 和 AVX 指令

那么 docker的目的之一就是轻松部署一个环境来测试软件对吧谁能告诉我如何编译 Tensorflow 二进制文件以在 docker 文件上使用 SSE4 1 SSE4 2 有人能指点我一个可以做到这一点的 docker 文件吗如果有
我可以在 Selenium 中设置远程允许源而不使用通配符吗？

我在使用 Selenium WebDriver 时遇到 WebSocket 问题描述了相同的问题here https groups google com g chromedriver users c xL5 13 qGaA 问题的解决方案
当 -adjustsFontSizeToFitWidth 设置为 YES 时，如何计算 UILabel 的字体大小？

When myLabel adjustsFontSizeToFitWidth YES 如果文本对于标签来说太长 UILabel 会自动调整字体大小例如如果我的标签只有 100px 宽并且我的文本太长无法适应当前的字体大小它会缩小字
如何在bash中转换两个日期时间的日期格式？

我必须将日期时间从 Apr 10 16 07 03 04 格式化为 10 12 16 07 03 04 BST 格式我正在使用以下功能 convert date local months Jan Feb Mar Apr May Jun J
不适用于比较字符[重复]

这个问题在这里已经有答案了
为什么使用 Git 而不是 Mercurial？（反之亦然。）[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Fig.set_figheight 和 Fig.set_figwidth 不起作用

为什么这段代码没有改变绘制的图形的大小 fig1 ax1 plt subplots nrows 1 ncols 3 fig1 set figheight 30 fig1 set figwidth 30 x np array 1 2 3 4
log4j自定义jdbc附加器，数据源

为了在我的 log4j 附加程序中使用数据源我编写了一个自定义附加程序附加程序尝试以 spring bean 的形式获取数据源但是 appender 无法获取 bean 我使用的技术栈是 mybatis tomcat spring 我
桌面应用程序 + Microsoft 身份验证错误

我对桌面应用程序开发的了解有限并且我在混合平台中开发了一个应用程序并且在从桌面应用程序进行 Microsoft 身份验证 Azure ad 期间遇到此错误消息仅当您从信任的商店或网站下载应用程序时才可以继续如果需要从 Azure 应
Antlrworks - 无关输入

我是这方面的新手因此我需要你的帮助我正在尝试解析 Wikipedia Dump 我的第一步是将它们定义的每个规则映射到 ANTLR 不幸的是我遇到了第一个障碍第 1 行 8 外部输入需要我不明白发生了什么事请帮助我 My cod

Antlrworks - 无关输入

EDIT

Antlrworks - 无关输入 的相关文章

随机推荐

热门标签

Antlrworks - 无关输入的相关文章