在 ANTLR4 中如何检查行的第一个字符是否为“*”？

2024-05-09

我正在尝试为一种相对简单但特殊的语言编写一个解析器。

简单地说，规则之一是注释行用星号表示only如果该星号是该行的第一个字符。我如何在 ANTLR4 中正式化这样的规则？我考虑过使用：

START_LINE_COMMENT: '\n*' .*? '\n' -> skip;

但我确信这不适用于连续多于一行的注释，因为最后的换行符将作为START_LINE_COMMENT令牌，这意味着任何后续注释行都将缺少所需的初始换行符，这将不起作用。有没有办法我可以检查该行是否以'*'无需消耗之前的'\n'?

匹配注释行并不容易。当我每年写一篇语法时，我必须抓住权威的 ANTLR 参考 https://pragprog.com/book/tpantlr2/the-definitive-antlr-4-reference让我的大脑清醒一下。尝试这个：

grammar Question;

/* Comment line having an * in column 1. */

question
    :   line+
    ;

line
//    :   ( ID | INT )+
    :   ( ID | INT | MULT )+
    ;

LINE_COMMENT
    :   '*' {getCharPositionInLine() == 1}? ~[\r\n]* -> channel(HIDDEN) ;
ID  :   [a-zA-Z]+ ;
INT :   [0-9]+ ;
//WS  :   [ \t\r\n]+ -> channel(HIDDEN) ;
WS  :   [ \t\r\n]+ -> skip ;
MULT : '*' ;

编译并执行：

$ echo $CLASSPATH
.:/usr/local/lib/antlr-4.6-complete.jar:
$ alias
alias a4='java -jar /usr/local/lib/antlr-4.6-complete.jar'
alias grun='java org.antlr.v4.gui.TestRig'
$ a4 Question.g4 
$ javac Q*.java
$ grun Question question -tokens data.txt 
[@0,0:3='line',<ID>,1:0]
[@1,5:5='1',<INT>,1:5]
[@2,9:12='line',<ID>,2:2]
[@3,14:14='2',<INT>,2:7]
[@4,16:26='* comment 1',<LINE_COMMENT>,channel=1,3:0]
[@5,32:35='line',<ID>,4:4]
[@6,37:37='4',<INT>,4:9]
[@7,39:48='*comment 2',<LINE_COMMENT>,channel=1,5:0]
[@8,51:78='* comment 3 after empty line',<LINE_COMMENT>,channel=1,7:0]
[@9,81:81='*',<'*'>,8:1]
[@10,83:85='not',<ID>,8:3]
[@11,87:87='a',<ID>,8:7]
[@12,89:95='comment',<ID>,8:9]
[@13,97:100='line',<ID>,9:0]
[@14,102:102='9',<INT>,9:5]
[@15,107:107='*',<'*'>,9:10]
[@16,109:110='no',<ID>,9:12]
[@17,112:118='comment',<ID>,9:15]
[@18,120:119='<EOF>',<EOF>,10:0]

具有以下 data.text 文件：

line 1
        line 2
* comment 1
    line 4
*comment 2

* comment 3 after empty line
 * not a comment
line 9    * no comment

请注意，如果没有MULT令牌或'*'在解析器规则中的某处，星号未在标记中列出，但解析器抱怨：

line 8:1 token recognition error at: '*'

如果显示解析树

$ grun Question question -gui data.txt

您会看到整个文件被一行规则吸收。如果您需要识别行，请更改行和空白规则，如下所示：

line
    :   ( ID | INT | MULT )+ NL
    |   NL
    ;

//WS  :   [ \t\r\n]+ -> skip ;
NL  :   [\r\n] ;
WS  :   [ \t]+ -> skip ;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 ANTLR4 中如何检查行的第一个字符是否为“*”？的相关文章

两个基本的 ANTLR 问题

我正在尝试使用 ANTLR 来获取简单的语法并生成汇编输出我在 ANTLR 中选择的语言是 Python 许多教程看起来非常复杂或详细阐述与我无关的事情我真的只需要一些非常简单的功能所以我有两个问题将值从一个规则返回到另一规则
将聊天文本中的成对符号替换为 html 标签，以设置粗体、斜体和删除线样式

我正在尝试制作 Whatsapp 风格的文本帖子当用户创建这样的文本时 Hi how are you where are you 然后这个文本会像这样自动改变 Hi你好吗你在哪我知道我可以使用 php 正则表达式来做到这一点如下所示
解析器生成

我正在做一个项目软件抄袭检测我打算用C语言来做这件事因为我应该创建一个令牌生成器和一个解析器但我不知道从哪里开始任何人都可以帮助我解决这个问题我创建了一个令牌数据库并将令牌与我的程序分开接下来我想做的就是比较两个程序以查明它是
是否有像 gccxml 这样的用于生成包装器的 C 标头解析器工具？

我需要为一种新的编程语言编写一些 C 标头包装器并且想要类似 gccxml 的东西但不完全依赖 gcc 以及它在 Windows 系统上带来的问题只需要读C而不是C 只要有完整的文档记录任何格式的输出都可以 Linux Solari
在 ANTLR4 中如何检查行的第一个字符是否为“*”？

我正在尝试为一种相对简单但特殊的语言编写一个解析器简单地说规则之一是注释行用星号表示only如果该星号是该行的第一个字符我如何在 ANTLR4 中正式化这样的规则我考虑过使用 START LINE COMMENT n n gt sk
为什么 Parsec 的 sepBy 停止并且不解析所有元素？

我正在尝试解析一些逗号分隔的字符串该字符串可能包含也可能不包含具有图像尺寸的字符串例如 hello world 300x300 good bye world 我写了下面的小程序 import Text Parsec import qua
如何在Java中有效地读取由大量小项目组成的大型XML文件？

我有一个很大的 XML 文件其中包含相对固定大小的项目即
“单词的正则表达式”（语义替换）-任何示例语法和库吗？

我正在寻找在给定过程语言的情况下对单词而不是字符进行正则表达式样式转换的常用技术的语法示例例如为了追踪复制人们可能想要创建一份具有相似含义但具有不同单词选择的文档我希望能够简洁地定义这些可以应用于文本流的可能的转换例如快速地no
使用 Javascript 解析文本

我正在尝试使用 Javascript 来解析在文本框中输入的文本这将结合各种用户生成的变量来创建随机活动看看这个例子可能更有意义一些示例输入可能是 Activity Home Out Home Read book for time C
python 3 argparse 调用函数

我想在 python3 中创建一个类似命令行类似 shell 的界面 Argparse 似乎负责解析和显示帮助错误消息根据argparse 的 python3 文档 https docs python org 3 5 library
将人类日期（当地时间 GMT）转换为日期

我正在服务器上工作服务器正在向我发送 GMT 本地日期的日期例如Fri Jun 22 09 29 29 NPT 2018在字符串格式上我将其转换为日期如下所示 SimpleDateFormat simpleDateFormat ne
将 Java 字符串转换为 sql.Timestamp

收到以下格式的字符串 YYYY MM DD HH MM SS NNNNNN 时间戳来自 DB2 数据库我需要将其解析为 java sql Timestamp 并且不丢失任何精度到目前为止我一直无法找到现有的代码来解析远至微秒的数据 S
如何在 Azure 逻辑应用中解析 Excel 电子表格

我需要使用 Azure 逻辑应用从 Excel 电子表格中解析和提取列信息我已经为我的逻辑应用程序设置了从 Outlook 检索最新未读电子邮件的功能此外我的逻辑应用程序执行 FOR EACH 来读取所有附件来自未读电子邮件并确保
用于遇到 [...] 的 Haskell Parsec 解析器

我正在尝试使用 Parsec 在 Haskell 中编写一个解析器目前我有一个可以解析的程序 test x 1 2 3 end 执行此操作的代码如下 testParser do reserved test v lt identifier
用于（联合国）结构化文本文档的词法分析器/解析器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有很多脚本解析器和词法分析器即结构化计算机语言但我正在寻找一个可以将几乎非结构化文本文档分成更
获取 Parse Analytics 自定义仪表板

是否可以使用 Javascript 或 REST API 从 Parse 获取应用程序分析我想在我自己的仪表板中显示下载数量和自定义事件不可以您只能通过 REST API 推送 https parse com docs rest ht
有没有使用 ANTLR 或类似语言实现的简单语言？

我正在尝试构建一种简单的解释语言以用于学习目的我读过无数关于 ANTLR 和 JavaCC 的理论和教程但我不知道如何真正让它做一些有用的事情我通过把东西拆开然后重新组合起来来学得最好那么是否有任何在 ANTLR 或类似工具的
需要使用 pyparsing 制作递归解析器的帮助

我正在尝试使用 python pyparsing 进行解析我在制作递归解析器时陷入困境让我解释一下问题我想要计算元素的笛卡尔积语法是 cross elements element 我用更具体的方式 cross a c1 or cro
ANTLR4 词法分析器无法解决语法顺序中的歧义

使用 ANTLR 4 2 我尝试对此测试数据进行非常简单的解析 RRV0 ABC 使用最小语法 grammar Tiny thing RRV N HASH ID RRV RRV N 0 9 HASH ID a zA Z0 9 WS t r
SQL Server OPENJSON读取嵌套json

我有一些想要在 SQL Server 2016 中解析的 json 有一个项目 gt 结构 gt 属性的层次结构我想编写一个解析整个层次结构的查询但我不想通过索引号指定任何元素即我不想做这样的事情 openjson json 0 or

随机推荐

Rails - 使链接与 ajax 一起工作

我有一个链接应该使用 ajax 加载它旁边的部分内容而无需重新加载页面链接在这里这是链接应该转到的控制器 class ProfilesController lt ApplicationController def profile f
反转二进制网络

如何反转二元方程以便找到哪些输入将产生给定的输出 Example Inputs i0 through i8 Outputs o0 through o8 Operators XOR AND 二元方程 1 i0 1 i1 0 i2 1 i3
用于真实 Web 项目的 Scala-JS [已关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案有人用过吗Scala JS在真实的网络项目中但不仅仅适用于普通的JavaScript在隔离环境中替换我想尽可能多地使用 Scala 我希望可
JavaScript - 这个这个

String prototype foo String prototype foo bar function How can you reference the grandparent string console log this par
如何使用 terraform 创建 azure 应用程序注册和客户端密钥

我正在尝试为 Azure 应用程序注册和客户端密钥创建 Terraform 代码对订阅具有读取访问权限的服务主体基本上我正在尝试将 Azuresafe 与 Terraform 集成并尝试确定如何逐步配置 https docs saf
为什么这个 CSS nowrap 不起作用？

我试图阻止 bar top container div 包裹它的内容无论页面有多宽即两个选择应该始终出现在同一行但是当页面宽度太小而无法容纳它们时这不起作用一方面我该如何解决这个问题 Styles bar top containe
不兼容的类型 - 是因为数组已经是指针吗？

在下面的代码中我创建一个基于书籍结构的对象并让它保存多个书籍我设置的是一个数组即定义启动的对象然而每当我去测试我对指针的了解实践有帮助并尝试创建一个指向创建的对象的指针时它都会给我错误 C Users Justin D
如何得到将外力映射到广义力的矩阵？

给定一个多体植物我需要找到将外力 lambda 转换为广义力的矩阵 IE 以下方程中的 Phi 取自 Scott Kuindersma Frank Permenter 和 Russ Tedrake 的稳定动态运动的有效可解二次规划我的
检查 href 中是否存在 jQuery 中的查询字符串

我目前有一段 jQuery 用于附加带有一些位置信息的 URL jQuery a attr href function return this href location 123 abc 我的问题是大多数链接都有一个其中使用上面的就可以
无法匹配任何路线。 URL 段：''：尝试使用子路由和 Ng2 时

I have 以下笨蛋 https plnkr co edit PHaGNtfa0fPBgET4NEpZ p preview 这是行不通的为了让它发挥作用我可以评论 RouterModule forRoot path component
显示带有 jQuery-ui 自动完成功能的微调器

我一直在到处搜索但没有看到有人这样做是否有可能拥有某种带有 jQ uery UI 自动完成功能的旋转器加载器 1 8 获取数据时我的解决方案是使用 ui autocomplete loading CSS 类该类在 ajax GET
AngularUI Router：在调用子状态时将 url 参数传递给“抽象”状态

我想在调用子状态时访问抽象状态内的 url 参数 stateParam 我很想知道如何做到这一点代码在笨蛋也 http plnkr co edit L0TXx3DCBOJmh4XydXbV p preview stateProvider
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py
Phonegap 图像未显示

我无法让图像在我的phonegap 版本中正常工作我读过绝对路径可能不起作用所以我尝试了绝对路径和相对路径但仍然没有运气我包括这样的图像
什么是错误“类型实例化涉及 byref 类型。” F# 中的解决方法是什么

我有一些代码包装 TA Lib 很多包装器非常相似 let sma timePeriod int data float let mutable outStartIndex 0 let mutable outNbElement 0 let m
Curl 和 Php 5.3.3 中的 SSL 连接错误

我的网站自 3 年来一直运行良好代码如下现在突然从 2 天开始出现以下错误 SSL 连接错误在 Curl error 中下面是我的代码
如何知道寄存器是否是“通用寄存器”？

我试图了解寄存器必须具备什么标准才能被称为通用寄存器我相信通用寄存器是一个可以用于任何用途的寄存器用于计算将数据移入移出等并且是一个没有特殊用途的寄存器现在我读到了ESP寄存器是通用寄存器我猜是ESP寄存器可以用于任何事情
Ionic 2 获取离子输入值

我正在使用 ionic 2 创建登录名请不要只回答您只需要添加 ngModules 属性如果您认为这就是解决方案请解释原因解释一下就像对孩子做的那样我的代码在login ts import Component from ang
Android Windows：它们何时以及如何创建？

我已经阅读了标准的 Windows 相关文档并翻阅了一堆源代码试图理解 Android 如何以及何时窗口已创建我相信我已经拥抱它并愿意对其进行验证或更正据我所知只有两种方法可以获得 Window 对象的句柄 1 Activit
在 ANTLR4 中如何检查行的第一个字符是否为“*”？

我正在尝试为一种相对简单但特殊的语言编写一个解析器简单地说规则之一是注释行用星号表示only如果该星号是该行的第一个字符我如何在 ANTLR4 中正式化这样的规则我考虑过使用 START LINE COMMENT n n gt sk

在 ANTLR4 中如何检查行的第一个字符是否为“*”？

在 ANTLR4 中如何检查行的第一个字符是否为“*”？ 的相关文章

随机推荐

热门标签

在 ANTLR4 中如何检查行的第一个字符是否为“*”？的相关文章