是否可以设置规则的优先级以避免“最长最早”的匹配模式？

2024-01-02

另一个简单的问题：有没有办法告诉 flex 更喜欢匹配短事物的规则而不是匹配长事物的规则？我找不到任何关于这方面的好的文档。

这就是我需要它的原因：我解析一个伪语言文件，其中包含一些与控制指令相对应的关键字。我希望它们成为绝对优先级，这样它们就不会被解析为表达式的一部分。我实际上需要这个优先事项，因为我不必为我的项目编写完整的语法（在我的情况下这完全是矫枉过正，因为我对解析的程序进行结构分析，我不需要知道细节.. .)，所以我无法使用精细的语法调整来确保这些块不会被解析为表达式。

任何帮助将不胜感激。

这是解析文件的示例：

If a > 0 Then read(b); Endif
c := "If I were...";
While d > 5 Do d := d + 1 Endwhile

我只是想收集有关 If、Then、Endif 等的信息...其余的对我来说并不重要。这就是为什么我希望对 If、Then 等相关规则进行优先级排序，而不必编写语法。

来自龙书第二版，第3.5.3节“Lex 中的冲突解决”：

We have alluded to the two rules that Lex uses to decide on the proper lexeme
to select, when several prefixes of the input match one or more patterns:
    1. Always prefer a longer prefix to a shorter prefix.
    2. If the longest possible prefix matches two or more patterns, prefer the
       pattern listed first in the Lex program.

上述规则也适用于 Flex。这是什么Flex手册说（第7章：输入如何匹配。）

When the generated scanner is run, it analyzes its input looking for strings 
which match any of its patterns. If it finds more than one match, it takes the 
one matching the most text (for trailing context rules, this includes the length 
of the trailing part, even though it will then be returned to the input). If it 
finds two or more matches of the same length, the rule listed first in the flex 
input file is chosen.

如果我理解正确的话，你的词法分析器会将关键字视为Endif作为标识符，因此之后它将被视为表达式的一部分。如果这是你的问题，只需将关键字规则放在您的规范之上，比如下面这样：（假设每个大写的单词是一个预定义的枚举，对应一个token）

"If"                      { return IF;         }
"Then"                    { return THEN;       }
"Endif"                   { return ENDIF;      }
"While"                   { return WHILE;      }
"Do"                      { return DO;         }
"EndWhile"                { return ENDWHILE;   }
\"(\\.|[^\\"])*\"         { return STRING;     }
[a-zA-Z_][a-zA-Z0-9_]*    { return IDENTIFIER; }

那么关键字将始终匹配在标识符之前由于规则 2。

EDIT:

谢谢你的评论，kol。我忘记添加字符串规则。但我不认为我的解决方案是错误的。例如，如果一个标识符称为If_this_is_an_identifier, rule 1将应用，因此标识符规则将生效（因为它匹配最长的字符串）。我编写了一个简单的测试用例，发现我的解决方案没有问题。这是我的 lex.l 文件：

%{
  #include <iostream>
  using namespace std;
%}

ID       [a-zA-Z_][a-zA-Z0-9_]*

%option noyywrap
%%

"If"                      { cout << "IF: " << yytext << endl;         }
"Then"                    { cout << "THEN: " << yytext << endl;       }
"Endif"                   { cout << "ENDIF: " << yytext << endl;      }
"While"                   { cout << "WHILE: " << yytext << endl;      }
"Do"                      { cout << "DO: " << yytext << endl;         }
"EndWhile"                { cout << "ENDWHILE: " << yytext << endl;   }
\"(\\.|[^\\"])*\"         { cout << "STRING: " << yytext << endl;     }
{ID}                      { cout << "IDENTIFIER: " << yytext << endl; }
.                         { cout << "Ignore token: " << yytext << endl; }

%%

int main(int argc, char* argv[]) {
  ++argv, --argc;  /* skip over program name */
  if ( argc > 0 )
    yyin = fopen( argv[0], "r" );
  else
    yyin = stdin;

  yylex();
}

我使用以下测试用例测试了我的解决方案：

If If_this_is_an_identifier > 0 Then read(b); Endif
    c := "If I were...";
While While_this_is_also_an_identifier > 5 Do d := d + 1 Endwhile

它给了我以下输出（与您提到的问题无关的其他输出将被忽略。）

IF: If
IDENTIFIER: If_this_is_an_identifier
......
STRING: "If I were..."
......
WHILE: While
IDENTIFIER: While_this_is_also_an_identifier

lex.l 程序是根据示例进行修改的灵活手册 http://westes.github.io/flex/manual/Simple-Examples.html:（使用相同的方法来匹配标识符中的关键字）

还可以看看ANSI C 语法、Lex 规范 http://www.lysator.liu.se/c/ANSI-C-grammar-l.html.

我在我的个人项目中也使用了这种方法，到目前为止我没有发现任何问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

是否可以设置规则的优先级以避免“最长最早”的匹配模式？的相关文章

std::list::clear 是否会使 std::list::end 迭代器无效？

检查这个代码 include stdafx h include
从 Invoke 方法获取 RETURN

我正在尝试从另一个线程上的列表框项目中读取值我尝试创建一种新方法来运行调用命令我可以设法将命令发送到列表框例如通过调用方法添加但我似乎无法得到响应我似乎无法获取该项目的值我尝试了几种方法一旦我将它从空变为字符串事情就开始变得
EventHandler 应该始终用于事件吗？

我一直在愉快地使用自定义委托类型和通用编写事件Action委托类型没有真正考虑我在做什么我有一些很好的扩展助手Action and EventHandler这使我倾向于使用那些预定义的委托类型而不是我自己的委托类型但除此之外除了惯例
OpenGL缓冲区更新[重复]

这个问题在这里已经有答案了目前我正在编写一个模拟水的程序以下是我所做的步骤创建水面平面创建VAO 创建顶点缓冲区对象在其中存储法线和顶点将指针绑定到此 VBO 创建索引缓冲区对象然后我使用 glDrawElements 渲染
C++中的类要具备什么条件才能成为容器？

我是 C 编程新手偶然发现了这个术语containers举例如下vector deque map etc 一个企业的最低要求应该是什么class应该满足被称为container in C 我将从范围这个概念开始 Range 只有两个方
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
从时间列表中查找最接近的时间

所以这是场景我有一个带有创建时间的文件我想从该文件的创建时间最接近或相等的时间列表中选择一个时间完成此操作的最佳方法是什么 var closestTime listOfTimes OrderBy t gt Math Abs t fi
Nhibernate：连接表并从其他表获取单列

我有以下表格 create table Users Id uniqueidentifier primary key InfoId uniqueidentifier not null unique Password nvarchar 255
如何增加ofstream的缓冲区大小

我想增加 C 程序的缓冲区大小以便它不会过于频繁地写入默认缓冲区是 8192 字节我尝试使用 pubsetbuf 将其增加到 200K 原始代码 ofstream fq fastq1 cstr ios out fastq1 is a
“没有合适的默认构造函数可用”——为什么会调用默认构造函数？

我已经查看了与此相关的其他一些问题但我不明白为什么在我的情况下甚至应该调用默认构造函数我可以只提供一个默认构造函数但我想了解它为什么这样做以及它会产生什么影响 error C2512 CubeGeometry no appropria
如何在新窗口中打开图像或pdf文件？

我有一个 gridview 它包含文件名和文件路径图像和 pdf 格式文件其中我使用了模板字段在该字段下放置了 1 个图像按钮单击该图像按钮即查看按钮时我想在新窗口中打开所选文件这是我的代码 protected void
如果在代码中添加元素，“FindName”将不起作用

在 WPF 应用程序中如果在 XAML 中声明 ContentControl
测验；这个编译了吗？如果是的话它会返回什么（我知道答案）

我最近发现这个错字 if name find string npos 显然开发者的意思是输入 if name find string npos 但令我惊讶的是发现错误甚至编译 Wall Werror 没有尝试过 pedantic 那么咖啡
C++ 模板可以提供 N 个给定类的公共父类吗？

我正在寻找一个 C 模板它可以找到一组给定类的共同父级例如 class Animal class Mammal public Animal class Fish public Animal class Cat public Mammal
如何调用与现有方法同名的扩展方法？ [复制]

这个问题在这里已经有答案了我有这样的代码 public class TestA public string ColA get set public string ColB get set public string ColC get se
解释这段代码的工作原理；子进程如何返回值以及在哪里返回值？

我不明白子进程如何返回该值以及返回给谁输出为 6 7 问题来源 http www cs utexas edu mwalfish classes s11 cs372h hw sol1 html http www cs utexas edu
使用 boost 异步发送和接收自定义数据包？

我正在尝试使用 boost 异步发送和接收自定义数据包根据我当前的实现我有一些问题 tcpclient cpp include tcpclient h include
在 C 中使用 #define 没有任何价值

If a define没有任何价值地使用例如 define COMMAND SPI 默认值是0吗不它的评估结果为零从字面上看该符号被替换为空然而一旦你有了 define FOO 预处理器条件 ifdef FOO现在将是真的另
运行 xunit 测试时无法将输出打印到控制台窗口

public class test2InAnotherProject private readonly ITestOutputHelper output public test2InAnotherProject ITestOutputHel
IDisposable 的显式实现

虽然有很多关于IDisposable在 SO 上找到我还没有找到答案我通常遵循这样的做法当我的一个班级拥有一个IDisposable对象然后它也实现IDisposable并打电话Dispose在拥有的对象上然而最近我遇到了一个类它

随机推荐

带过滤器 Android 的自定义列表视图适配器

请尝试在我的列表视图上实现过滤器但每当文本发生变化时列表就会消失请帮忙这是我的代码适配器类 package com talagbe schymn import java util ArrayList import android
从 Oracle 的 RAW(16) 转换为 .NET 的 GUID

我在手动调试 NET 应用程序时遇到困难其中 Guid 值与 NET 和 Oracle 不同 Where C reads 17D89D326C2142D69B989F5201288DBF Oracle reads 329DD817216C
将 Windows SID 存储在数据库中以供查找

我有一个 ASP NET MVC 应用程序我需要允许客户根据其环境配置 MembershipProviders 但仍然能够将该 MembershipUser 映射到我们数据库中的具体用户模型 Membership GetUser 将使我能
将 Java 套接字配置为在断开连接时快速失败？

我的服务器上有一个监听端口我使用 Java 类连接到该端口Socket接口即 Socket mySocket new Socket host port 然后我抓起一个OutputStream 用一个装饰PrintWriter在自动刷新模
具有滚动背景的 Recyclerview

我正在尝试创建一个具有滚动背景的 RecyclerView 如下所示这个想法是当我向上向下滚动视图保持器时背景浅绿色图像也应该同步向上向下移动关于如何实现这一目标有任何线索吗这是我的基本 RecyclerView 配置
使用特定 SA 通过 Cloud Build 部署 Dataflow 管道

我竭尽全力尝试使用特定 SA 而不是默认的 Cloud Build SA 从 Cloud Build 部署数据流管道但到目前为止尚未成功我遵循了这个过程 https cloud google com build docs secure
将值从一种方法返回到另一种方法

Assume as precondition that the list of players is not empty Returns the winning score that is the lowest total score re
将非 ASCII/UTF-8 字符转换为 LaTeX 代码

我们必须将非 ASCII UTF 8 或命名实体字符转换为 LaTeX 代码现在我们使用非 ASCII 到 Unicode 然后使用 Perl 脚本将 Unicode 转换为 LaTeX 实体例如 oacute gt o x000F3
python-requests post 带有 unicode 文件名

我已经在这里阅读了几个相关的问题但没有找到可行的解决方案我有一个 Flask 服务器其中包含以下简化代码 app Flask name api Api app class SendMailAPI Resource def post s
使用 Excel VBA 更改连接字符串时创建的新数据连接

我有一个工作簿其中包含由宏更新的数据透视表不过在刷新数据之前连接字符串会发生更改 With ThisWorkbook Connections Data ODBCConnection Connection Redacted Comma
如何通过谷歌表格上的查询比较日期或日期与今天？

我正在努力将sheet1的副本复制到另一个sheet2 同一文档上并且query 工作得很好直到我想要过滤的列是公式单元格每个都有查询匹配等的长单元格我想要做的是过滤sheet1中的行其中M列中的事件日期即将到来有更多过滤条
JPA 创建 - Hibernate 未显示在平台中

我正在尝试创建一个使用 Hibernate 作为持久性提供者的 JPA 项目但是当我单击平台时它没有显示 Hibernate 它在平台下拉框中显示 Generic 和 EclipseLink 我应该怎么做才能在下拉框下获得 Hibern
Python os.system 命令不起作用？

早些时候我曾经很好地使用 python 进行编码但是在我格式化计算机并重新安装相同的 python 设置之后我的os system命令停止工作以及subprocess Popen 看来是路径问题我重现该 1 错误的唯一方法是将路径
我如何告诉 PyCUDA 使用哪个 GPU？

我的机器中有两张 NVidia 卡并且都支持 CUDA 当我运行示例脚本以开始使用此处所示的 PyCUDA 时 http documen tician de pycuda http documen tician de pycuda 我得到
使用 ECS Fargate 执行 Step Function“任务”

在 Re Invent 2018 中 AWS 似乎推出了与 Step Functions 的新集成其中包括 ECS Fargate 支持 https docs aws amazon com step functions latest dg
c_include_path 与 ld_library_path

在 Ubunutu 12 04 或 Springdale 6 4 上使用 gcc 和 g 有什么区别C INCLUDE PATH or CPLUS INCLUDE PATH and LD LIBRARY PATH 是个LD一个仅在运行时使
异常消息是英文的吗？

我们通过将 Exception Message 写入文件来记录系统中发生的任何异常然而它们是根据客户的文化编写的土耳其的错误对我来说意义不大那么我们如何才能在不改变用户文化的情况下用英语记录错误消息呢这个问题可以部分解决框架异常
什么是接口断言？

我刚刚遇到了这段代码 type Logger interface Debug msg string keyvals interface error Info msg string keyvals interface error Error
Python 使用 tenacity 模块重试

我很难获得坚韧图书馆 https github com jd tenacity按预期工作下面测试中的重试根本不会触发我希望每 5 秒重试一次并让日志文件反映重试尝试 import paramiko import tenacity fr
是否可以设置规则的优先级以避免“最长最早”的匹配模式？

另一个简单的问题有没有办法告诉 flex 更喜欢匹配短事物的规则而不是匹配长事物的规则我找不到任何关于这方面的好的文档这就是我需要它的原因我解析一个伪语言文件其中包含一些与控制指令相对应的关键字我希望它们成为绝对优先级这样它们

是否可以设置规则的优先级以避免“最长最早”的匹配模式？

是否可以设置规则的优先级以避免“最长最早”的匹配模式？ 的相关文章

随机推荐

热门标签

是否可以设置规则的优先级以避免“最长最早”的匹配模式？的相关文章