Boost.Spirit：解析期间设置子语法

2024-01-30

为了处理大量的编译时间和语法的重用，我将语法组成了几个按顺序调用的子语法。其中之一（称为：SETUP 语法）提供了解析器的一些配置（通过符号解析器），因此后面的子语法在逻辑上依赖于该语法（再次通过不同的符号解析器）。因此，在解析SETUP之后，需要更改以下子语法的符号解析器。

我的问题是，如何有效地解决这个问题，同时保持子语法之间的松散耦合？

目前我只看到两种可能性：

SETUP 语法的 on_success 处理程序可以完成这项工作，但这会引入相当多的耦合。
设置完成后，将所有内容解析为字符串，构建一个新的解析器（根据更改后的符号）并在第二步中解析该字符串。这会留下相当多的开销。

我想要的是一个 on_before_parse 处理程序，它可以由任何需要在每次解析之前做一些工作的语法来实现。从我的角度来看，这会减少耦合，并且解析器的某些设置在其他情况下也可以派上用场。这样的事情可能吗？

Update:

抱歉，我太粗略了，这不是我的本意。

任务是使用一些关键字解析输入 I，例如#task1 and #task2。但在某些情况下，这些关键字需要不同，例如$$task1 and $$task2.

所以解析的文件将以

setup {
  #task1=$$task1
  #task2=$$task2
}

realwork {
  ...
}

一些代码草图：给定是一个主解析器，由几个（至少两个）解析器组成。

template<typename Iterator>
struct MainParser: qi::grammar<Iterator, Skipper<Iterator>> {

  MainParser() : MainParser::base_type(start) {
    start = setup >> realwork;
  }

  Setup<Iterator>    setup;
  RealWork<Iterator> realwork;

  qi::rule<Iterator, Skipper<Iterator> > start;
}

Setup and RealWork它们本身就是解析器（我上面的子解析器）。在设置部分期间，语法的某些关键字可能会改变，因此设置部分有一个qi::symbols<char, keywords>规则。一开始这些符号将包含#task1 and #task2。解析文件的第一部分后，它们包含$$task1 and $$task2.

由于关键字已更改，并且自RealWork需要解析 I，它需要了解新的关键字。所以我必须从Setup to RealWork在文件配对期间。

我看到的两种方法是：

使Setup意识到RealWork并传输符号Setup to RealWork in the qi::on_success的处理程序Setup。（坏，耦合）

切换到两个解析步骤。start of MainParser看起来像

start = setup >> unparsed_rest

之后会有第二个解析器MainParser。示意图：

SymbolTable Table;
string Unparsed_Rest;
MainParser.parse(Input, (Unparsed_Rest, Table));

RealWordParser.setupFromAlteredSymbolTable(Table);
RealWorkParser.parse(Unparsed_Rest);

几个解析步骤的开销。

所以，到目前为止，属性还没有发挥作用。只需在解析时更改解析器即可处理多种输入文件。

我的希望是一个处理者qi::on_before_parse like qi::on_success。从这个想法来看，每次解析器开始解析输入时都会触发该处理程序。理论上只是在解析开始时的拦截，就像我们有拦截一样on_success and on_error.

可悲的是，您没有显示任何代码，并且您的描述有点......粗略。因此，这是一个相当通用的答案，它解决了我从您的问题中提取的一些要点：

关注点分离

听起来很像您需要将 AST 构建与转换/处理步骤分开。

解析器组成

当然你可以编写语法。只需按照您的规则编写语法，并以您希望的任何传统方式隐藏这些语法的实现（pImpl习语、const static 内部规则，只要符合要求即可）。

然而，组合通常不需要“事件”驱动元素：如果您觉得需要分两个阶段进行解析，在我看来，你只是在努力保持概述，但递归下降或 PEG 语法自然非常适合描述这样的语法swoop（或者如果你愿意的话，可以通过一次）。

但是，如果您发现

(a) 你的语法变得复杂
(b) 或者您希望能够根据运行时功能选择性地插入子语法

你可以考虑

纳比亚莱克技巧（我在我的文章中多次展示/提到过这一点）[标签：boost-spirit] 本网站上的答案 https://stackoverflow.com/search?q=user%3A85371+%5Bboost-spirit%5D+OR+%5Bboost-spirit-qi%5D
您可以动态构建规则（这并不容易推荐，因为您将陷入与复制 Proto 表达式树有关的致命陷阱，从而导致悬空引用）。我有时也会展示一些这样做的答案：
- 从替代解析器表达式的可变参数列表生成 Spirit 解析器表达式 https://stackoverflow.com/questions/16177184/generating-spirit-parser-expressions-from-a-variadic-list-of-alternative-parser/16181550#16181550
- C++ Boost qi 递归规则构建 https://stackoverflow.com/questions/17405500/c-boost-qi-recursive-rule-construction/17408206#17408206
- Boost.Spirit.Qi：在解析时动态创建“差异”解析器 https://stackoverflow.com/questions/17000897/boost-spirit-qi-dynamically-create-difference-parser-at-parse-time/17003832#17003832
重复：除非您知道如何检测 UB 并使用 Proto 修复问题，否则不要尝试此操作

希望这些事情可以帮助您走上正轨。如果没有，我建议你回来concrete问题。与“想法”相比，我更熟悉代码，因为想法often对你来说比对我来说更有意义。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)