使用 PyParsing 解析带有重要换行符的语言（如 Python）

2024-01-25

我正在实现一种语言，其中换行符有时很重要，就像在 Python 中一样，具有完全相同的规则。

出于我的问题的目的，我们可以采用与赋值、括号以及换行符和分号处理有关的 Python 片段。

例如，可以这样写：

a = 1 + 2 + 3    # ok
b = c

but not

a = 1 + 2 + 3     b = c   # incorrect

因为需要一个换行符来分隔两个语句。

然而我们可以有

a = 1 + 2 + 3;     b = c   # ok

使用分号。

也不允许有

a = 1 + 2 +   # incorrect
3
b = c

因为语句中不能有换行符。

然而，有可能有

a = 1 + 2 + (     # ok
3)
b = c

a = 1 + 2 + \     # ok
3
b = c

我一直在尝试执行上述规则，但我陷入困境。

首先，我使用

ParserElement.setDefaultWhitespaceChars(' \t')

所以现在\n是重要的。

我很好地使用换行符作为分隔符

lines = ZeroOrMore(line + OneOrMore(LineEnd()))

这种变化允许有;也作为分隔符。（我不太能处理继续括号\.)

I use infixNotation界定+, -, /, *.

我遇到的问题是括号内的换行符应该被忽略，就像在这种情况下：

a = 1 + 2 + ( 
3 +
1)

我认为这里可以发挥作用的是使用setWhitespaceChars在括号表达式上(LPAR + term + RPAR)然而， infixNotation 生成的代码不起作用，因为较低的表达式不会继承空白字符。

有人有任何提示吗？

我的问题也可以表达为“如何使用 pyParsing 解析 Python（的片段）？”。我以为我可以找到一些示例项目，但我没有。谷歌搜索，我看到人们引用了 pyParsing 存储库中的示例，但是parsePythonValue.py是关于解析值（我已经可以做到）并且不处理重要的换行符，并且pythongGrammarParsing.py是关于解析 Python 的 BNF 语法，而不是解析 Python。

注意：这不是一个可行的解决方案（至少目前还不是）。它依赖于未发布的 pyparsing 更改，这些更改甚至还没有通过所有单元测试。我发布它只是为了描述解决方案的可能方法。

噢！这比我想象的要困难得多。为了实现，我使用了 pyparsing 的忽略机制，并将解析操作附加到lpar and rpar要忽略的表达式<NL>位于括号内，但不在括号外。这还需要添加清除的能力ignoreExprs通过调用列出expr.ignore(None)。您的代码可能如下所示：

import pyparsing as pp

# works with and without packrat
pp.ParserElement.enablePackrat()

pp.ParserElement.setDefaultWhitespaceChars(' \t')

operand = pp.Word(pp.nums)
var = pp.Word(pp.alphas)

arith_expr = pp.Forward()
arith_expr.ignore(pp.pythonStyleComment)
lpar = pp.Suppress("(")
rpar = pp.Suppress(")")

# code to implement selective ignore of NL's inside ()'s
NL = pp.Suppress("\n")
base_ignore = arith_expr.ignoreExprs[:]
ignore_stack = base_ignore[:]
def lpar_pa():
    ignore_stack.append(NL)
    arith_expr.ignore(NL)
    #~ print('post-push', arith_expr.ignoreExprs)
def rpar_pa():
    ignore_stack.pop(-1)
    arith_expr.ignore(None)
    for e in ignore_stack:
        arith_expr.ignore(e)
    #~ print('post-pop', arith_expr.ignoreExprs)
def reset_stack(*args):
    arith_expr.ignore(None)
    for e in base_ignore:
        arith_expr.ignore(e)
    #~ print('post-reset', arith_expr.ignoreExprs)
lpar.addParseAction(lpar_pa)
rpar.addParseAction(rpar_pa)
arith_expr.setFailAction(reset_stack)
arith_expr.addParseAction(reset_stack)

# now define the infix notation as usual
arith_expr <<= pp.infixNotation(operand | var,
    [
    ("-", 1, pp.opAssoc.RIGHT),
    (pp.oneOf("* /"), 2, pp.opAssoc.LEFT),
    (pp.oneOf("- +"), 2, pp.opAssoc.LEFT),
    ],
    lpar=lpar, rpar=rpar
    )

assignment = var + '=' + arith_expr

# Try it out!
assignment.runTests([
"""a = 1 + 3""",
"""a = (1 + 3)""",
"""a = 1 + 2 + ( 
3 +
1)""",
"""a = 1 + 2 + (( 
3 +
1))""",
"""a = 1 + 2 +   
3""",
], fullDump=False)

Prints:

a = 1 + 3
['a', '=', ['1', '+', '3']]
a = (1 + 3)
['a', '=', ['1', '+', '3']]
a = 1 + 2 + ( 
3 +
1)
['a', '=', ['1', '+', '2', '+', ['3', '+', '1']]]
a = 1 + 2 + (( 
3 +
1))
['a', '=', ['1', '+', '2', '+', ['3', '+', '1']]]
a = 1 + 2 +   
3
a = 1 + 2 +   
          ^
FAIL: Expected end of text, found '+'  (at char 10), (line:1, col:11)>Exit code: 0

因此，这并非不可能，但确实需要一些英勇的努力。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 PyParsing 解析带有重要换行符的语言（如 Python）的相关文章

Python：使用 string.format() 将单词大写

是否可以使用字符串格式将单词大写例如 user did such and such format user foobar 应该返回 Foobar 做了这样那样的事情请注意我很清楚 capitalize 但是这是我正在使用的代码非常
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然

随机推荐

如何告诉 VTK 管道使用通过 TimerEvent 更新的新 vtkPolyData？

意图我编写了一个 VTK 应用程序它使用 vtkPoints gt vtkPolyLine gt vtkPolyData gt vtkPolyDataMapper 生成螺旋并显示它如果在程序初始化时静态完成则效果很好现在我想动态
SonataAdminBundle 自定义组图标

我正在使用 SonataAdminBundle 为我的页面实体生成 CRUD 使用下面的 yaml 文件菜单将显示在侧栏中我想更改组默认图标 fa fa folder 但我找不到执行此操作的选项 sonata admin page cl
将 Angular 从 4.0.0-beta.5 升级到 4.0.0 会破坏动画和单元测试

我已将应用程序中的 Angular 包从 4 0 0 beta 5 升级到 4 0 0 当我运行单元测试时我看到以下错误错误找到合成属性 transition 请在您的应用程序中包含 BrowserAnimationsModule 或
如何使用 HTML/PHP 防止 XSS？

我该如何预防XSS https en wikipedia org wiki Cross site scripting 跨站点脚本仅使用 HTML 和 PHP 我已经看过很多关于这个主题的其他帖子但我还没有找到一篇文章清楚简洁地说明如何
Java：为什么不能迭代迭代器？

I read 为什么Java的Iterator不是Iterable https stackoverflow com questions 839178 why is javas iterator not an iterable and 为什么
如何确定要在 svcutil 命令行中包含哪些架构文件 (xsd)？

使用 svcutil 我尝试生成一个代理类其遵循OGC CSW 2 0 2 07 006r1 http www opengeospatial org standards specifications catalog目录服务标准我已经下载了
乘法和除法的顺序优先级

SELECT 1 100 10 SELECT 100 1 10 结果不同首次回归 10 第二0 显然这是由命令引起的但我找不到任何信息表明除法的权重高于乘法看着http technet microsoft com en gb libr
单元测试时，如何模拟异步方法返回 null？

通常我会像这样嘲笑我的存储库 var repository new Mock
如何在同一个解决方案的不同项目中使用相同的obj文件

我有一个包含多个项目的解决方案其中一些项目共享源文件我已经设置了项目树以便共享源文件的项目放在一起我的问题是当我进行清理并构建共享源文件时每个项目都会重新编译而不仅仅是第一个使用它们的项目结果是初始构建花费的时间比应有的时间
如何在linux上使用python在后台捕获鼠标事件和按键事件

我想制作一个可以在后台运行但在发生鼠标事件或按键事件时打印文本的 python 脚本是否有任何库内置功能可以实现此目的或者我可以调用任何系统命令来获取此信息成为 root 没有问题我想您可能会使用 python 绑定来执行 ev
使用 Selenium Webdrivers 方法“browser.helperApps.neverAsk.saveToDisk”如何在单击链接时自动下载文件

在 Java 中使用 Selenium Web 驱动程序我尝试通过单击应用程序中的链接来下载文件即单击链接后应开始下载而不询问是否使用 Firefox 12 浏览器保存文件我正在使用 browser helperApps nev
我能够将几乎所有 XML 元素内容输出到表中，除了 (Local ="No") 的值

我正在尝试为以下 xml 代码编写 xsl 代码到目前为止我能够将几乎所有元素内容输出到表中除了 food 元素标签中的 Local No 值有没有办法输出该属性及其值谢谢
BroadcastReceiver onReceive() 线程安全吗？

Is onReceive 的方法BroadcastReceiver线程安全还是我需要自己实现同步如果我有任何正在使用的类级别变量onReceive 方法以及onReceive 方法被多次快速调用会导致问题吗 public class
通过代码刷新WPF-Control

我正在尝试禁用一个按钮来拒绝垃圾邮件点击此按钮我使用刷新委托来渲染调用控件但它显示为已启用 connect Methode 大约需要 4 秒时间按钮才会显示为已启用哪里有问题 public static class Extensio
google.visualization.DataTable() 合并行

我在 Google DataTable 中有这些数据我需要合并具有相同日期的行所以结果是 DataTable 中是否有内置方法可以实现此目的或者有人可以给我提示如何执行此操作而无需典型地迭代表并比较每一行这是我现在正在尝试的 js
如何更改 ASP.NET MVC 2 中的主题

我想要一个选项其中用户可以从下拉列表中选择他的网站主题并且该主题适用于该页面至少我希望在 ASP NET MVC 2 中完成此操作而不使用类似 jquery 的框架这怎么能实现呢我正在使用默认的 Webforms 视图引擎并
switch / case 语句中的 JavaScript 变量作用域是什么？

在使用 ASP NET MVC 创建 JavaScript 时我注意到几个范围警告并意识到我缺少一些对 switch case 语句内变量范围的理解警告 i 已定义参考案例b和案例c 我的代码看起来与此类似 switch elemen
如何使用 System.Text.Json 处理可为 null 的引用类型？

我已将项目升级到 net core 3 0 并且正在重构项目以使用新的可为空引用类型功能但由于以下问题很快就陷入困境假设我使用一个 REST api 它返回以下 JSON Name Volvo 240 Year 1989 此 api 始
无法将大文件上传到 GCP App Engine 中的 Python + Flask

更新 2020 年 5 月 18 日解决方法在本文最后我正在尝试将大型 CSV 文件 30MB 2GB 从浏览器上传到运行 Python 3 7 Flask 的 GCP App Engine 然后将这些文件推送到 GCP 存储这在使用
使用 PyParsing 解析带有重要换行符的语言（如 Python）

我正在实现一种语言其中换行符有时很重要就像在 Python 中一样具有完全相同的规则出于我的问题的目的我们可以采用与赋值括号以及换行符和分号处理有关的 Python 片段例如可以这样写 a 1 2 3 ok b c but

使用 PyParsing 解析带有重要换行符的语言（如 Python）

使用 PyParsing 解析带有重要换行符的语言（如 Python） 的相关文章

随机推荐

热门标签

使用 PyParsing 解析带有重要换行符的语言（如 Python）的相关文章