关于如何为 Pygments 编写词法分析器的大量文档？ [关闭]

2024-02-02

我有一本字典Stata http://stata.com/关键字和 Stata 语法的合理知识。我想花几个小时把它变成一个 Stata 词法分析器Pygments http://pygments.org/.

但是，我找不到足够的有关词法分析器语法的文档，并且发现自己无法开始对词法分析器进行编码。有人可以指出为 Pygments 编写新词法分析器的好教程吗？

我知道关于皮格门斯 API http://pygments.org/docs/api/和词法分析器开发页面 http://pygments.org/docs/lexerdevelopment/但说实话，对于像我这样对 Python 知识非常有限的人来说，这些还不够。

到目前为止，我的策略是寻找例子。我已经发现, e.g. Puppet https://github.com/rodjek/puppet-pygments-lexer/blob/master/puppet_lexer/__init__.py, Sass https://github.com/chriseppstein/pygments-sass-lexer/blob/master/sass_lexer/__init__.py, Scala https://github.com/iamjwc/pygments-scala-lexer/blob/master/scala_lexer.py, Ada https://github.com/jschaf/Ada-Pygments-Lexer/blob/master/ada_lexer/__init__.py。他们的帮助也仅限于此。欢迎任何有关如何开始使用我的 Stata 关键字的帮助。

如果您只是想突出显示关键字，您可以从这里开始（用您自己的 Stata 关键字列表替换关键字）：

class StataLexer(RegexLexer):

    name = 'Stata'
    aliases = ['stata']
    filenames = '*.stata'
    flags = re.MULTILINE | re.DOTALL

    tokens = {
       'root': [
           (r'(abstract|case|catch|class|do|else|extends|false|final|'
            r'finally|for|forSome|if|implicit|import|lazy|match|new|null|'
            r'object|override|package|private|protected|requires|return|'
            r'sealed|super|this|throw|trait|try|true|type|while|with|'
            r'yield)\b', Keyword),
       ],
   }

我认为你的问题不是你不懂Python，而是你没有太多编写词法分析器或理解词法分析器如何工作的经验？因为这个实现相当简单。

然后，如果您想添加更多内容，请向rootlist，一个双元素元组，其中第一个元素是正则表达式，第二个元素指定语法类。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

关于如何为 Pygments 编写词法分析器的大量文档？ [关闭] 的相关文章

用户警告：MovieWriter ffmpeg 不可用

尝试在 google colab 上制作动画收到此警告用户警告 MovieWriter ffmpeg 不可用 warnings warn MovieWriter s 不可用 writer did pip 安装 ffmpeg 标准化但没有
如何在 Python 中使这个随机文本生成器更加高效？

我正在研究一个随机文本生成器不使用马尔可夫链目前它的工作没有太多问题首先这是我的代码流程输入一个句子作为输入这称为触发字符串被分配给一个变量获取触发字符串中最长的单词在所有古腾堡计划数据库中搜索包含该单词的句子无论大写还
Django - 未找到“”的反向。 '' 不是有效的视图函数或模式名称

我正在研究我的课程项目但现在我完全陷入困境我正在创建一个网站通过 PayPal 销售产品但 PayPal 退货取消页面未正确呈现我已经按照课程中的示例检查了代码一百次但显然我遗漏了一些东西当我转到产品单击立即购买登录 P
将 Django Model 对象转换为 dict，所有字段都完好无损

如何将 django Model 对象转换为 dictall它的领域理想情况下所有内容都包含外键和 editable False 的字段让我详细说明一下假设我有一个如下所示的 django 模型 from django db imp
使用 pycharm 进行交互式 shell 调试

我是 PyCharm 新手我已经使用 IDLE 很长时间了在IDLE中执行脚本后使用Python对象非常方便有没有办法在使用 PyCharm 与交互式 python shell 执行后使用脚本对象例如我们有一个测试项目其中包
使用组合时如何解决循环依赖？

我遇到了如下所示的情况其中每个类都需要另一个类并且它创建了循环依赖关系我在使用 ctypes 包装一些 C 代码时遇到了这种情况已经有很多关于这个主题的帖子但我发现它们没有帮助我需要一些例子 Module A from B im
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
为什么 takewhile() 会跳过第一行？

我有一个这样的文件 1 2 3 TAB 1 2 3 TAB 我想将 TAB 之间的行作为块读取 import itertools def block generator file with open file as lines for li
调整pandas read_sql_query NULL值处理？

当我做 from sqlalchemy import create engine import pandas as pd engine create engine sqlite conn engine connect conn execut
lxml/python 使用 CDATA 部分读取 xml

在我的 xml 中我有一个CDATA部分我想保留 CDATA 部分然后剥离它有人可以帮忙解决以下问题吗默认不起作用 from io import StringIO from lxml import etree xml
使用 isdigit 表示浮点数？

a raw input How much is 1 share in that company while not a isdigit print You need to write a number n a raw input How m
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
与 GridSearchCV 的并行错误，与其他方法一起工作正常

我使用 GridSearchCV 时遇到以下问题它在使用时给我一个并行错误n jobs gt 1 同时n jobs gt 1与 RadonmForestClassifier 等单一模型配合良好下面是一个显示错误的简单工作示例 train
CTRL-C 在 Python 中的行为有所不同

I ve recently started learning Python long time Java programmer here and currently in the process of writing some simple
如何处理 ValueError：索引包含使用 df.pivot 或 pd.pivot_table 的重复条目？

我有一张显示累计小时数的表格 dataframe values 不同的专家 ID 已完成一系列四项任务 Task1 Tas2 Task3 Tas4 像这样 Input ID Task1 Task2 Task3 Task4 0 10 1 3
数据框更新后如何刷新绘图？

假设您已经使用以下方法构建了一个图形px line 使用数据框数据框稍后会添加新数据用新数据刷新数据的好方法是什么一个例子可以是px data stocks 从列的子集开始 GOOG AAPL AMZN FB NFLX MSFT 例如
适用于 Python 的 GitLab CI 共享 Windows 运行器

我在 GitLab 中有一个 python 项目仓库我看到 GitLab 共享了可用的测试版 Windows 运行程序请参阅this https about gitlab com blog 2020 01 21 windows shar
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
在 Jupyter 笔记本中使用 PySpark 读取 XML

我正在尝试读取 XML 文件 df spark read format com databricks spark xml load path to my xml 并收到以下错误 java lang ClassNotFoundExceptio
加入语音频道（discord.py）

当我尝试让我的机器人加入我的语音频道时出现以下错误 await client join voice channel voice channel 产生错误的行 Traceback most recent call last File usr

随机推荐

如何检查复选框是否被选中？

我正在使用 jQuery Mobile 构建一个移动 Web 应用程序我想检查是否选中了复选框这是我的代码
如何实现 @property(class, readonly, copy, nonatomic) NSArray * _Nullable ReadTypeIdentifiersForItemProvider;

尝试实现NSItemProviderReading协议在 Objective C 中你如何满足 property class readonly copy nonatomic NSArray
AWS Cognito 和 CORS 安全问题

我有一个 Web 客户端通过 AWS API Gateway 向 AWS Lambda 发出请求我使用 AWS Cognito 和 Auth0 来对用户进行身份验证我的问题与来自 AWS API Gateway 端点的 CORS 响应标
如何在没有 FileReader 的情况下从 Blob 和 File 对象创建 ArrayBuffer 和数据 URI？

这个问题与以下相关并受到启发如何在旧浏览器例如 Safari 5 1 4 中上传 https stackoverflow com questions 38193605 how to updoad in old browsers ex sa
在模板文字中定义函数

我在用着样式组件 https github com styled components styled components作为 React 样式的解决方案他们有一个很好的方法使用模板文字来插入 CSS 模板文字会传递组件的 props
单击电子邮件地址时设置默认主题

我正在使用 dataDetectorTypes 属性与 UITextView code 工作正常当我单击链接时电子邮件编辑器会显示预填充的收件人电子邮件地址但我也想设置默认主题主题字符串我怎样才能做到这一点 1 拳头添加
使用 RestApi 选择资源下载文件的最佳方法是什么？

我需要下载一个文件但是我想知道哪种方法是发布我的资源的最佳方法假设我有一个文档 http api documents id 我在哪里发出 GET 请求是否应该接收具有该 id 的文档信息包括一个额外字段其中包含 BASE64 中文
连接到远程 JMX 代理时出错！启动 Nodetool 时

我正在尝试使用nodetool对照我们的 Cassandra 生产数据库但是当我尝试从本地计算机针对 Cassandra 生产集群启动 nodetool 时我就会遇到异常 S Apache Cassandra apache cassa
使用 Gtk3 和 cairo 绘制自定义 GdkPixbuf

我想使用 Python 和 GTK3 在 Gtk TreeView 的单元格中绘制自定义形状我发现cairo应用于此目的但找不到任何方法来创建合适的Pixbuf目的我可以轻松地从磁盘加载文件但我没有办法利用它这似乎是一项常见且简单
Joda-Time 中的自由日期/时间解析

是否可以创建一个DateTimeParser这将解析给定时间的日期没有时间的日期假设时间是一天的开始没有日期的时间假设日期是今天或者我是否需要三个单独的解析器并尝试用每个解析器解析字符串换句话说是否可以在解析器中定义可选字
在带有 R 闪亮的 selectizeInput 中使用 html

我想在 select ize Input 的选择中使用一些 html 有谁知道一个简单的解决方案如何告诉shiny将选项视为HTML library shiny ui lt fluidPage selectInput test html u
用于映射 5 到 7 张卡的组合的哈希函数

参考原问题优化扑克蒙特卡洛模拟的手牌评估算法 https stackoverflow com questions 22412698 optimizing hand evaluation algorithm for poker monte
安卓本地搜索

我正在尝试在我的活动中实现本地搜索我已经向清单文件添加了适当的意图过滤器和元数据标记但如果我单击搜索按钮它会调用标准 Android 搜索框我的问题是什么清单文件
我可以安全地将一个分支重新设置为另一个分支，然后掌握吗？

我必须开发分支我找到了分支B取决于分支的代码A 我想重新建立基础A into B这样我就可以继续发展B Soon A将被合并到master 前B 但是不是现在然后当我合并时B 它会破坏引用吗A重新基于它我可以重新调整基础吗B on
如何将类型类模式与子类型结合起来？

假设我在 Scala 中使用类型类模式这是我如何制作 C 类类型类 Foo 的一部分 Welcome to Scala version 2 9 0 1 Java HotSpot TM 64 Bit Server VM Java 1 6
getter和setter方法有什么用？ [复制]

这个问题在这里已经有答案了可能的重复为什么要使用 getter 和 setter https stackoverflow com questions 1568091 why use getters and setters 谁能告诉我 g
为什么“transform-es2015-modules-commonjs”在 Babel 6 中添加“use strict”？

使用 Babel 6 我正在尝试not具有 use strict 在我编译的代码中我发现这是 transform es2015 modules commonjs 插件 http babeljs io docs plugins transf
android共享首选项设置值

我有偏好设置页面它有显示信息屏幕字段作为复选框我还有信息页面其中也应该有再次显示复选框据我了解我可以通过以下方式从偏好页面获取价值PreferencesManager getDefaultPreferences cont
如何使用 aria2 保持目录结构？

我需要同时下载文件 wget 不支持所以我想尝试 aria2 但我在 aria2 中没有看到保留目录结构的选项首先确定目录结构然后构建并使用下载描述文件 aria2c i uri txt where uri txt可能包含 http
关于如何为 Pygments 编写词法分析器的大量文档？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一本字典Stata http stata com 关键字和 Stata 语法的合理知识我想花几个

关于如何为 Pygments 编写词法分析器的大量文档？ [关闭]

关于如何为 Pygments 编写词法分析器的大量文档？ [关闭] 的相关文章

随机推荐

热门标签