词法分析器的工作就是解析数字和字符串吗？

2024-01-07

解析数字和字符串是词法分析器的工作吗？

这可能听起来很愚蠢，也可能不愚蠢，因为我问的是lexer should parse输入。但是，我不确定这实际上是词法分析器的工作还是解析器的工作，因为为了正确地进行词法分析，词法分析器需要首先解析字符串/数字，因此如果解析器执行此操作，代码似乎会重复。

这确实是词法分析器的工作吗？或者词法分析器应该简单地分解一个字符串，比如123.456进入弦乐123, ., 456然后让解析器找出剩下的部分？对于字符串来说，这样做不会那么简单......

简单的答案是“是”。

简而言之，您根本不需要词法分析器。您可以简单地编写一个使用单个字符作为标记的语法（事实上，这正是 SGLR 解析器所做的，但这是另一天的故事）。

您需要词法分析器，因为使用字符作为原始元素构建的解析器不如将输入流分解为“标记”的解析器那么高效，其中标记是您正在解析的语言的原始元素（空格、关键字、标识符、数字、运算符）、字符串、注释……）。 [如果您不关心效率，您可以跳过本答案的其余部分并阅读有关 SGLR 解析器的内容]。

好的词法分析器通常采用表示语言元素的正则表达式集，并将它们编译成高效的有限状态机，该状态机可以快速将输入流分段为此类语言元素。（如果您不想使用词法分析器生成器，对于简单语言，您可以自己编写 FSA 代码）。这样编译的 FSA 对于每个输入字符仅执行几十条机器指令（从输入缓冲区获取字符，将字符切换到新状态，确定令牌是否完整，如果不完整则再次执行），因此速度非常快。

此类词法分析器的输出通常是表示 langauge 元素的代码（或者如果解析器无论如何都会忽略空格，则没有空格）和一些位置信息（从文件 foo 第 17 行第 3 列开始）以启用错误报告。

人们可以到此为止并拥有有用的词法分析器。执行转换步骤通常很有用，将字符串转换为该令牌的等效本机值，无论是在收集字符时还是在令牌完成时，因为人们仍然了解其中涉及的特定字符。令牌。这用于将目标语言中的数字（不同基数）转换为其本机二进制等效项，将包含转义序列的文字字符串转换为构成字符串的实际字符，甚至获取标识符名称并在哈希表中查找它们以便轻松确定相同的标识符。解析器通常对这些转换后的值不感兴趣，但解析之外的步骤（语义分析、检查优化、代码生成）无论如何都需要转换后的值，因此您最好在发现它们时对其进行转换。（您可以延迟此转换，直到需要它们的二进制值为止，但实际上您几乎总是需要该值，因此延迟转换并没有多大意义）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

词法分析器的工作就是解析数字和字符串吗？的相关文章

iOS 解析如何通过 URL 下载文件

我正在将 parse 用于我的聊天应用程序当我上传文件时我保留该 url 并将该 url 发送给其他用户然后其他用户可以通过该 URL 下载文件这是我上传文件的代码 void uploadBlob NSData blob fileN
python 3 argparse 调用函数

我想在 python3 中创建一个类似命令行类似 shell 的界面 Argparse 似乎负责解析和显示帮助错误消息根据argparse 的 python3 文档 https docs python org 3 5 library
用于（联合国）结构化文本文档的词法分析器/解析器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有很多脚本解析器和词法分析器即结构化计算机语言但我正在寻找一个可以将几乎非结构化文本文档分成更
使用多个可选模式时顺序的重要性

可选模式的顺序如何DateTimeFormatter影响解析操作吗我正在运行这个程序想知道为什么最后一行抛出异常而不是前三行 public static void main String args String p1 EEEE E dd
在 JAVA 中使用 SAX 解析器从 XML 文件中提取文本节点

因此我目前正在使用 SAX 尝试从我正在处理的大量 xml 文档中提取一些信息到目前为止提取属性值确实很容易但是我不知道如何从文本节点中提取实际值例如在给定的 XML 文档中
Rust 编程竞赛中最快的惯用 I/O 例程？

我的问题已部分得到解答因此我根据从评论和其他实验中学到的知识对其进行了修改总之我想要一个用于编程竞赛的快速 I O 例程其中使用单个文件解决问题无需外部包它应该从一个以空格分隔的标记序列中读取BufRead 标准输入或文件标记
C 的二进制流解析库 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案您能推荐一个经过验证的 C 二进制流解析库吗如果它能像 C 语言所允许的那样具有声明性那就太好了
Python 中使用 Pygments 的分词器

想要在 Python 中为源文件例如 Java 或 C 创建标记器遇到了Pygments http pygments org 特别是这些lexers http pygments org docs lexers lexers for c
_实际_ Twitter 主题标签格式？不是你的正则表达式，也不是他的代码——真正的代码？

更新如果可以的话请使用 Twitter 的实体他们为您以及其他项目找到了解决方案我的情况是我只有没有实体的推文和所有额外的元数据我花了我认为不合理的时间试图找到actual主题标签的格式据我搜索得知 Twitter 尚未发布任
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
在Python中解析.xsd

我需要在 Python 中解析文件 xsd 就像解析 XML 一样我正在使用 libxml2 我必须解析如下所示的 xsd
用 C/C++ 编写的通用代码补全框架

有没有用 C C C 11 编写的框架用于编写代码补全工具或者也许有一些库允许 Java 或 C 的代码完成也是用 C 编写的我正在用 C 编写我的自定义 IDE 用于 Java 而不仅仅是 Java 开发我想以最好的方式为其添加代
使用 python 将 bibtex 文件转换为 html （也许是 pybtex？）

您好我想解析 bibtex 出版物文件并对特定字段例如年份进行排序并过滤某些内容然后将其放在网站上我遇到了 pybtex 它可以读取和解析 bibtex 文件但它基本上没有记录我不知道如何对条目进行排序 pybtex 是可行的
在Python中比较字符串的最快方法

我正在用 Python 编写一个脚本该脚本将允许用户输入一个字符串该字符串将是指示脚本执行特定操作的命令为了便于讨论我会说我的命令列表是 lock read write request log 现在我希望用户能够输入 log 一词
我可以使用 javascript 生成 JSON 文件吗？

我想在域 example1 com 上创建一个页面并获取解析另一个域 example2 com json json 上的 JSON 文件可以使用 javascript 生成 json 文件在 example2 com 上吗我认为
使用 OpenNLP 获取句子的解析树。陷入困境。

OpenNLP 是一个关于自然语言处理的 Apache 项目 NLP 程序的目标之一是解析一个句子并给出其语法结构的树例如天空是蓝色的这句话可能会被解析为 S NP VP The sky is blue where S是句子 NP
Java 语言有 Java 解析器吗？

我正在寻找一个 java 库它允许我解析 java 源文件并为我提供代码的 AST 表示实际上我只对类和方法定义及其注释感兴趣我不需要方法代码的 AST 我正在使用这些信息来生成代码这就是为什么我无法先编译源文件以从生成的类文件中
如何从 CSS 选择器中提取类名？

故事我目前正在构建一个 ESLint 规则以警告在 CSS 选择器定位器中使用引导布局导向和角度技术类目前我在字符串方法中使用简单的子字符串 for var i 0 i lt prohibitedClasses length i if
Objective-C 头解析

我需要解析一些 Objective C 标头我尝试过使用Doxygen并解析 XML 输出但它不完全支持没有注释的 Objective C 标头它会阻塞属性中定义的宏请检查Doxygen 无法正确识别属性 https stackov
Rebol / Red Parse html规则返回true但没有插入任何内容

我有一个返回 true 的解析规则但它没有按预期插入我的文本 html 未更改而它应该插入到主结束 div 的末尾我尝试使用类似的计数器如何使用 REBOL 解析 HTML 标签内部 https stackoverflow com q

随机推荐

将yarn.lock同步回package.json并锁定

I have package json and yarn lock文件 yarn lock 已锁定版本我想同步并锁定没有将yarn lock 中的所有版本放回到package json 中有什么简单的方法可以做到这一点吗最后我不
IIS 301 重定向

当我使用 Apache 时我使用 htaccess 将自定义路径重定向到某个页面但我的新网站托管在 Windows 服务器上我找不到任何有关为新页面已删除的旧页面设置重定向的帮助例子当人们来访时 domain ValveMonit
如何找到trie中最长的单词？

I m having trouble understanding the concept of a trie From the trie wikipedia entry I have this picture 如果我正确地看到这一点 tri
为什么“filter: invert(1)hue-rotate(180deg)”会将红色变成桃粉色？

在CSS中当你应用滤镜反转 1 色调旋转 180deg 对于图像来说红色变成桃红色为什么会这样如何使用 CSS 反转图像并且仍然使红色看起来像红色 Example 相同的图像与filter invert 1 hue rotate
随着“CarrierWave::MimeTypes”的弃用，上传者应如何处理/覆盖通用内容类型？

Problem CarrierWave MimeTypes 其中添加了set content type上传者的方法已被弃用除其他事项外这个方法 https github com carrierwaveuploader carrierwa
使用 System.out.print 与 println 的多线程问题

我有以下线程它每 200 毫秒打印一个点 public class Progress private static boolean threadCanRun true private static Thread progressThrea
响应没有任何可以通过主题验证的有效断言

我对 SAML 和 ADFS 完全陌生我尝试用谷歌搜索我的错误但遗憾的是没有得到任何结果我一直在尝试设置 Spring SAML 和 ADFS 以便我可以通过以下方式进行单点登录工作本指南 http docs spring io au
使用 fpdf 从数组输出项目符号列表

我一直在寻找一种方法来向我的 pdf 输出文件添加项目符号或列表编号假设我有来自数据库的三行文本 Line 1 Line 2 Line 3 我想要的是 fpdf 读取每一行并在每一行前面放置一个项目符号因此输出将如下所示 Line 1
如何将 Terraform 对象放入 AWS Lambda 环境

Lambda 函数支持environment参数并可以轻松定义键值对但是如何将一个对象例如由模块变量定义放入函数的环境中呢我想在 python 3 7 中完成的快速示例地形 variable definition variable
无法使用 Testcafe 拦截来自页面的传出 AJAX 请求

我正在尝试将 TestCafe 用于客户端 javascript 库但无法通过计数机制捕获测试页面加载的任何传出 AJAX 请求我的尝试包括使用RequestLogger https devexpress github io testc
可排序列表 + 通过输入排名 # 重新排序每个项目的能力

我已经搜索并搜索了如何执行此操作但无济于事基本上我有一个非常标准的 jQuery 可排序列表使用夹具允许用户重新排列列表我想添加的是每个列表项的输入框自动填充该项目的允许用户输入任何数字只要它请参阅 YouTube 播放列表
如何在 C++/Linux 中执行外部命令？

我只想知道在 C 中执行外部命令的最佳方式是什么以及如何获取输出如果有 Edit 我想我必须告诉大家我是这个世界的新手所以我想我需要一个可行的例子例如我想执行如下命令 ls la 我怎么做 Use the popen http op
Excel 数据验证下拉列表中的空白值

我不知道从单元格 A1 到 A65555 会出现多少个值我有 B1 它是根据 A 列设置数据验证的如下所示 A1 A65555 A 列中最多存在 10 行值从A1到A10 但是当我单击 B1 时它显示空值以及 A1 到 A10 我希
Python 中日期之间的平均差异

我有一系列日期时间对象想计算它们之间的平均增量例如如果输入是 2008 10 01 12 15 00 2008 10 01 12 25 00 2008 10 01 12 35 00 那么平均增量将恰好为 00 10 00 即 10 分
如何在 UI 测试 Espresso android 中超越位置启用器对话？

我正在使用 Espresso 进行 Android UI 测试我想在设置中关闭位置的情况下运行测试但由于其他测试失败我陷入了位置启用器对话框我已经提到了我的观察和迄今为止我所尝试的使用 UiAutomator 它仅适用于单个测试用
我可以从 iOS DeviceSupport 目录中删除数据吗？

在用我不再需要的旧东西清理并清理磁盘后我遇到了iOS DeviceSupport文件夹中 Library Developer Xcode这占用了近 20 GB 的空间类似的问题之前已被问过 https stackoverflow com
功能应用程序的 Azure 应用服务计划之间的差异：Elastic Premium EP1 和 Premium V2 P1v2

我有 15 个功能应用程序需要部署来执行给定的应用程序服务计划但是我找不到哪个更适合此目的 Elastic Premium EP1 或 Premium V2 P1v2 对于每个函数我希望始终有 2 个预热实例以避免常规数量的请求出现冷
检查列表或集合的元素是否为单一类型的简单方法？

我需要编写一段代码如果所有元素都是 int 或都是 string 则返回 true 否则返回 false 1 1 a b False 1 2 3 4 True apple orange melon True 1 2 3 4 False 我
WixUI_InstallDir 和 ARPNOREPAIR / ARPNOMODIFY 属性

我想删除修复修改按钮添加或删除程序我也想用WixUI 安装目录对话框集这是我的代码
词法分析器的工作就是解析数字和字符串吗？

解析数字和字符串是词法分析器的工作吗这可能听起来很愚蠢也可能不愚蠢因为我问的是lexer should parse输入但是我不确定这实际上是词法分析器的工作还是解析器的工作因为为了正确地进行词法分析词法分析器需要首先解析字符串

词法分析器的工作就是解析数字和字符串吗？

词法分析器的工作就是解析数字和字符串吗？ 的相关文章

随机推荐

热门标签

词法分析器的工作就是解析数字和字符串吗？的相关文章