标记和词位有什么区别？

2023-12-26

在 Aho Ullman 和 Sethi 的《Compiler Construction》一书中，给出了源程序的输入字符串被分成具有逻辑含义的字符序列，称为标记，而词位是组成标记的序列，所以什么是基本的区别吗？

Using "编译器原理、技术和工具，第二版。 http://www.pearsonhighered.com/educator/product/Compilers-Principles-Techniques-and-Tools/9780321486813.page" （世界猫） https://www.worldcat.org/title/804295189作者：Aho、Lam、Sethi 和 Ullman，又名紫龙书 http://en.wikipedia.org/wiki/Compilers:_Principles,_Techniques,_and_Tools#Second_edition,

莱克梅页。 111

词位是源程序中的字符序列，匹配标记的模式并由词法标识分析器作为该令牌的实例。

令牌页。 111

令牌是由令牌名称和可选属性组成的对价值。代币名称是一个抽象符号，代表一种词汇单元，例如特定的关键字或输入序列表示标识符的字符。令牌名称是输入解析器处理的符号。

图案页。 111

模式是对标记的词位可能的形式的描述拿。在关键字作为标记的情况下，模式只是构成关键字的字符序列。对于标识符和一些其他标记，模式是更复杂的结构，匹配许多字符串。

图 3.2：代币示例第 112 页

[Token]       [Informal Description]                  [Sample Lexemes]
if            characters i, f                         if
else          characters e, l, s, e                   else
comparison    < or > or <= or >= or == or !=          <=, !=
id            letter followed by letters and digits   pi, score, D2
number        any numeric constant                    3.14159, 0, 6.02e23
literal       anything but ", surrounded by "'s       "core dumped"

为了更好地理解与词法分析器和解析器的关系，我们将从解析器开始，然后逆向分析输入。

为了更容易地设计解析器，解析器不直接处理输入，而是接受词法分析器生成的标记列表。查看图 3.2 中的标记列，我们会看到以下标记if, else, comparison, id, number and literal;这些是令牌的名称。通常，对于词法分析器/解析器来说，标记是一种结构，它不仅保存标记的名称，还保存组成标记的字符/符号以及组成标记的字符串的开始和结束位置，其中用于错误报告、突出显示等的开始和结束位置。

现在词法分析器接受字符/符号的输入，并使用词法分析器的规则将输入字符/符号转换为标记。现在，使用词法分析器/解析器的人们对他们经常使用的东西有自己的说法。您所认为的构成标记的字符/符号序列就是使用词法分析器/解析器的人所说的词法。因此，当您看到词位时，只需考虑代表标记的字符/符号序列。在比较示例中，字符/符号的序列可以是不同的模式，例如< or > or else or 3.14, etc.

考虑两者之间关系的另一种方式是，标记是解析器使用的编程结构，它具有称为词素的属性，用于保存输入中的字符/符号。现在，如果您查看代码中标记的大多数定义，您可能不会将词素视为标记的属性之一。这是因为令牌更有可能保存表示令牌和词位的字符/符号的开始和结束位置，可以根据需要从开始和结束位置导出字符/符号序列，因为输入是静态的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

标记和词位有什么区别？的相关文章

使用 SSD 加快编译时间

我想尝试加快 C 项目的编译时间他们有大约 300 万行代码当然我不需要总是编译每个项目但有时有很多源文件被其他人修改过我需要重新编译所有这些文件例如当有人更新一个项目时 ASN 1 https en wikipedia or
并行运行 make 时出错

考虑以下制作 all a b a echo a exit 1 b echo b start sleep 1 echo b end 当运行它时make j2我收到以下输出 echo a echo b start a exit 1 b star
使用 Java 文件中的代码编译 Java 文件

我目前正在创建一个个人也许是公共 java 终端我想创建一个在执行时创建编译 Java 文件的命令但我不太确定如何实际执行此操作是否可以或者我只是在做梦你也可以使用Groovy http groovy codehaus org
有人可以告诉我计算机编程如何工作的基础知识吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是什么让编程语言的所有单词实际上都有作用我的意思是到底发生了什么让计算机知道所有这些词的含义如果我口头告诉我的计算机做某事它不
无法在 Windows 上使用 Gnustep 编译 Objective C

嗨我是初学者学习目标c 我发现错误 hello m 1 34 Foundation Foundation h 没有这样的文件或目录我开始知道我需要制作一个 make 文件我可以知道如何制作 make 文件吗无需创建 makefil
如何使用pyinstaller？

好吧我是一个完全的编程菜鸟我正在尝试编译一个我编写的简单程序该程序接受一个字符串并以莫尔斯电码打印该字符串它被称为 morse py 我使用安装 pyinstaller pip install pyinstaller 我正在尝试使用
用于推送通知的设备令牌

我正在实施推送通知服务我需要创建一个数据库来存储 4 个移动平台的所有设备令牌我想根据他们的平台 iOS Android BlackBerry WP7 来组织它们但是有什么方法可以区分平台这样如果我只想向 Android 用户发送消
如何将 CodeBlocks 与最新版本的 VC++ 编译器一起使用？

我需要将 C B 与最新版本的 MS VC 编译器例如 VS2015 或 VS2017 中的编译器以及最终的未来版本一起使用但 C B 不提供此类选项 C B 允许用户从设置中的列表中选择的最新 VC 版本是 VC 2010 MSVC
为什么需要数字后缀？

C 语言我确信还有其他语言需要在数字文字末尾添加后缀这些后缀指示文字的类型例如 5m是一个小数 5f是一个浮点数我的问题是这些后缀真的有必要吗或者是否可以从上下文中推断出文字的类型例如代码decimal d 5 0应该推断
C# 编译器数字文字

有谁知道 C 编译器数字文字修饰符的完整列表默认情况下声明 0 使其成为 Int32 声明 0 0 使其成为 Double 我可以在末尾使用文字修饰符 f 来确保某些内容被视为 Single 例如像这样 var x 0 x is Int
Raspberry 交叉编译 - 执行程序以“分段错误”结束

我有一个自己编写的程序我想从我的 x86 机器上为 Raspberry Pi 构建它我正在使用 eclipse 生成的 makefile 并且无法更改此内容我已经阅读了 CC for raspi 的教程 Hackaday 链接 htt
编译器琐事：这段代码的结果是什么

我今天正在审查一些代码并遇到了一些代码此片段准确地描述了 public abstract class FlargBase public FlargBase this DoSomething public abstract void Do
Qt 编译器标志顺序

我的目标是消除某些类型的编译器警告我发现可以通过在 pro 文件中添加编译器标志来做到这一点 QMAKE CXXFLAGS Wno unused variable Wno reorder 问题是它们被添加在 Qt 构建系统生成的标志之前
找出 Maven 使用的编译器

您知道我如何找到 Maven 使用哪些 JDK 来编译我的项目吗 mvn version会吐出maven的版本和它正在使用的jdk
如何在我的应用程序中取消授权/撤销 LinkedIn 令牌

我有一个 grails 应用程序我希望用户授予我访问他她的 LinkedIn 帐户的权限以获取信息并以不同的方式显示信息我能够执行以下操作获取授权码使用该授权码获取访问令牌我将该访问令牌与到期日期一起存储在我的用户实体中当过
Swift 客户端和根 SSL 证书身份验证

积分得到token api of QLIK server with ssl证书但执行任务后我收到这样的错误完成时出现错误代码 999 Your hostname and endpoint let hostname YOUR HOST
使用 jar 依赖项构建 Android 库项目

我已经被一个问题困扰了几天但我不知道如何解决这个问题我正在处理一个 Android 库项目该项目正在使用 android sdk 提供的 Android 工具进行编译在项目内部我遵循 Android 项目的标准结构我的 jar
如何在Windows 7上运行Ruby程序？

有谁知道如何在 Windows 7 上运行编译 Ruby 程序例如你可以在 Eclipse 中编译 Java 但我似乎找不到 Ruby 的编译器 http rubyinstaller org http rubyinstaller or
什么是 C 语言的高效工作流程？ - Makefile + bash脚本

我正在开发我的第一个项目该项目将跨越多个 C 文件对于我的前几个练习程序我只是在中编写了我的代码main c并使用编译gcc main c o main 当我学习时这对我有用现在我正在独自开展一个更大的项目我想继续自己进行编译
Clang 工具 (libtooling)：将标头搜索路径设置为标准库标头。基础框架

相关链接http kevinaboos wordpress com 2013 07 23 clang tutorial part ii libtooling example http kevinaboos wordpress com 201

随机推荐

OpenCV背景减法学习率不能改变

我希望训练一个 50 帧的背景区域并使用这个预训练的模型进行背景减除模型在训练后停止更新这是我的代码 import cv2 print This program is for background subtraction with p
每五个单词后分割字符串

我想每五个单词后分割一个字符串 Example 这里有一些东西要输入这是示例文本 Output There is something to type here This is an example text 如何使用preg split
Cordova android 仿真 - 错误：无法读取 null 的属性“semver”

尝试使用 cordova 模拟 Android 应用程序但收到此错误消息构建了以下 apk Users jnj cordova hello platforms android build outputs apk android debu
MYSQL 5.7 中的原生 JSON 支持：MYSQL 中 JSON 数据类型的优点和缺点是什么？

MySQL 5 7 中用于存储的新数据类型MySQL 中的 JSON 数据 http dev mysql com doc refman 5 7 en json html表已添加显然这对MySQL来说是一个巨大的改变他们列出了一些好处
为什么“ionic cordova build”只生成未签名的APK？

我使用以下命令来生成签名的 APK 我很确定这在几个月前有效 ionic cordova build android prod release keystore my keystore file keystore storePassword
ITMS-90809：已弃用的 API 使用 - 不再接受使用 UIWebView 的现有应用程序

ITMS 90809 已弃用的 API 使用自 2020 年 4 月 30 日起 Apple 将不再接受提交使用 UIWebView 的新应用程序以及自 2020 年 12 月起使用 UIWebView 的应用程序更新相反请使用 W
旋转/平移和恢复后获取画布上的位置

好吧事情变得复杂了给定情况我有一个尺寸为 800x600 的画布我的鼠标位于画布位置 100x200 例如我保存我的画布状态现在我旋转并平移画布绘制一个正方形我恢复画布状态有什么方法可以确定我的鼠标是否位于方块上我想我也
使 GCC 和其他 C++ 编译器变得非常严格

我正在开发一个大型协作 C 项目该项目在各种版本的 Linux OS X 和 Windows 上开发和运行我们使用 GCC Visual Studio C 和 Intel C 编译器跨这些平台进行编译随着越来越多的人开始为该项目开发代
覆盖 .ToString()

我想重写 ToString 函数以便每当我得到一个 double 它只输出小数点后 5 位数字如何在覆盖函数内引用 ToString 正在处理的对象换句话说我用什么 shell 来代替下面代码中的 XXX public overri
父类中的功能需要检测子类属性的更改

我试图找到一种方法让这个父持久类添加功能以便每当子对象的任何属性发生更改时更改属性都会变为 true class Persistent bool changed false Persistent print Something s
CLLocationManager protectedRegions (NSSet) 不正确，或者可能是其他什么？

我想在每次用户从商店数组中传递一个商店时进行检查我有超过 20 个商店因此我编写了一个函数来查找离用户位置最近的 20 个商店并监视它们名单更新中locationManager didUpdateLocations 我还将旧的 20
使用 FFT 从声音输入计算频率

我的应用程序正在显示输入声音的峰值频率以 RPM 为单位我有双精度数组其中包含时域中的样本 audioRecord read buffer 0 1024 然后我对其进行了FFT transformer ft toTransform
如何在Python中遍历二维列表

我有以下清单 grid 2 6 8 6 9 2 5 5 5 0 1 3 8 8 7 3 2 0 6 9 2 1 4 5 8 5 6 7 4 7 我使用 fowling 循环来遍历每个元素 gt for i in xrange len gri
GetSystemInfo 是否为您提供虚拟 CPU（即超线程）的总数？

GetSystemInfo 将为您提供物理 CPU 核心的数量但我想知道虚拟 CPU 的总数 IE 在新的 Nahelam 芯片上它们有 4 个核心但显示为 8 个 cpu 如果 GetSystemInfo 没有提供此信息我需要什么
如何使用 Storage Laravel 上传多个文件？

现在我用一个简单的方法来上传图片 if request gt hasFile images file request gt file images Do uploading to Storage uploaded Storage put d
如何在64位机器上不使用shell执行的情况下在C#中启动32位进程？

我在 64 位计算机上有一个 ASP NET Web 应用程序需要运行旧版 32 位报告应用程序当我运行程序时UseShellExecute false 程序退出并退出代码 1073741502 我无法使用 Shell 执行因为我必须
Keras 中具有多个输入/输出的 tf.data

对于应用来说比如配对文本相似度输入数据类似于 pair 1 pair 2 在这些问题中我们通常有多个输入数据之前我成功地实现了我的模型 model fit pair 1 pair 2 labels epochs 50 我决定用以下
在 Qt 中扩展环境变量（getenv 等效）

我正在寻找相当于getenv http www cplusplus com reference cstdlib getenv 功能 Qt 有一个包装器getenv 称为qgetenv http doc qt io qt 5 qtglobal
如何将 key ctrl-left 绑定到 word-left？

我使用 tcsh 和 emacs 在 emacs 中我习惯使用 ctrl left 绑定键将我向左移动一个单词我想在我的 tcsh 终端中做同样的事情我可以按 ctrl b 但我只是不习惯从bindkey manpath中我不清楚如
标记和词位有什么区别？

在 Aho Ullman 和 Sethi 的 Compiler Construction 一书中给出了源程序的输入字符串被分成具有逻辑含义的字符序列称为标记而词位是组成标记的序列所以什么是基本的区别吗 Using 编译器原理技术和

标记和词位有什么区别？

标记和词位有什么区别？ 的相关文章

随机推荐

热门标签

标记和词位有什么区别？的相关文章