MySQL深度探险(二)-- MySQL系统架构详解

2023-10-30

一 逻辑模块组成

        总的来说,MySQL 可以看成是二层架构,第一层我们通常叫做SQL Layer,在 MySQL 数 据库系统处理底层数据之前的所有工作都是在这一层完成的,包括权限判断,sql 解析,执 行计划优化, query cache 的处理等等;第二层就是存储引擎层,我们通常叫做 Storage Engine Layer,也就是底层数据存取操作实现部分,由多种存储引擎共同组成。所以,以可 用如下一张最简单的架构示意图来表示 MySQL 的基本架构,如图所示:

 

虽然从上图看起来 MySQL 架构非常的简单, 就是简单的两部分而已, 但实际上每一层中都含有各自的很多小模块,尤其是第一层SQL Layer,结构相当复杂的。下面我们就分别针对 SQL Layer 和 Storage Engine Layer 做一个简单的分析。

SQL Layer 中包含了多个子模块,下面我将逐个做一下简单的介绍:
1、初始化模块
顾名思议,初始化模块就是在MySQL Server启动的时候,对整个系统做各种各样的初

始化操作, 比如各种buffer,cache 结构的初始化和内存空间的申请, 各种系统变量的初始 化设定,各种存储引擎的初始化设置,等等。

2、核心 API

核心 API 模块主要是为了提供一些需要非常高效的底层操作功能的优化实现, 包括种各 底层数据结构的实现,特殊算法的实现,字符串处理,数字处理等,小文件I/O,格式化输 出,以及最重要的内存管理部分。核心 API 模块的所有源代码都集中在 mysys 和 strings 文件夹下面,有兴趣的读者可以研究研究。

3、网络交互模块

底层网络交互模块抽象出底层网络交互所使用的接口api, 实现底层网络数据的接收与 发送,以方便其他各个模块调用,以及对这一部分的维护。所有源码都在vio 文件夹下面。

4、Client & Server 交互协议模块

任何 C/S 结构的软件系统, 都肯定会有自己独有的信息交互协议My,SQL 也不例外。 MySQL 的 Client & Server 交互协议模块部分,实现了客户端与 MySQL 交互过程中的所有协议。 当然这些协议都是建立在现有的OS和网络协议之上的,如TCP/IP以及Unix Socket。

5、用户模块

用户模块所实现的功能, 主要包括用户的登录连接权限控制和用户的授权管理。 他像就 MySQL 的大门守卫一样,决定是否给来访者“开门”。

6、访问控制模块

造访客人进门了就可以想干嘛就干嘛么?为了安全考虑, 肯定不能如此随意。 这时就候 需要访问控制模块实时监控客人的每一个动作, 给不同的客人以不同的权限。 访问控制块模 实现的功能就是根据用户模块中各用户的授权信息, 以及数据库自身特有的各种约束,控来 制用户对数据的访问。 用户模块和访问控制模块两者结合起来, 组成了MySQL 整个数据库系 统的权限安全管理的功能。

7、连接管理、连接线程和线程管理

连接管理模块负责监听对MySQL Server的各种请求,接收连接请求,转发所有连接请 求到线程管理模块。每一个连接上MySQL Server 的客户端请求都会被分配(或创建)一个 连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信, 接受客户端的命令请求,传递 Server 端的结果信息等。线程管理模块则负责管理维护这些 连接线程。包括线程的创建,线程的cache 等。

8、Query 解析和转发模块
在 MySQL 中我们习惯将所有 Client 端发送给 Server 端的命令都称为 query, 在MySQL

Server 里面,连接线程接收到客户端的一个 Query 后,会直接将该 query 传递给专门负责 将各种 Query 进行分类然后转发给各个对应的处理模块, 这个模块就是query 解析和转发模 块。 其主要工作就是将query 语句进行语义和语法的分析, 然后按照不同的操作类型进行分 类,然后做出针对性的转发。

9、Query Cache 模块

Query Cache模块在MySQL中是一个非常重要的模块,他的主要功能是将客户端提交给 MySQL 的 Select 类 query 请求的返回结果集 cache 到内存中, 与该query 的一个 hash 值做 一个对应。该Query 所取数据的基表发生任何数据的变化之后,MySQL 会自动使该 query 的 Cache 失效。在读写比例非常高的应用系统中, Query Cache 对性能的提高是非常显著的。 当然它对内存的消耗也是非常大的。

10、Query 优化器模块

Query 优化器,顾名思义,就是优化客户端请求的query,根据客户端请求的 query 语 句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略, 告诉后面的程序如何取得这个 query 语句的结果。

11、表变更管理模块

表变更管理模块主要是负责完成一些DML 和 DDL 的 query,如:update,delte,insert, create table,alter table 等语句的处理。

12、表维护模块 表的状态检查,错误修复,以及优化和分析等工作都是表维护模块需要做的事情。

13、系统状态管理模块

系统状态管理模块负责在客户端请求系统状态的时候, 将各种状态数据返回给用户像, DBA 常用的各种 show status 命令,show variables 命令等, 所得到的结果都是由这个模块 返回的。

14、表管理器

这个模块从名字上看来很容易和上面的表变更和表维护模块相混淆, 但是其功能与更变 及维护模块却完全不同。 大家知道, 每一M个ySQL 的表都有一个表的定义文件, 也就是*.frm 文件。表管理器的工作主要就是维护这些文件,以及一个cache,该 cache 中的主要内容是 各个表的结构信息。此外它还维护table 级别的锁管理。

15、日志记录模块

日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括error log,binary log,slow query log 等。

16、复制模块

复制模块又可分为 Master 模块和 Slave 模块两部分, Master 模块主要负责在 Replication 环境中读取 Master 端的 binary 日志, 以及与Slave 端的 I/O 线程交互等工作。 Slave 模块比 Master 模块所要做的事情稍多一些,在系统中主要体现在两个线程上面。一 个是负责从 Master 请求和接受 binary 日志, 并写入本地relay log 中的 I/O 线程。 另外一 个是负责从 relay log 中读取相关日志事件, 然后解析成可以在Slave 端正确执行并得到和 Master 端完全相同的结果的命令并再交给 Slave 执行的 SQL 线程。

17、存储引擎接口模块

存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品 中, 基本上只有MySQL 可以实现其底层数据存储引擎的插件式管理。 这个模块实际上只是一 个抽象类, 但正是因为它成功地将各种数据处理高度抽象化, 才成就了今天MySQL 可插拔存 储引擎的特色。

二 各模块工作配合

在了解了MySQL的各个模块之后, 我们再看看MySQL各个模块间是如何相互协同工作的。 接下来,我们通过启动 MySQL,客户端连接,请求 query,得到返回结果,最后退出,这样 一整个过程来进行分析。

当我们执行启动 MySQL 命令之后,MySQL 的初始化模块就从系统配置文件中读取系统参 数和命令行参数, 并按照参数来初始化整个系统, 如申请并分配buffer, 初始化全局变量, 以及各种结构等。 同时各个存储引擎也被启动, 并进行各自的初始化工作。 当整个系统始初 化结束后, 由连接管理模块接手。 连接管理模块会启动处理客户端连接请求的监听程序包, 括 tcp/ip 的网络监听,还有 unix 的 socket。这时候,MySQL Server 就基本启动完成,准 备好接受客户端请求了。

当连接管理模块监听到客户端的连接请求(借助网络交互模块的相关功能) ,双方通过 Client & Server 交互协议模块所定义的协议“寒暄”几句之后,连接管理模块就会将连接 请求转发给线程管理模块,去请求一个连接线程。

线程管理模块马上又会将控制交给连接线程模块, 告诉连接线程模块: 现在我这边连有连接请求过来了, 需要建立连接, 你赶快处理一下。 连接线程模块在接到连接请求后, 首会先 检查当前连接线程池中是否有被 cache 的空闲连接线程, 如果有, 就取出一个和客户端求请 连接上, 如果没有空闲的连接线程, 则建立一个新的连接线程与客户端请求连接。 当然连, 接线程模块并不是在收到连接请求后马上就会取出一个连接线程连和客户端连接, 而是先首 通过调用用户模块进行授权检查, 只有客户端请求通过了授权检查后, 他才会将客户端求请 和负责请求的连接线程连上。

在 MySQL 中,将客户端请求分为了两种类型:一种是query,需要调用 Parser 也就是 Query 解析和转发模块的解析才能够执行的请求; 一种是command, 不需要调用Parser 就可 以直接执行的请求。如果我们的初始化配置中打开了 Full Query Logging 的功能,那么 Query 解析与转发模块会调用日志记录模块将请求计入日志, 不管是一个Query 类型的请求 还是一个command类型的请求, 都会被记录进入日志, 所以出于性能考虑, 一般很F少ul打l开 Query Logging 的功能。

当客户端请求和连接线程“互换暗号(互通协议) ”接上头之后,连接线程就开始处理 客户端请求发送过来的各种命令(或者 query) ,接受相关请求。它将收到的query 语句转 给 Query 解析和转发模块,Query 解析器先对 Query 进行基本的语义和语法解析,然后根据 命令类型的不同,有些会直接处理,有些会分发给其他模块来处理。

如果是一个 Query 类型的请求, 会将控制权交给Query 解析器。Query 解析器首先分析 看是不是一个 select 类型的 query,如果是,则调用查询缓存模块,让它检查该query 在 query cache 中是否已经存在。如果有,则直接将cache 中的数据返回给连接线程模块,然 后通过与客户端的连接的线程将数据传输给客户端。如果不是一个可以被 cache 的 query 类型, 或者cache 中没有该 query 的数据, 那么query 将被继续传回 query 解析器, 让query 解析器进行相应处理,再通过 query 分发器分发给相关处理模块。

如果解析器解析结果是一条未被 cache 的 select 语句,则将控制权交给 Optimizer, 也就是 Query 优化器模块, 如果是DML 或者是 DDL 语句, 则会交给表变更管理模块, 如果是 一些更新统计信息、 检测、 修复和整理类的query 则会交给表维护模块去处理, 复制相关的 query 则转交给复制模块去进行相应的处理, 请求状态的query 则转交给了状态收集报告模 块。 实际上表变更管理模块根据所对应的处理请求的不同, 是分别i由nsert 处理器、 delete 处理器、update 处理器、create 处理器,以及 alter 处理器这些小模块来负责不同的 DML 和 DDL 的。

在各个模块收到Query解析与分发模块分发过来的请求后, 首先会通过访问控制模检块 查连接用户是否有访问目标表以及目标字段的权限, 如果有, 就会调用表管理模块请求应相 的表,并获取对应的锁。表管理模块首先会查看该表是否已经存在于table cache中,如果 已经打开则直接进行锁相关的处理, 如果没有在cache 中, 则需要再打开表文件获取锁,然 后将打开的表交给表变更管理模块。

当表变更管理模块“获取”打开的表之后,就会根据该表的相关meta 信息,判断表的 存储引擎类型和其他相关信息。 根据表的存储引擎类型, 提交请求给存储引擎接口模块调, 用对应的存储引擎实现模块,进行相应处理。

不过, 对于表变更管理模块来说, 可见的仅是存储引擎接口模块所提供的一系“列标准” 接口, 底层存储引擎实现模块的具体实现, 对于表变更管理模块来说是透明的。 他只需调要 用对应的接口, 并指明表类型, 接口模块会根据表类型调用正确的存储引擎来进行相应处的 理。

当一条 query 或者一个 command 处理完成 (成功或者失败) 之后, 控制权都会交还连给 接线程模块。如果处理成功,则将处理结果(可能是一个 Result set,也可能是成功或者 失败的标识) 通过连接线程反馈给客户端。 如果处理过程中发生错误, 也会将相应的错信误 息发送给客户端, 然后连接线程模块会进行相应的清理工作, 并继续等待后面的请求,复重 上面提到的过程,或者完成客户端断开连接的请求。

如果在上面的过程中,相关模块使数据库中的数据发生了变化,而且MySQL 打开了 bin- log 功能, 则对应的处理模块还会调用日志处理模块将相应的变更语句以更新事件的形式记 录到相关参数指定的二进制日志文件中。

在上面各个模块的处理过程中, 各自的核心运算处理功能部分都会高度依赖整个MySQL 的核心 API 模块,比如内存管理,文件 I/O,数字和字符串处理等等。

了解到整个处理过程之后,我们可以将以上各个模块画成如下图的关系图:

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MySQL深度探险(二)-- MySQL系统架构详解 的相关文章

  • 使用 cfchart 标签在单个饼图中显示多个查询的数据

    请考虑以下代码 现在我的代码中有以下代码 cfm页面内的 tag DataSource xx xx x xx Name of the database sgemail Name of the relevant column event vc
  • java中如何知道一条sql语句是否执行了?

    我想知道这个删除语句是否真的删除了一些东西 下面的代码总是执行 else 是否删除了某些内容 执行此操作的正确方法是什么 public Deleter String pname String pword try PreparedStatem
  • Mysql获取特定表的最后一个id

    我必须从特定的插入表中获取最后的插入 ID 可以说我有这个代码 INSERT INTO blahblah test1 test 2 VALUES test1 test2 INSERT INTO blahblah2 test1 test 2
  • CakePHP - 获取上次运行的查询

    我想获取 CakePHP 运行的最后一个查询 我无法在 core php 中打开调试 也无法在本地运行代码 我需要一种方法来获取最后一个 sql 查询并将其记录到错误日志中而不影响实时站点 该查询失败但正在运行 像这样的事情会很棒 this
  • 无需 cron 在后台发送邮件

    我想知道是否有一种方法可以运行 PHP 循环 以便在后台向订阅者发送几百封电子邮件 我的目标是格式化新闻通讯 单击发送 然后关闭浏览器或更改页面 当然 发送电子邮件的实际过程将在后台运行 不会因浏览器关闭而中断 我知道这可以通过 cron
  • MySQL #1093 - 您无法在 FROM 子句中指定用于更新的目标表“赠品”

    I tried UPDATE giveaways SET winner 1 WHERE ID SELECT MAX ID FROM giveaways 但它给出了 1093 您无法指定目标表 赠品 进行更新FROM clause 本文 ht
  • WHERE 条件基于 PK 的查询是否建议使用“LIMIT 1”?

    我正在查询 mySQL 数据库以检索 1 个特定行的数据 我使用表主键作为 WHERE 约束参数 E g SELECT name FROM users WHERE userid 4 userid 列是表的主键 在 mySQL 语句末尾使用
  • Laravel:使用 Faker 播种多个独特的列

    介绍 怎么样 伙计们 我有一个关于模型工厂和多个独特列的问题 背景 我有一个名为 Image 的模型 该模型将语言支持存储在单独的模型中 图片文字 图片文字 has an image id栏 语言栏和文本栏 图片文字有一个约束MySQL那个
  • MySQL 跨表计数(*) 查询帮助

    SELECT name COUNT AS count FROM t1 t2 WHERE t2 id t1 id GROUP BY t2 id 我想从 t1 获取名称以及 t2 中 id 与 t1 相同的行数 到目前为止我已经得到了上面的内容
  • 使用数据库进行日志记录

    大多数日志似乎都是纯文本形式 而不是放入 MySQL 其他类型的数据库中 这是否有原因 在我看来 将它们放入数据库将使分析变得非常非常容易 但这会以牺牲速度还是其他什么为代价 我不太关心可移植性 显然你会有数据库连接的文本日志 我能想到两大
  • IN 子查询中的 GROUP_CONCAT

    SELECT A id A title FROM table as A WHERE A active 1 AND A id IN SELECT GROUP CONCAT B id from B where user 3 如果我启动子查询SE
  • MySQL 复制是双向的

    我们已经成功设置了 MySQL 文献中描述的主从复制 不过 我很好奇是否有人设置了双向复制 例如 如果安装了 Drupal 或 Wordpress 第一个 主 数据库服务器出现故障 第二个 从属 数据库服务器恢复正常 与此同时 用户不断进行
  • Php mysql 30秒后执行任务

    如何让 mysql 查询命令在访问 php 站点 30 秒后执行 您可以对执行 mysql 查询的 php 脚本发出 AJAX 请求 在 js 中使用计时器
  • 在 MySQL 中执行触发器需要什么权限?

    我发现 MySQL 手册中对 DEFINER 的解释令人困惑 因此我不确定运行应用程序的 执行用户 需要什么权限 为了安全起见 我喜欢将 执行用户 限制为所需的最少权限 我知道触发器 存储过程的创建者需要超级权限 但是 执行用户 是否也需要
  • 如何根据同一个表中的先前数据更新 SQL 表

    我有一张衡量学生表现的表格student在我的数据库中如下 ID TestDate PerformanceStatus PS 1 15 03 2016 0 1 01 04 2016 2 1 05 05 2016 1 1 07 06 2016
  • 在shell命令行中创建mysql触发器

    我需要在命令行中创建一个mysql触发器 这个sql在mysql控制台中运行良好 sql USE DB1 DROP TRIGGER IF EXISTS my trigger DELIMITER CREATE TRIGGER my trigg
  • 拉拉维尔; “SQLSTATE[HY000] [2002] 连接被拒绝”

    我在 OSX 主机上设置了 homestead 2 0 并使用 Sequel Pro 我可以进行迁移并确认数据已在Sequel Pro中迁移 因此看起来数据库连接没有问题 但是 一旦我尝试从 Laravel 4 2 应用程序获取数据 它就无
  • 为 java 项目创建安装

    我创建了一个 java 项目 它使用数据库来检索 编辑和保存数据 我使用 Netbeans 完成了该项目 现在我想在该项目之外创建一个安装 为此 我想包含与项目一起安装的数据库 我用来连接数据库的代码是 Class forName com
  • MySQL:“您的 SQL 语法错误...靠近键...”? [关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我发现了一个非常酷的用于丢失密码的脚本 但是这一行给我带来了问题 r mysql query INSERT INTO keys u
  • 如何比较行内的重叠值?

    我似乎对这个 SQL 查询有问题 SELECT FROM appts WHERE timeStart gt timeStart AND timeEnd lt timeEnd AND dayappt boatdate 时间格式为军用时间 物流

随机推荐

  • Service的两种启动方式

    在Android开发的过程中 Service是一个非常重要的组件 它的生命周期里面有几个特别重要的方法 Service的生命周期 onCreate 当服务创建的时候调用 onStartCommand startServcie的时候会调用这个
  • RFID作业(第三次)

    1 通信系统中为什么要进行编码和解码 常见的编码方法有哪些 信源编码是指将模拟信号转换成数字信号 或将数字信号编码成更合适传输的数字信号 换句话来说 通信系统编码和解码是为了让信号更适合传输 常见的编码方法有1 反向不归零编码 2 曼彻斯特
  • ListView的复用问题,点击条目变色.不复用

    主要的是3个类 包含activity application 和一个adpter 内部的细节在代码中都有详细的注释 可以参考 application public class MyApplication extends Applicatio
  • PyQt5学习笔记16----PyQt信号和槽传递额外参数

    使用Pyqt编程过程中 经常会遇到给槽函数传递额外参数的情况 但是信号 槽机制只是指定信号如何连接到槽 信号定义的参数被传递给槽 而额外的参数 用户定义 不能直接传递 而传递额外参数又是很有用处 你可能使用一个槽处理多个组件的信号 有时要传
  • GIT实战篇,教你如何使用GIT可视化工具

    系列文章目录 手把手教你安装Git 萌新迈向专业的必备一步 GIT命令只会抄却不理解 看完原理才能事半功倍 快速上手GIT命令 现学也能登堂入室 GIT实战篇 教你如何使用GIT可视化工具 系列文章目录 一 GIT有哪些常用工具 1 Git
  • 图像增强 数据增强

    目录 python opncv 数据增强 亮度 opencv 亮度饱和度增强 vgg19图像增强 c opencv 图像增强 python opncv 数据增强 亮度 def data augment image brightness fa
  • 从零开始的python教程:全面又好用的学习资料

    1 耳熟能详的Python自学网站 廖雪峰python学习网站 推荐理由 全面成体系的python学习内容 概括起来其实就是免费且全面 而且里面的知识讲解也十分恰当 所举的例子也十分的形象 不足 知识之间的梯度对于刚学习python的学习者
  • 浅谈:VS中解决Bug的几个简单实用调试技巧

    在写这篇文章之前 就已经有不少读者来问我 有没有调试方面的文章 给推荐 思前想后 笔者决定自己研究一下调试的技巧 以便更好的使用VS 对于现在不少初学C语言的学者 大部分开始使用VS2019 或者VS2022 但是对于代码出现了错误 该怎么
  • Idea运行springboot项目(保姆级教学)

    大家好 我是CZ淡陌 一名专注以理论为基础实战为主的技术博主 将再这里为大家分享优质的实战项目 本人在Java毕业设计领域有多年的经验 陆续会更新更多优质的Java实战项目 希望你能有所收获 少走一些弯路 向着优秀程序员前行 Java项目精
  • 一、深入理解redis之需要掌握的知识点

    导读 从本章开始我们将要深入讲解redis 讲解的内容包括 redis的基础数据类型及应用场景 数据存储 持久化方式 RDB AOF redis集群进化过程 redis中AKF问题解决方案 redis中CAP问题解决方案 redis的分布式
  • Android RxJava生命周期管理解决方案整理

    一 为什么要做生命周期管理 Observable create new ObservableOnSubscribe
  • ubuntu下rime输入法的安装配置

    一 安装 ibus rime安装 1 1 安装ibus输入法框架 sudo apt get install ibus ibus clutter ibus gtk ibus gtk3 ibus qt4 1 2 安装rime sudo apt
  • 计算绕原点旋转某角度后的点的坐标

    问题 A点 x y 按顺时针旋转 theta 角度后点的坐标为A1点 x1 y1 求x1 y1坐标用 x y 和 theta 来表示 方法一 设 OA 向量和x轴的角度为 alpha 那么顺时针转过 theta后 OA1 向量和x轴的角度为
  • loadrunner压力fullgc

    loadrunner 打压力的时候 我们会根据jconsole来监控被压系统的内存 cpu fullgc等 当出现内存溢出或者fullgc 见下图 既内存溢出 又有fullgc 要先查看jvm的配置 好多技术都使用的默认配置 那么就要调试j
  • 编写软著的基本常识

    1 背景介绍 1 1 软著的概念 软著即软件著作权 市面上任何一个APP在编写完毕之后都会向国家版权中心去申请著作权对自己的软件进行知识产权保护 对于一个系统来说 可以对系统的功能模块进行拆分 分别进行软著的申请 也就相当于一个系统可以申请
  • 关于阿里云ECS服务器提示高危漏洞问题的处理

    购买阿里云服务器后 一段时间 会发钱提示高危漏洞 而且很多 有高危 中危 低危 严重等几个等级 当点击 一键修复或者生成修复命令时 开始让买买买了就 关于这个问题自己手动修复的话 采用软件升级一般都可以解决 除了提示带kernel的高危漏洞
  • 送书

    最好的挣钱方式是钱生钱 怎样钱生钱呢 钱生钱可以通过投资 例如买股票 基金等方式 有人可能说买股票基金发财 我没这样的命和运气 买股票基金靠的不只有命运和运气 更多靠的是长期的经验和对股票基金数据的分析 今天我们使用scrapy框架来js逆
  • C#和Java,究竟选哪个方向?我只说事实,你自己分析……

    优质资源分享 学习路线指引 点击解锁 知识定位 人群定位 Python实战微信订餐小程序 进阶级 本课程是python flask 微信小程序的完美结合 从项目搭建到腾讯云部署上线 打造一个全栈订餐系统 Python量化交易实战 入门级 手
  • netty源码分析(十四)Netty初始化流程总结及Channel与ChannelHandlerContext作用域分析

    我们回到ServerBootstrap的init方法 之前介绍过Attribute的设置 那么Attribute的具体设置是怎样的呢 void init Channel channel throws Exception final Map
  • MySQL深度探险(二)-- MySQL系统架构详解

    一 逻辑模块组成 总的来说 MySQL 可以看成是二层架构 第一层我们通常叫做SQL Layer 在 MySQL 数 据库系统处理底层数据之前的所有工作都是在这一层完成的 包括权限判断 sql 解析 执 行计划优化 query cache