SQL - MySQL回表

2023-10-26

一、回表概念；现象

回表，顾名思义就是回到表中，也就是先通过普通索引（我们自己建的索引不管是单列索引还是联合索引，都称为普通索引）扫描出数据所在的行，再通过行主键ID 取出索引中未包含的数据。所以回表的产生也是需要一定条件的，如果一次索引查询就能获得所有的select 记录就不需要回表，如果select 所需获得列中有其他的非索引列，就会发生回表动作。即基于非主键索引的查询需要多扫描一棵索引树。

Mysql回表指的是在InnoDB存储引擎下，二级索引查询到的索引列，如果需要查找所有列的数据，则需要到主键索引里面去取出数据。这个过程就称为回表。因为行的数据都是存在主键B+tree的叶子节点里面，二级索引的B+树叶子节点都是存放的(索引列,主键)

简单来说，回表就是 MySQL 要先查询到主键索引，然后再用主键索引定位到数据

回表现象

举个例子：

表tbl有a,b,c三个字段，其中 a是主键，b上建了索引，然后编写sql语句SELECT * FROM tbl WHERE a=1这样不会产生回表，因为所有的数据在a的索引树中均能找到

如果是SELECT * FROM tbl WHERE b=1这样就会产生回表，因为where条件是b字段，那么会去b的索引树里查找数据，但b的索引里面只有a,b两个字段的值，没有c，那么这个查询为了取到c字段，就要取出主键a的值，然后去a的索引树去找c字段的数据。查了两个索引树，就出现了回表操作

二、存储引擎；索引结构

要弄明白回表，首先得了解MySQL的存储引擎，以及默认存储引擎 InnoDB 的两大索引，即聚簇索引（clustered index）和非聚簇索引/普通索引/二级索引/辅助索引（secondary index）

（一）存储引擎

MySQL中主要有2种存储引擎

1、MyISAM(不支持事物回滚)

MyIsam引擎是MySQL主流引擎之一，但它相比起InnoDB，没有提供对数据库事务的支持，不支持细粒度的锁（行锁）及外键，当表Insert与update时需要锁定整个表，因此效率会低一些，在高并发时可能会遇到瓶颈，但MyIsam引擎独立与操作系统，可以在windows及linux上使用。

可能的缺点：

不能在表损坏后恢复数据

适用场景：

1、MyIsam极度强调快速读取

2、MyIsam表中自动存储了表的行数，需要时直接获取即可

3、适用于不需要事物支持、外键功能、及需要对整个表加锁的情形

2、InnoDB（支持事物回滚）

InnoDB是一个事务型存储引擎，提供了对数据库ACID事务的支持，并实现了SQL标准的四种隔离级别，具有行级锁定（这一点说明锁的粒度小，在写数据时，不需要锁住整个表，因此适用于高并发情形）及外键支持（所有数据库引擎中独一份，仅有它支持外键）

该引擎的设计目标便是处理大容量数据的数据库系统，MySQL在运行时InnoDB会在内存中建立缓冲池，用于缓存数据及索引。

可能的缺点：

1、该引擎不支持FULLTEXT类型的索引

2、没有保存表的行数，在执行select count(*) from 表名时，需要遍历扫描全表

适用场景：

1、经常需要更新的表，适合处理多重并发的更新请求

2、支持事务

3、外键约束

4、可以从灾难中恢复（通过bin-log日志等）

5、支持自动增加列属性auto_increment

show engines;

show engines; 查看mysql所支持的存储引擎，以及从中得到mysql默认的存储引擎

可以看出，MySQL默认的数据库引擎是InnoDB

参数名称	解释说明
Engine	存储引擎名称
Support	是否支持该引擎以及该引擎是否为默认存储引擎，YES表示支持，NO表示不支持
DEFAULT	DEFAULT表示为默认存储引擎
Comment	存储引擎的简单介绍
Transactions	表示该引擎是否支持事务
XA	说明该存储引擎是否支持分布事务
Savepoints	说明该存储引擎是否支持部分事务回滚

（二）索引结构

MySQL官方对索引的定义为：索引（Index）是帮助MySQL高效获取数据的数据结构。可以得到索引的本质：索引是数据结构

MySQL默认的数据库引擎是InnoDB，InnoDB 存储引擎的两大索引，即聚簇索引（clustered index）和非聚簇索引/普通索引/二级索引/辅助索引（secondary index）

1、聚簇索引（clustered index）

InnoDB聚簇索引的叶子节点存储行记录，因此， InnoDB必须要有且只有一个聚簇索引。

如果表定义了主键，则Primary Key 就是聚簇索引；

如果表没有定义主键，则第一个非空唯一索引（Not NULL Unique）列是聚簇索引

否则，InnoDB会创建一个隐藏的row-id作为聚簇索引

简单来说，聚簇索引是主键索引

2、非聚簇索引/普通索引/二级索引/辅助索引（secondary index）

主键索引之外的就是非聚簇索引，非聚簇索引又叫辅助索引或者二级索引

主键索引和非主键索引区别

相同点：都使用的是 B+Tree

不同点：叶子节点存储的数据不同

主键索引的叶子节点存储的是一行完整的数据

非主键索引的叶子节点存储的是主键值。叶子节点不包含记录的全部数据，非主键的叶子节点除了用来排序的 key 还包含一个书签（bookmark），其中存储了聚簇索引的 key

使用主键索引查询

# 主键索引的的叶子节点存储的是**一行完整的数据**，
# 所以只需搜索主键索引的 B+Tree 就可以轻松找到全部数据
select * from user where id = 1;

使用非主键索引查询

# 非主键索引的叶子节点存储的是**主键值**，
# 所以MySQL会先查询到 name 列的索引的 B+Tree，搜索得到对应的主键值
# 然后再去搜索该主键值查询主键索引的 B+Tree 才可以找到对应的数据
select * from user where name = 'Jack';

使用非主键索引要比主键索引多使用一次 B+Tree

二级索引查找的过程为先在二级索引找到主键索引的key，再在主键索引中查找（回表操作）

InnoDB表一定要建主键，并且最好使用int自增作为主键

这样做就是为了不用MySQL维护唯一列数据，节省资源。建立和维护索引过程中需要进行key的比较，int类型更好比较。自增使得树结构不容易产生树结构分裂，更节省算力

1、单值索引

即一个索引只包含单个列，一个表可以有多个单列索引

随表一起建索引：

CREATE TABLE customer (

id INT(10) UNSIGNED AUTO_INCREMENT ,

customer_no VARCHAR(200),

customer_name VARCHAR(200),

PRIMARY KEY(id),

KEY (customer_name)

);

单独建单值索引：

CREATE INDEX idx_customer_name ON customer(customer_name);

删除索引：

DROP INDEX idx_customer_name on customer;

2、唯一索引

索引列的值必须唯一，但允许有空值

随表一起建索引：

CREATE TABLE customer (

id INT(10) UNSIGNED AUTO_INCREMENT ,

customer_no VARCHAR(200),

customer_name VARCHAR(200),

PRIMARY KEY(id),

KEY (customer_name),

UNIQUE (customer_no)

);

单独建唯一索引：

CREATE UNIQUE INDEX idx_customer_no ON customer(customer_no);

删除索引：

DROP INDEX idx_customer_no on customer ;

3、主键索引

设定为主键后数据库会自动建立索引，innodb为聚簇索引

随表一起建索引：

CREATE TABLE customer (

id INT(10) UNSIGNED AUTO_INCREMENT ,

customer_no VARCHAR(200),

customer_name VARCHAR(200),

PRIMARY KEY(id)

);

CREATE TABLE customer2 (

id INT(10) UNSIGNED ,

customer_no VARCHAR(200),

customer_name VARCHAR(200),

PRIMARY KEY(id)

);

单独建主键索引：

ALTER TABLE customer

add PRIMARY KEY customer(customer_no);

删除建主键索引：

ALTER TABLE customer

drop PRIMARY KEY ;

修改建主键索引：

必须先删除掉(drop)原索引，再新建(add)索引

4、复合索引

即一个索引包含多个列

随表一起建索引：

CREATE TABLE customer (

id INT(10) UNSIGNED AUTO_INCREMENT ,

customer_no VARCHAR(200),

customer_name VARCHAR(200),

PRIMARY KEY(id),

KEY (customer_name),

UNIQUE (customer_name),

KEY (customer_no,customer_name)

);

单独建索引：

CREATE INDEX idx_no_name ON customer(customer_no,customer_name);

删除索引：

DROP INDEX idx_no_name on customer ;

（三）B-Tree 和 B+Tree

理解聚簇索引和非聚簇索引的关键在于 B+Tree 的理解

前者是 B-Tree，后者是 B+Tree，两者的区别在于：

B-Tree 中，所有节点都会带有指向具体记录的指针；B+Tree 中只有叶子结点会带有指向具体记录的指针。
B-Tree 中不同的叶子之间没有连在一起；B+Tree 中所有的叶子结点通过指针连接在一起。
B-Tree 中可能在非叶子结点就拿到了指向具体记录的指针，搜索效率不稳定；B+Tree 中，一定要到叶子结点中才可以获取到具体记录的指针，搜索效率稳定

基于上面两点分析，我们可以得出如下结论：

B+Tree 中，由于非叶子结点不带有指向具体记录的指针，所以非叶子结点中可以存储更多的索引项，这样就可以有效降低树的高度，进而提高搜索的效率。
B+Tree 中，叶子结点通过指针连接在一起，这样如果有范围扫描的需求，那么实现起来将非常容易，而对于 B-Tree，范围扫描则需要不停的在叶子结点和非叶子结点之间移动

三、索引创建场景

（一）需要创建索引

1、主键自动建立唯一索引

2、频繁作为查询条件的字段应该创建索引

3、查询中与其它表关联的字段，外键关系建立索引

4、单键/组合索引的选择问题，组合索引性价比更高

5、查询中排序的字段，排序字段若通过索引去访问将大大提高排序速度

6、查询中统计或者分组字段

（二）不要创建索引

1、表记录太少

2、经常增删改的表或者字段原因：提高了查询速度，同时却会降低更新表的速度，如对表进行INSERT、UPDATE和DELETE。因为更新表时，MySQL不仅要保存数据，还要保存一下索引文件

3、Where条件里用不到的字段不创建索引

4、过滤性不好的不适合建索引

四、覆盖索引避免回表

覆盖索引就是指索引中包含了查询中的所有字段，这种情况下就不需要再进行回表查询

一级索引：聚簇索引即主键索引
二级索引：非聚簇索引

一级B+Tree：叶子节点保存着键（id的值）和数据（全部字段的值）
二级B+Tree：叶子节点保存着键（索引字段的值）和数据（主键索引值）

查询一级索引，根据一级B+Tree查询到数据，直接返回数据
查询二级索引，根据二级B+Tree查询到对应的聚簇索引，再根据聚簇索引在一级B+Tree里查询到相应数据

查询一级索引只需要扫描一次B+Tree。
查询二级索引需要扫描两次B+Tree。根据二级B+Tree扫描的结果，再去一级B+Tree里进行扫描就叫回表操作

如果使用组合索引，就可以利用覆盖索引避免回表操作

例：表一共有五个字段：a（主键索引），b_c_d（组合索引），e（没有索引）

如果用户查询时只查 b,c,d；SELECT `b`, `c`, `d` FROM `table` WHERE `b` = 3 AND `c` = 7 AND `d` = 5;

因为查询的字段 b,c,d的值（B+Tree里的键）已经在B+Tree里了，所以就可以直接返回，不用再拿聚簇索引去一级B+Tree里进行查询

如果查询字段为 a,b,c,d，因为a为主键索引，也保存在二级B+Tree的叶子节点里，所以也不用回表查询

【a是主键，给bcd建立联合索引】，如上几个sql，select出来的内容，和where条件字段，刚好和建立的索引一致

如果查询字段为 a,b,c,d,e，因为e没有在这个二级B+Tree里，所以需要进行回表操作，拿着主键索引再去一级B+Tree里进行查询

使用覆盖索引，我们需要select出来的列，都已经存在了索引树的叶子节点上。所以不需要回表操作，如果我们select出来的某列，不在该联合索引的叶子节点上（比如上表的e列），那就需要根据对应索引值，去聚簇索引树上回表查询对应的e列值了

参考链接

MySQL 回表 - 涛姐涛哥 - 博客园

什么是MySQL的回表？_一年春又来的博客-CSDN博客_回表

MySQL 存储引擎 - 知乎

https://www.jb51.net/article/239235.htm

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SQL - MySQL回表的相关文章

为什么MySQL在这里不总是使用索引合并？

考虑这个表 CREATE TABLE Alarms AlarmId INT 10 UNSIGNED NOT NULL AUTO INCREMENT DeviceId BINARY 16 NOT NULL Code BIGINT 20 UNS
MySQL/InnoDB 和长时间运行的查询

当使用 myisam 引擎运行查询时因为它不是事务性的所以长查询据我所知不会影响其他查询的数据在 InnoDB 中它警告的事情之一是避免长查询 InnoDB快照时是不是把所有东西都快照了我问这个问题的原因是无论出于何种原因
MySQL 无法更改正在主动写入的表

在我的应用程序的一个用例中我有两个并发MySQL连接主动写入名为的表T 实际上不断更新该表中的一行并且另一个对同一个表执行 DDL ALTER TABLE 添加 8 个新列并从varchar 80 to varchar 2000
innodb_lock_wait_timeout 增加超时时间

我正在使用 MySQL 数据库并尝试在插入后更新记录因此出现以下错误ER LOCK WAIT TIMEOUT Lock wait timeout exceeded try restarting transaction 所以我通过以下查询减
我如何清理 mysql 上的临时表

我们在程序中创建临时表并且我们不使用 mysql 的持久连接 mysql重启后有很多临时表慢慢增加然后innodb buffer pool size正在整理应用程序正在该服务器上运行 CPU E3 1245 v5 3 50GHz 8
INT 和 VARCHAR 主键之间是否存在真正的性能差异？

在 MySQL 中使用 INT 与 VARCHAR 作为主键之间是否存在可测量的性能差异我想使用 VARCHAR 作为参考列表的主键想想美国各州国家地区代码并且同事不会在 INT AUTO INCRMENT 作为所有表的主键上让步
优化大表（75M+ 行）上的简单 mysql select

我有一个统计表它以很大的速度增长大约 25M 行天我想针对选择进行优化该表适合内存并且服务器有足够的备用内存 32G 表是 4G 我的简单汇总查询是 EXPLAIN select FROM UNIXTIME FLOOR endt
MySQL 5.5：对于 innodb 中的 text/varchar 字段，以下哪一项是更好的存储方式？

要求 Page 1 gt 显示用户及其最新 10 篇博客文章的 1 2 行预览 Page 2 gt 显示带有全文的单个博客文章方法一 MySQL table gt userid gt varchar 50 post id gt integ
MySQL 更新查询 - 竞争条件和行锁定会遵守“where”条件吗？（PHP、PDO、MySQL、InnoDB）

我正在尝试建立一个先到先得的模型销售页面我们有 n 个相同类型的物品我们希望将这 n 个项目分配给前 n 个发出请求的用户每个项目对应有一个数据库行当用户按下购买按钮时系统会尝试查找尚未出售的条目 reservationCompl
InnoDB SELECT ... FOR UPDATE 语句锁定表中的所有行

MySQL 服务器版本 5 1 41 启用了 InnoDB 插件我有以下三个发票表 invoices invoice components 和invoice expenses 表发票有invoice id 主键发票组件和发票费用都链
搜索距离邮政编码最近的 5 个地点 - 我应该走哪条路？

我想要的是用户传入邮政编码或城市名称我在数据库中搜索 5 个最近的地点显示距离用户最近的 5 个位置到目前为止我所拥有的假设有一个包含以下内容的地点表 about 16000 rows CREATE TABLE locations
如何锁定尚不存在的 InnoDB 行？

如何保证我可以搜索数据库中是否存在用户名然后将该用户名作为新行插入数据库中而在用户名之间没有任何拦截SELECT and INSERT声明几乎就好像我锁定了不存在的行我想用用户名锁定不存在的行 Foo 这样我现在就可以检查它是否存在
Windows 上文件操作中的 Mysql InnoDB 操作系统错误号 32

几天前我的 Windows 机器上的 MySQL 服务器无法成功关闭自身我在 MySQL 错误日志中发现了这些行的多个实例 InnoDB Operating system error number 32 in a file operat
“‘字段列表’中的未知列”，但列确实存在

DROP TABLE IF EXISTS transactions CREATE TABLE transactions id int 11 unsigned NOT NULL AUTO INCREMENT purchase date dat
通过显式排序避免死锁

我想明确提供有关 MySql InnoDB 应如何获取行锁的顺序如果可能的话就不应该出现任何死锁如果我们遵循惯例首先数据库应该按升序锁定表 models 中找到的所有行然后第二个表颜色中的所有行都应按升序锁定有没有办法控制
如何在 MySQL 查询中使用正则表达式

我有一个简单的任务我需要搜索以字符串字符开头及其后一个数字的记录我正在尝试的是这个 SELECT trecord FROM tbl WHERE trecord LIKE ALA d And SELECT trecord FROM tbl
使用 mysql-server docker 容器在多个服务器上创建 MySQL 集群

我正在尝试使用以下命令创建一个包含 3 个节点的 MySQL 集群mysql 服务器 https hub docker com r mysql mysql server 码头集装箱 I have 3个独立的云实例并且 docker 已在所有
在 MySQL 中使用 NoSQL

我注意到 MySQL 可以将 Memcached NoSQL 与 InnoDB 结合使用但我无法检索有关如何使用它的信息我想与 PHP 一起使用 NoSQL 查询是标准的吗首先 MySQL从5 6版本开始只支持NoSQL的memcac
MySQL 5.7 innoDB集群中的一个节点崩溃并且无法将崩溃的节点重新加入集群

我们的一个环境中有一个 MySQL innodb 集群集群中的一个节点崩溃了虽然我们能够使崩溃的节点联机但无法将其加入集群有人可以帮助恢复恢复节点并将其加入集群吗我们尝试使用 dba rebootClusterFromCompl
MySQL中如何压缩列？

我有一个存储电子邮件通信的表每当有人回复整个路径也被包含并保存到数据库我需要这样因为应用程序的数量级别更改以纠正太高的情况尺寸mail文本列是10000 但是我在存储文本时遇到的困难还不止这些由于我不确定可以发生多少个通

随机推荐

Redis的内存淘汰机制和删除策略

Redis内存淘汰机制 Redis内存淘汰指的是用户存储的一些键被可以被Redis主动地从实例中删除内存的淘汰机制的初衷是为了更好地使用内存配置我们可以通过配置redis conf中的maxmemory这个值来开启内存淘汰功能这个值
【Python函数】——sort，sorted

1 sorted和sort的常规使用 2 关于自定义比较函数 3 试验 from functools import cmp to key ll 2 3 10 1 2 3 5 6 7 2 5 10 2 4 10 根据一个维度进行排序这里根据
sqli-labs Less-25、25a（sqli-labs闯关指南 25、25a）

目录 Less 25 Less 25a Less 25 GET 基于错误您所有的OR AND都属于我们字符串单引号源码本关主要将 or and 进行了大小写的过滤将其换成空如何绕过 or 和 and 过滤一般性提供以下几种思路
国内第一篇讲解减少卡顿的代码级详细文章

原文链接原文链接系统网站应用出现过卡顿但却不知道如何优化国内第一篇讲如何减少卡顿的代码级别详细文章也是性能优化系列文章中的一篇欢迎点赞关注也欢迎对其中的内容进行评论经常听人说不要阻塞主线程或者减少长耗时该如何做呢
SQL Server 数据分页查询

最近学习了一下SQL的分页查询总结了以下几种方法首先建立了一个表随意插入的一些测试数据表结构和数据如下图现在假设我们要做的是每页5条数据而现在我们要取第三页的数据数据太少就每页5条了方法一 select top 5 fro
火星数字

火星人是以 13 进制计数的地球人的 0 被火星人称为 tret 地球人数字 1 到 12 的火星文分别为 jan feb mar apr may jun jly aug sep oct nov dec 火星人将进位以后的 12 个高位数
attr 'explicit_paddings'，tensorflow迁移到安卓报错不能载入模型

attr explicit paddings tensorflow迁移到安卓报错不能载入模型 Android Stdio中报错 Caused by java io IOException Not a valid TensorFlow Gra
第十章网络工具--基于Linux3.10

在测试io设备时常常会用到iostat iotop工具在查看内存时常常用到vmstat free slabtop工具在查看调度器时常常使用mpstat top以及ps工具这里来说说网络相关的工具有性能分析网络管理状态查看类工
App逆向案例 X嘟牛 - Frida监听 & WT-JS工具还原（一）

App逆向案例 X嘟牛 Frida监听 WT JS工具还原一提示文章仅供参考禁止用于非法途径文章目录 App逆向案例 X嘟牛 Frida监听 WT JS工具还原一前言一资源推荐二 App抓包分析三反编译逆向分析四
2023华为产品测评官－开发者之声

2023华为产品测评官开发者之声活动激发了众多开发者和技术爱好者的热情他们纷纷递交了精心编写的产品测评报告活动社群充满活力参与者们热衷于交流讨论互相帮助解决问题一起探索云技术的无限可能在此次活动中华为云CodeArts获得
守护线程

守护线程是一类比较特殊的线程一般用于处理后台的工作比如JDK的垃圾回收线程守护线程具备自动结束生命周期的特点非守护线程不具备这样的特点首先明确一个问题 JVM什么情况下会退出 The java virtual machine ex
关于H.248的树图规则

一 H248数图数图可以是一个字符串我们不妨称之为数图字符串它遵循了Unix系统命令中的规则表达式的语法规定也可以是许多数图字符串的并集之间用分隔我们不妨称之为数图字符串列表以下是一个数图的例子 2 8 xxxxxxx 13
RabbitMQ 与 Kafka 对比

作为一个有丰富经验的微服务系统架构师经常有人问我应该选择RabbitMQ还是Kafka 基于某些原因许多开发者会把这两种技术当做等价的来看待的确在一些案例场景下选择RabbitMQ还是Kafka没什么差别但是这两种技术在底层实现
【jackson】自定义字段注解完成序列化逻辑

目录背景本文开发环境介绍新建一个注解新建一个JavaBean 新建一个JsonSerializer 新建一个AnnotationIntrospector 单元测试总结背景 Spring默认的JSON序列化工具使用的是jackso
基于CNN-LSTM数据分类：Matlab实现

基于CNN LSTM数据分类 Matlab实现在当今的信息时代数据处理和分类已经成为了不可或缺的技能和工具其中卷积神经网络 Convolutional Neural Network CNN 和长短时记忆网络 Long Short Te
多少存款才是裸辞的最好姿态？

朋友小惠上个月裸辞了前几天见她还意气风发没想到昨晚就和我说焦虑来得远比想象中快她的计划是三个月内找到满意的新工作满打满算攒了三个月的生活费才踏出裸辞这一步结果面试了几个公司后对于能否在三个月内找到满意工作感到极度地焦虑小惠认
[SWPUCTF 2021 新生赛]finalrce
tplink 703n lede －17.01 编译过程

tplink 703n lede 17 01 编译过程 tplink 703n lede 17 01 编译过程 tplink 703n 支持USB扩展利用其功能可实现挂载硬盘打印机共享等网上虽然有些现成的固件但基于openwrt 1
shiro（java安全框架）

以下都是综合之前的人加上自己的一些小总结 Apache Shiro是一个强大且易用的Java安全框架执行身份验证授权密码学和会话管理使用Shiro的易于理解的API 您可以快速轻松地获得任何应用程序从最小的移动应用程序到最大的网
SQL - MySQL回表

一回表概念现象回表顾名思义就是回到表中也就是先通过普通索引我们自己建的索引不管是单列索引还是联合索引都称为普通索引扫描出数据所在的行再通过行主键ID 取出索引中未包含的数据所以回表的产生也是需要一定条件的如果一次索引查

SQL - MySQL回表

一、回表概念；现象

回表现象

二、存储引擎；索引结构

（一）存储引擎

1、MyISAM(不支持事物回滚)

2、InnoDB（支持事物回滚）

（二）索引结构

1、聚簇索引 （clustered index）

2、非聚簇索引/普通索引/二级索引/辅助索引（secondary index）

（三）B-Tree 和 B+Tree

三、索引创建场景

（一）需要创建索引

（二）不要创建索引

四、覆盖索引避免回表

SQL - MySQL回表 的相关文章

随机推荐

热门标签

1、聚簇索引（clustered index）

SQL - MySQL回表的相关文章