回顾篇-mysql索引-读书笔记

2023-11-09

事务日志

事务日志可以帮助提高事务的效率。使用事务日志，存储引擎在修改表的数据时只需要修改其内存拷贝，再把该修改行为记录到持久在硬盘上的事务日志中，而不用每次都将修改的数据本身持久到磁盘。事务日志采用的是追加的方式，因此写日志的操作是磁盘上一小块区域内的顺序I/O，而不像随机I/O需要在磁盘的多个地方移动磁头，所以采用事务日志的方式相对来说要快得多。事务日志持久以后，内存中被修改的数据在后台可以慢慢地刷回到磁盘。目前大多数存储引擎都是这样实现的，我们通常称之为预写式日志（Write-Ahead Logging），修改数据需要写两次磁盘。如果数据的修改已经记录到事务日志并持久化，但数据本身还没有写回磁盘，此时系统崩溃，存储引擎在重启时能够自动恢复这部分修改的数据。具体的恢复方式则视存储引擎而定。

多版本并发控制

MySQL的大多数事务型存储引擎实现的都不是简单的行级锁。基于提升并发性能的考虑，它们一般都同时实现了多版本并发控制（MVCC）。不仅是MySQL，包括Oracle、PostgreSQL等其他数据库系统也都实现了MVCC，但各自的实现机制不尽相同，因为MVCC没有一个统一的实现标准。实现了非阻塞的读操作，写操作也只锁定必要的行。

MVCC的实现

是通过保存数据在某个时间点的快照来实现的。也就是说，不管需要执行多长时间，每个事务看到的数据都是一致的。根据事务开始的时间不同，每个事务对同一张表，同一时刻看到的数据可能是不一样的。

InnoDB的MVCC是通过在每行记录后面保存两个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存行的过期时间（或删除时间）。当然存储的并不是实际的时间值，而是系统版本号（system version number）。每开始一个新的事务，系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号，用来和查询到的每行记录的版本号进行比较。

MVCC只在REPEATABLE READ和READ COMMITTED两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容，因为READ UNCOMMITTED总是读取最新的数据行，而不是符合当前事务版本的数据行。而SERIALIZABLE则会对所有读取的行都加锁。
InnoDB采用MVCC来支持高并发，并且实现了四个标准的隔离级别。其默认级别是REPEATABLE READ（可重复读），并且通过间隙锁（next-key locking）策略防止幻读的出现。间隙锁使得InnoDB不仅仅锁定查询涉及的行，还会对索引中的间隙进行锁定，以防止幻影行的插入。

InnoDB聚簇索引

InnoDB表是基于聚簇索引建立的，我们会在后面的章节详细讨论聚簇索引。InnoDB的索引结构和MySQL的其他存储引擎有很大的不同，聚簇索引对主键查询有很高的性能。不过它的二级索引（secondary index，非主键索引）中必须包含主键列，所以如果主键列很大的话，其他的所有索引都会很大。
InnoDB内部做了很多优化，包括从磁盘读取数据时采用的可预测性预读，能够自动在内存中创建hash索引以加速读操作的自适应

存储引擎需要找到二级索引的叶子节点获得对应的主键值，然后根据这个值去聚簇索引中查找到对应的行。这里做了重复的工作：两次B-Tree查找而不是一次。对于InnoDB，自适应哈希索引能够减少这样的重复工作。

InnoDB二级索引的叶子节点中存储的不是“行指针”，而是主键值，并以此作为指向行的“指针”。这样的策略减少了当出现行移动或者数据页分裂时二级索引的维护工作。使用主键值当作指针会让二级索引占用更多的空间，换来的好处是，InnoDB在移动行时无须更新二级索引中的这个“指针”。

从性能的角度考虑，使用UUID来作为聚簇索引则会很糟糕：它使得聚簇索引的插入变得完全随机，这是最坏的情况，使得数据没有任何聚集特性。因为主键的值是顺序的，所以InnoDB把每一条记录都存储在上一条记录的后面。当达到页的最大填充因子时（InnoDB默认的最大填充因子是页大小的15 /16，留出部分空间用于以后修改），下一条记录就会写入新的页中。一旦数据按照这种顺序的方式加载，主键页就会近似于被顺序的记录填满，这也正是所期望的结果（然而，二级索引页可能是不一样的）。

中移除，或者是还没有被加载到缓存中，InnoDB在插入之前不得不先找到并从磁盘读取目标页到内存中。这将导致大量的随机I/O。因为写入是乱序的，InnoDB不得不频繁地做页分裂操作，以便为新的行分配空间。页分裂会导致移动大量数据，一次插入最少需要修改三个页而不是一个页。由于频繁的页分裂，页会变得稀疏并被不规则地填充，所以最终数据会有碎片。

MyISAM存储引擎

MyISAM提供了大量的特性，包括全文索引、压缩、空间函数（GIS）等，但MyISAM不支持事务和行级锁，而且有一个毫无疑问的缺陷就是崩溃后无法安全恢复。正是由于MyISAM引擎的缘故，即使MySQL支持事务已经很长时间了，在很多人的概念中MySQL还是非事务型的数据库。尽管MyISAM引擎不支持事务、不支持崩溃后的安全恢复，但它绝不是一无是处的。对于只读的数据，或者表比较小、可以忍受修复（repair）操作，则依然可以继续使用MyISAM（但请不要默认使用MyISAM，而是应当默认使用InnoDB）。

索引的类型

B-Tree索引

哈希索引，在MySQL中，只有Memory引擎显式支持哈希索引。哈希索引只包含哈希值和行指针，而不存储字段值，所以不能使用索引中的值来避免读取行。不过，访问内存中的行的速度很快，所以大部分情况下这一点对性能的影响并不明显。哈希索引数据并不是按照索引值顺序存储的，所以也就无法用于排序。哈希索引也不支持部分索引列匹配查找，因为哈希索引始终是使用索引列的全部内容来计算哈希值的。例如，在数据列（A,B）上建立哈希索引，如果查询只有数据列A，则无法使用该索引。哈希索引只支持等值比较查询，包括=、IN()、<=>（注意<>和<=>是不同的操作）。也不支持任何范围查询，例如WHERE price>100。访问哈希索引的数据非常快，除非有很多哈希冲突（不同的索引列值却有相同的哈希值）。当出现哈希冲突的时候，存储引擎必须遍历链表中所有的行指针，逐行进行比较，直到找到所有符合条件的行。如果哈希冲突很多的话，一些索引维护操作的代价也会很高。例如，如果在某个选择性很低（哈希冲突很多）的列上建立哈希索引，那么当从表中删除一行时，存储引擎需要遍历对应哈希值的链表中的每一行，找到并删除对应行的引用，冲突越多，代价越大。

空间数据索引（R-Tree）

全文索引，是一种特殊类型的索引，它查找的是文本中的关键词，而不是直接比较索引中的值。全文搜索和其他几类索引的匹配方式完全不一样。它有许多需要注意的细节，如停用词、词干和复数、布尔搜索等。全文索引更类似于搜索引擎做的事情，而不是简单的WHERE条件匹配。在相同的列上同时创建全文索引和基于值的B-Tree索引不会有冲突，全文索引适用于MATCH AGAINST操作，而不是普通的WHERE条件操作。

排序操作

MySQL有两种方式可以生成有序的结果：通过排序操作；或者按索引顺序扫描(13)；如果EXPLAIN出来的type列的值为“index”，则说明MySQL使用了索引扫描来做排序

覆盖索引

如果索引的叶子节点中已经包含要查询的数据，那么还有什么必要再回表查询呢?如果一个索引包含（或者说覆盖）所有需要查询的字段的值，我们就称之为“覆盖索引”。
索引条目通常远小于数据行大小，所以如果只需要读取索引，那MySQL就会极大地减少数据访问量。这对缓存的负载非常重要，因为这种情况下响应时间大部分花费在数据拷贝上。覆盖索引对于I/O密集型的应用也有帮助，因为索引比数据更小，更容易全部放入内存中（这对于MyISAM尤其正确，因为MyISAM能压缩索引以变得更小）。

不是所有类型的索引都可以成为覆盖索引。覆盖索引必须要存储索引列的值，而哈希索引、空间索引和全文索引等都不存储索引列的值，所以MySQL只能使用B-Tree索引做覆盖索引。

使用索引扫描来做排序

    扫描索引本身是很快的，因为只需要从一条索引记录移动到紧接着的下一条记录。但如果索引不能覆盖查询所需的全部列，那就不得不每扫描一条索引记录就都回表查询一次对应的行。这基本上都是随机I/O，因此按索引顺序读取数据的速度通常要比顺序地全表扫描慢，尤其是在I/O密集型的工作负载时。
压缩（前缀压缩）索引    MyISAM使用前缀压缩来减少索引的大小，从而让更多的索引可以放入内存中，这在某些情况下能极大地提高性能。默认只压缩字符串，但通过参数设置也可以对整数做压缩。MyISAM压缩每个索引块的方法是，先完全保存索引块中的第一个值，然后将其他值和第一个值进行比较得到相同前缀的字节数和剩余的不同后缀部分，把这部分存储起来即可。例如，索引块中的第一个值是“perform”，第二个值是“performance”，那么第二个值的前缀压缩后存储的是类似“7,ance”这样的形式。MyISAM对行指针也采用类似的前缀压缩方式。
压缩块使用更少的空间，代价是某些操作可能更慢。因为每个值的压缩前缀都依赖前面的值，所以MyISAM查找时无法在索引块使用二分查找而只能从头开始扫描。正序的扫描速    度还不错，但是如果是倒序扫描——例如ORDER BY DESC——就不是很好了。所有在块中查找某一行的操作平均都需要扫描半个索引块。

索引和锁

InnoDB只有在访问行的时候才会对其加锁，而索引能够减少InnoDB访问的行数，

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据库

回顾篇-mysql索引-读书笔记的相关文章

【Linux】权限管理

文章目录 1 shell命令以及运行原理 2 Linux权限的概念 3 Linux权限管理 3 1 文件访问者的分类 3 2 文件类型和访问权限文件类型 file指令文件权限 4 文件访问权限的设置 4 1 chmod指令 4 2 ch
node-red限速分流节点开发

node red限速分流节点开发功能简述节点设计界面设计功能设计功能实现功能简述此节点有一个输入两个输出此节点可完成信息的限速分流功能当信息高速输入时节点进行限速处理例两秒一次到指定时间后信息由一口输出若未到指

随机推荐

ssm整合

4 2 准备工作创建Maven Module 导入依赖
泛型深入、自定义泛型、泛型通配符、上下限

自定义泛型类泛型类 package Java project 1 import java util ArrayList public class MyArrayList
大数据工程师学习路线，主要划分为哪几个阶段？

第一阶段 01 Linux学习 02 Java 高级学习深入理解Java虚拟机 Java高并发实战第二阶段 03 Hadoop 董西成的书 04 HBase HBase权威指南 05 Hive 06 Scala 07 Spark 08
HTTPS 和 OpenSSL 是什么关系？

HTTPS是一种协议等于HTTP TLS 由于历史原因 SSL3 0之后就被TLS1 0替代了 openssl是一套开源工具集主要有两个特性实现了ssl2 ssl3 TLSv1 TLSv1 1 TLSv1 2协议实现目前常用的加密算
如何给你的网站套上Cloudflare（以阿里云为例）

文章目录 Cloudflare 是什么准备工作开搞 Cloudflare 设置阿里云域名设置等待设置 DNS 解析记录其他问题看下效果结尾 Cloudflare 是什么以下内容引自维基百科 Cloudflare是一間總部位
HTML5+CSS3实现图片的缩放旋转，一眼就懂

HTML界面 h2 照片墙 h2 div img src picWallImg 01 jpg width 200px height 150px img src picWallImg 02 jpg width 230px height 180
Matlab绘制多函数Bode图

函数bode用于绘制伯德图函数logspace用于生成对数刻度的频率点向量供Bode使用 grid on打印坐标线上代码 w logspace 1 3 10000 num 10 den 1 1 0 sys tf num den bod
系统改造升级步骤及注意事项（一）

系统改造升级步骤及注意事项一本次系统改造是以汇中综合业务系统中的调度系统 Dispatch 为核心展开的全面升级以目前市场较为前沿主流的技术为标准进行改造为了达到系统性能的提升实现高并发高可用以及增强系统可扩展性等目的目前修
非gui方式配置weblogic数据源和部署war

weblogic配置Oracle数据源 1 编写脚本和配置文件创建配置文件server properties domain name 7001 Domain admin url t3 localhost 7001 admin userNa
SpringCloud(17~21章)：Alibaba入门简介、Nacos服务注册和配置中心、Sentinel实现熔断与限流、Seata处理分布式事务

17 SpringCloud Alibaba入门简介 17 1 why会出现SpringCloud alibaba Spring Cloud Netflix项目进入维护模式 https spring io blog 2018 12 12 s
CUDA9.0 C++测试程序

CUDA runtime 库 CUBLAS 库 include cuda runtime h include cublas v2 h include
进程线程协程那些事儿

转 https www cnblogs com zhang can p 7215506 html
python保存随机的user-agent到本地并使用

user agent的数据使用的是github上fake useragent fake useragentgithub地址 https github com hellysmile fake useragent 数据网址 https fake
【深度学习】【Atlas 200DK】YOLOv3和YOLOv5部署

Atlas 200DK YOLOv3和YOLOv5部署数据集介绍开发板环境搭建 YOLOv3的部署模型训练转换服务器上的结果开发板上的结果 python部署 c 部署 YOLOv5的部署模型训练转换服务器上的结果开发板上的结
shiro拦截配置大全

admins anon 表示该 uri 可以匿名访问 admins auth 表示该 uri 需要认证才能访问 admins authcBasic 表示该 uri 需要 httpBasic 认证 admins perms user add
【文件I/O】（二）文件I/O

文件I O 系统调用一文件I O基本概念 1 什么是文件I O 2 文件描述符二文件I O函数 head h 1 open close 打开关闭文件 1 1open close函数API 1 2文件I O和标准I O文件打开方式对
[架构之路-181]-《软考-系统分析师》-19- 系统可靠性分析与设计 - 2-容错性：软件容错技术

目录前言 1 9 4 软件容错技术 19 4 1 N 版本程序设计 1 与通常软件开发过程的区别 2 其他需要注意的问题 19 4 2 恢复块方法 19 4 3 防卫式程序设计预防性设计广泛使用
HTML5移动开发常用meta标签

html
在IBM p6 570 LPAR之间动态切换磁盘机/光驱

小机上的一些外设比如磁盘机和光驱平时用的不多所以大多都是在一台小机的各LPAR之间共享使用的这些IO设备在不同的LPAR之间使用时只能被一个LPAR独占所以必要的时候就必须要做切换客户的一台p6 570 里面做了4个LPAR 需要
回顾篇-mysql索引-读书笔记

事务日志事务日志可以帮助提高事务的效率使用事务日志存储引擎在修改表的数据时只需要修改其内存拷贝再把该修改行为记录到持久在硬盘上的事务日志中而不用每次都将修改的数据本身持久到磁盘事务日志采用的是追加的方式因此写日志的操作是磁盘上

回顾篇-mysql索引-读书笔记

回顾篇-mysql索引-读书笔记 的相关文章

随机推荐

热门标签

回顾篇-mysql索引-读书笔记的相关文章