慢sql优化

2023-11-08

SQL 优化一般步骤

| 通过慢查日志等定位那些执行效率较低的 SQL 语句

| explain 分析SQL的执行计划

需要重点关注 type、rows、filtered、extra。

type 由上至下，效率越来越高：

ALL 全表扫描
index 索引全扫描
range 索引范围扫描，常用语<,<=,>=,between,in 等操作
ref 使用非唯一索引扫描或唯一索引前缀扫描，返回单条记录，常出现在关联查询中
eq_ref 类似 ref，区别在于使用的是唯一索引，使用主键的关联查询
const/system 单条记录，系统会把匹配行中的其他列作为常数处理，如主键或唯一索引查询
null MySQL 不访问任何表或索引，直接返回结果
虽然上至下，效率越来越高，但是根据 cost 模型，假设有两个索引 idx1(a, b, c),idx2(a, c)，SQL 为"select * from t where a = 1 and b in (1, 2) order by c";如果走 idx1，那么是 type 为 range，如果走 idx2，那么 type 是 ref；当需要扫描的行数，使用 idx2 大约是 idx1 的 5 倍以上时，会用 idx1，否则会用 idx2

Extra：

Using filesort：MySQL 需要额外的一次传递，以找出如何按排序顺序检索行。通过根据联接类型浏览所有行并为所有匹配 WHERE 子句的行保存排序关键字和行的指针来完成排序。然后关键字被排序，并按排序顺序检索行；
Using temporary：使用了临时表保存中间结果，性能特别差，需要重点优化；
Using index：表示相应的 select 操作中使用了覆盖索引（Coveing Index）,避免访问了表的数据行，效率不错！如果同时出现 using where，意味着无法直接通过索引查找来查询到符合条件的数据；
Using index condition：MySQL5.6 之后新增的 ICP，using index condtion 就是使用了 ICP（索引下推），在存储引擎层进行数据过滤，而不是在服务层过滤，利用索引现有的数据减少回表的数据。

| show profile 分析

了解 SQL 执行的线程的状态及消耗的时间。

默认是关闭的，开启语句“set profiling = 1;”

SHOW PROFILES ;
SHOW PROFILE FOR QUERY  #{id};

| trace

trace 分析优化器如何选择执行计划，通过 trace 文件能够进一步了解为什么优惠券选择 A 执行计划而不选择 B 执行计划。

set optimizer_trace="enabled=on";
set optimizer_trace_max_mem_size=1000000;
select * from information_schema.optimizer_trace;

| 确定问题并采用相应的措施

如下：

优化索引
优化 SQL 语句：修改 SQL、IN 查询分段、时间查询分段、基于上一次数据过滤
改用其他实现方式：ES、数仓等
数据碎片处理

场景分析

| 案例 1：最左匹配

索引：

KEY `idx_shopid_orderno` (`shop_id`,`order_no`)

SQL 语句：

select * from _t where orderno=''

查询匹配从左往右匹配，要使用 order_no 走索引，必须查询条件携带 shop_id 或者索引（shop_id，order_no）调换前后顺序。

| 案例 2：隐式转换

索引：

KEY `idx_mobile` (`mobile`)

SQL 语句：

select * from _user where mobile=12345678901

隐式转换相当于在索引上做运算，会让索引失效。mobile 是字符类型，使用了数字，应该使用字符串匹配，否则 MySQL 会用到隐式替换，导致索引失效。

| 案例 3：大分页

索引：

KEY `idx_a_b_c` (`a`, `b`, `c`)

SQL 语句：

select * from _t where a = 1 and b = 2 order by c desc limit 10000, 10;

对于大分页的场景，可以优先让产品优化需求，如果没有优化的，有如下两种优化方式：

一种是把上一次的最后一条数据，也即上面的 c 传过来，然后做“c < xxx”处理，但是这种一般需要改接口协议，并不一定可行
另一种是采用延迟关联的方式进行处理，减少 SQL 回表，但是要记得索引需要完全覆盖才有效果。

SQL 改动如下：

select t1.* from _t t1, (select id from _t where a = 1 and b = 2 order by c desc limit 10000, 10) t2 where t1.id = t2.id;

| 案例 4：in + order by

索引：

KEY `idx_shopid_status_created` (`shop_id`, `order_status`, `created_at`)

SQL 语句：

select * from _order where shop_id = 1 and order_status in (1, 2, 3) order by created_at desc limit 10

in 查询在 MySQL 底层是通过 n*m 的方式去搜索，类似 union，但是效率比 union 高。

in 查询在进行 cost 代价计算时（代价 = 元组数 * IO 平均值），是通过将 in 包含的数值，一条条去查询获取元组数的，因此这个计算过程会比较的慢。

所以 MySQL 设置了个临界值（eq_range_index_dive_limit），5.6 之后超过这个临界值后该列的 cost 就不参与计算了。因此会导致执行计划选择不准确。

默认是 200，即 in 条件超过了 200 个数据，会导致 in 的代价计算存在问题，可能会导致 MySQL 选择的索引不准确。

处理方式：可以（order_status，created_at）互换前后顺序，并且调整 SQL 为延迟关联。

| 案例 5：范围查询阻断，后续字段不能走索引

索引：

KEY `idx_shopid_created_status` (`shop_id`, `created_at`, `order_status`)

SQL 语句：

select * from _order where shop_id = 1 and created_at > '2021-01-01 00:00:00' and order_status = 10

范围查询还有“IN、between”。

| 案例 6：不等于、不包含不能用到索引的快速搜索

可以用到 ICP：

select * from _order where shop_id=1 and order_status not in (1,2)
select * from _order where shop_id=1 and order_status != 1

在索引上，避免使用 NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等。

| 案例 7：优化器选择不使用索引的情况

如果要求访问的数据量很小，则优化器还是会选择辅助索引，但是当访问的数据占整个表中数据的蛮大一部分时（一般是 20% 左右），优化器会选择通过聚集索引来查找数据。

select * from _order where  order_status = 1

查询出所有未支付的订单，一般这种订单是很少的，即使建了索引，也没法使用索引。

| 案例 8：复杂查询

select sum(amt) from _t where a = 1 and b in (1, 2, 3) and c > '2020-01-01';
select * from _t where a = 1 and b in (1, 2, 3) and c > '2020-01-01' limit 10;

如果是统计某些数据，可能改用数仓进行解决；如果是业务上就有那么复杂的查询，可能就不建议继续走 SQL 了，而是采用其他的方式进行解决，比如使用 ES 等进行解决。

| 案例 9：asc 和 desc 混用

select * from _t where a=1 order by b desc, c asc

desc 和 asc 混用时会导致索引失效。

| 案例 10：大数据

对于推送业务的数据存储，可能数据量会很大，如果在方案的选择上，最终选择存储在 MySQL 上，并且做 7 天等有效期的保存。

那么需要注意，频繁的清理数据，会照成数据碎片，需要联系 DBA 进行数据碎片处理。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

Java

慢sql优化的相关文章

Junit maven构建错误（maven-surefire-plugin：2.19.1：测试失败：分叉进程中出现错误）[重复]

这个问题在这里已经有答案了我通过引用创建了一个示例 struts 2 项目和 J unit 测试用例link http self learning java tutorial blogspot com au 2015 04 struts2
MySQL 数据库无法在 XAMPP for Mac 上启动

突然我在 mac 上遇到了这个问题我无法启动我的 MySQL 数据库我只能启动 ProFTPD 和 Apache Web Server 这是应用程序日志 Starting all servers Starting MySQL Datab
如何在远程 WebSphere 上进行 JNDI 查找期间解决 sun/io/MalformedInputException

我使用 WebSphere 8 5 来托管我的应用程序并在应用程序服务器上配置了一些 JDBC 资源我还使用瘦客户端运行时库开发了一个客户端应用程序当按以下方式执行 JNDI 查找时 env put Context INITIAL C
从 Grib 天气模型中提取数据

我已经下载了grib1模型数据来自GFS http en wikipedia org wiki Global Forecast System 我使用的是 Mac OS X 并且能够构建wgrib2文件来自NOAA http en wikip
将过滤器添加到 Eclipse 中的 Project Explorer

我想向 Project Explorer 添加一个新的过滤器以向用户隐藏一些在 Eclipse RCP 应用程序中自动创建的项目到目前为止我已经找到了两个扩展点 org eclipse ui ide resourceFilters 允许
java.lang.LinkageError：尝试重复的类定义

为什么会发生错误以及如何修复它 02 13 02 pool 4 thread 2 WARN Exception in thread pool 4 thread 2 02 13 02 pool 4 thread 2 WARN java lan
字符串池可以包含两个具有相同值的字符串吗？ [复制]

这个问题在这里已经有答案了字符串池可以包含两个具有相同值的字符串吗 String str abc String str1 new String abc Will the second statement with new operator
如何导入 org.apache.commons.lang3.ArrayUtils;进入 Eclipse [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我如何导入 org apache commons lang3 ArrayUtils 将库添加到 Ecl
容器中的 JVM 计算处理器错误？

最近我又做了一些研究偶然发现了这一点在向 OpenJDK 团队抱怨之前我想看看是否有其他人观察到这一点或者不同意我的结论因此众所周知 JVM 长期以来忽略了应用于 cgroup 的内存限制众所周知现在从 Java 8 更新某
在MySQL中生成随机字符串

我正在尝试使用函数在 phpmyadmin 中获取随机字符串我有以下代码 CREATE FUNCTION randomPassword RETURNS varchar 128 BEGIN SET chars ABCDEFGHIJKLMNO
Jenkins 的代码覆盖率 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
MySQL 将表从 Latin1 转换为 utf8

我需要将包含大量数据的表从 Latin1 转换为 utf8 以便它可以接受韩语字符如何更改该表而不损坏其中的数据我的 SQL 语句是什么最好的方法是什么 ALTER TABLE database name table name CON
Java：java.util.ConcurrentModificationException

我正在制作 2D 目前正在研究用子弹射击子弹是一个单独的类所有项目符号都存储在称为项目符号的数组列表中当它超出屏幕一侧 Exception in thread main java util ConcurrentModification
如何在Java媒体框架中学习.wav持续时间？

我正在尝试使用 java 媒体框架将 mov 文件与 wav 文件合并因此我需要知道它们的持续时间我怎样才能做到这一点任何想法将不胜感激您可以使用以下方式了解声音文件的持续时间即 VitalyVal 的第二种方式 import
Java：由 HTTP 连接创建的等待连接线程存活时间很长

我有一个服务器端代码用于检查 SOAP 服务是否已启动代码如下 String response while response length 0 try final URL url new URL DummySoapServiceURL
警告：无法更改每个人的权限：

当运行 Java 快速入门示例时https developers google com drive web quickstart java hl hu https developers google com drive web quicks
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
公共方法与公共 API

在干净的代码书中有一个观点是公共 API 中的 Javadocs 同样 Effective java 一书也有这样的内容项目 56 为所有公开的 API 元素编写文档注释所以这就是我的问题所有公共方法都被视为公共 API 吗它们
在同一查询中选择 Count of ip 和 Count of DISTINCT ip

我有一个这样的表结构 TABLE NAME counter id datetime url ip 1 2013 04 12 13 27 09 url1 ip01 2 2013 04 13 10 55 43 url2 ip02 3 2013
如何捕获 try-with-resource 语句中 close 方法抛出的异常

我正在读关于try with resourceJava 中的语句可用于指定任意数量的资源 try Resource1 res1 initialize code Resource1 res2 initialize code statement

随机推荐

内存单位及换算

单位换算内存单位及换算位 bit 数据储存最小单位字节 Byte 基本数据存储单位内存单位及换算换算单位太多记下来供查阅位 bit 二进制一个数字 0或1 即是一位数据储存最小单位字节 Byte 每8位为一个字节 1Byt
Vue Element Form表单 resetFields重置无效

原因有两点 el form 标签需要绑定 ref 和 model 属性 el form item 标签要绑定 prop 属性重置表单添加一个是否加载的开关 v if dialogVisible 由 dialogVisible的值来控制
chatgpt赋能python：Python量化数据来源-介绍

Python量化数据来源介绍 Python在金融量化分析领域中得到了广泛的应用这部分应用通常被称为Python量化金融 Python量化数据来源是Python量化金融分析的基础只有良好的数据来源才能保证分析的准确性和有效性 Pytho
Python图形界面的设计，Turtle库的使用

一学习目标 1 Turtle库的简介 2 调用Turtle库 3 绘画起点和方向 4 画布二知识点 1 Turtle库的简介 Turtle库是Python语言中一个很流行的绘图图像函数库中文意思是甲鱼海龟所以也称为海龟库 Tur
Anaconda安装路径和包路径问题

文章目录 Anaconda的安装路径使用pip install 下载后的包的路径在哪里 Anaconda的安装路径在默认情况下 Anaconda安装的默认路径是C ProgramData Anaconda3 而conda环境的默认安装路
数据结构--顺序表的基本操作--插入 and 删除

数据结构顺序表的基本操作插入顺序表的插入操作实现目标 ListInsert L i e 插入操作在表L中的第i个位置上插入指定元素e typedef struct int data MaxSize int len Sqlist 代
华为OD机试 Python 数字比大小

描述 A和B是两位好友他们决定进行一个数字比赛他们都拿到两个数字列表两个列表的长度都相同但里面的数字并不一样现在他们需要从自己的列表中挑选一个数字看谁选的数字大选大的得1分选小的扣1分如果数字相同则不加分也不扣分已经用
js逆向-逆向基础

js逆向逆向基础 1 1 语法基础 Js调试相对方便通常只需要chrome或者一些抓包工具扩展插件就能顺利的完成逆向分析但是Js的弱类型和语法多样各种闭包逗号表达式等语法让代码可读性变得不如其他语言顺畅所以需要学习一下基础语
PhotoShop 之图层中的 Ctrl + Alt +T 和 Ctrl + Alt + Shift + T

1 Ctrl Alt T 该按钮会选中图层鼠标移动会复制一个新的图层原图 Ctrl Alt T 之后 M 图被选中按住鼠标左键并往下拖动复制完成之后按下回车键退出选中状态 2 先按下Ctrl Alt Shift 然后按下T
error while loading shared libraries: libcudart.so.9.1:cannot open shared object file: No such file

在实现YOLO目标检测时出现如下错误 error while loading shared libraries libcudart so 9 1 cannot open shared object file No such file 解决
v1

func size 179844 size data 7854BB174689C0DB2EEE7C23D2A0C6BD91EFF7DE6766930B1E5882849BFAF293 A7633CDAD850DC3F469E91E72199
丢掉Excel，手把手教你用Python做可视化，还能调节动画丝滑度

数据可视化动画还在用Excel做现在一个简单的Python包就能分分钟搞定而且生成的动画也足够丝滑效果是酱紫的这是一位专攻Python语言的程序员开发的安装包名叫Pynimate 目前可以直接通过PyPI安装使用使用指南想要使
Python＞＞SQL我只写复制粘贴的

介绍写sql字段太多核对编写起来太累了公司项目又紧一星期3000多行sql 要各种转换调用各种接口所以为了提高工作效率争取更多时间摸鱼我就用python了相对于其它重复的敲小伙伴我就直接飞起现向大家展示个人比较常用的编写
Redis高级特性：虚拟内存的使用技巧

首先说明下redis的虚拟内存与操作系统的虚拟内存不是一码事但是思路和目的都是相同的就是暂时把不经常访问的数据从内存交换到磁盘中从而腾出宝贵的内存空间用于其他需要访问的数据尤其是对于redis这样的内存数据库内存总是不够用的除了
五个方向告诉你如何运营好一个公众号！

来源新媒之家内容运营到底要怎么做呢本文作者结合经验从选题内容编辑目的传播五个方面浅谈了内容运营应该如何做希望对你有所帮助运营一个公众号很简单但运营好公众号却太难好与坏的评判关键在于内容内容越优质用户粘性自然越强口
“拍领导马屁，升职加薪无戏”

在知乎上看到这样一个提问怎么现在的年轻人都不愿意讨好领导了看完我忍不住笑了我刚入职场那会儿总能看到前辈透露给年轻人一些职场潜规则不懂揽活讨好领导没有进取心多分给你杂务那是领导考验你要学会忍耐这些经验拿到现在受到
ImportError: cannot import name 'ImmutableDict' from 'werkzeug'

ImportError cannot import name ImmutableDict from werkzeug 当出现这个错的时候可以使用下面这个命令降级安装就可以了 pip install upgrade werkzeug 0 1
C++算法之递归

在函数内部直接或间接调用自身的程序定义为递归定义递归可以解决一些问题如遍历树和搜索算法等问题递归通常把一个大型复杂的问题转化为一个规模较小的问题来求解大大减少了程序的代码量下面会介绍递归目录 1 条件 2 例 3 例题 3 1
慢sql优化

SQL 优化一般步骤通过慢查日志等定位那些执行效率较低的 SQL 语句 explain 分析SQL的执行计划需要重点关注 type rows filtered extra type 由上至下效率越来越高 ALL 全表扫描 index

慢sql优化

慢sql优化 的相关文章

随机推荐

热门标签

慢sql优化的相关文章