MySQL 数据库性能优化之SQL优化

2023-05-16

作者：Sky.Jian | 可以任意转载, 但转载时务必以超链接形式标明文章原始出处和作者信息及版权声明
链接：http://isky000.com/database/mysql-performance-tuning-sql |

del.icio.us | Twitter it |
Hosted On DreamHost 可以通过我的折扣码 iMySQLer 获得优惠折扣

接着上一篇 MySQL 数据库性能优化之索引优化，这是 MySQL数据库性能优化专题 系列的第四篇文章：MySQL 数据库性能优化之SQL优化

有人反馈之前几篇文章过于理论缺少实际操作细节，这篇文章就多一些可操作性的内容吧。

注：这篇文章是以 MySQL 为背景，很多内容同时适用于其他关系型数据库，需要有一些索引知识为基础

优化目标
1. 减少 IO 次数
  IO永远是数据库最容易瓶颈的地方，这是由数据库的职责所决定的，大部分数据库操作中超过90%的时间都是 IO 操作所占用的，减少 IO 次数是 SQL 优化中需要第一优先考虑，当然，也是收效最明显的优化手段。
2. 降低 CPU 计算
  除了 IO 瓶颈之外，SQL优化中需要考虑的就是 CPU 运算量的优化了。order by, group by,distinct … 都是消耗 CPU 的大户（这些操作基本上都是 CPU 处理内存中的数据比较运算）。当我们的 IO 优化做到一定阶段之后，降低 CPU 计算也就成为了我们 SQL 优化的重要目标
优化方法
1. 改变 SQL 执行计划
  明确了优化目标之后，我们需要确定达到我们目标的方法。对于 SQL 语句来说，达到上述2个目标的方法其实只有一个，那就是改变 SQL 的执行计划，让他尽量“少走弯路”，尽量通过各种“捷径”来找到我们需要的数据，以达到 “减少 IO 次数” 和 “降低 CPU 计算” 的目标
常见误区
1. count(1)和count(primary_key) 优于 count(*)
  很多人为了统计记录条数，就使用 count(1) 和 count(primary_key) 而不是 count(*) ，他们认为这样性能更好，其实这是一个误区。对于有些场景，这样做可能性能会更差，应为数据库对 count(*) 计数操作做了一些特别的优化。
2. count(column) 和 count(*) 是一样的
  这个误区甚至在很多的资深工程师或者是 DBA 中都普遍存在，很多人都会认为这是理所当然的。实际上，count(column) 和 count(*) 是一个完全不一样的操作，所代表的意义也完全不一样。
  count(column) 是表示结果集中有多少个column字段不为空的记录
  count(*) 是表示整个结果集有多少条记录
3. select a,b from … 比 select a,b,c from … 可以让数据库访问更少的数据量
  这个误区主要存在于大量的开发人员中，主要原因是对数据库的存储原理不是太了解。
  实际上，大多数关系型数据库都是按照行（row）的方式存储，而数据存取操作都是以一个固定大小的IO单元（被称作 block 或者 page）为单位，一般为4KB，8KB… 大多数时候，每个IO单元中存储了多行，每行都是存储了该行的所有字段（lob等特殊类型字段除外）。
  所以，我们是取一个字段还是多个字段，实际上数据库在表中需要访问的数据量其实是一样的。
  当然，也有例外情况，那就是我们的这个查询在索引中就可以完成，也就是说当只取 a,b两个字段的时候，不需要回表，而c这个字段不在使用的索引中，需要回表取得其数据。在这样的情况下，二者的IO量会有较大差异。
4. order by 一定需要排序操作
  我们知道索引数据实际上是有序的，如果我们的需要的数据和某个索引的顺序一致，而且我们的查询又通过这个索引来执行，那么数据库一般会省略排序操作，而直接将数据返回，因为数据库知道数据已经满足我们的排序需求了。
  实际上，利用索引来优化有排序需求的 SQL，是一个非常重要的优化手段
  延伸阅读：MySQL ORDER BY 的实现分析，MySQL 中 GROUP BY 基本实现原理以及 MySQL DISTINCT 的基本实现原理这3篇文章中有更为深入的分析，尤其是第一篇
5. 执行计划中有 filesort 就会进行磁盘文件排序
  有这个误区其实并不能怪我们，而是因为 MySQL 开发者在用词方面的问题。filesort 是我们在使用 explain 命令查看一条 SQL 的执行计划的时候可能会看到在 “Extra” 一列显示的信息。
  实际上，只要一条 SQL 语句需要进行排序操作，都会显示“Using filesort”，这并不表示就会有文件排序操作。
  延伸阅读：理解 MySQL Explain 命令输出中的filesort，我在这里有更为详细的介绍
基本原则
1. 尽量少 join
  MySQL 的优势在于简单，但这在某些方面其实也是其劣势。MySQL 优化器效率高，但是由于其统计信息的量有限，优化器工作过程出现偏差的可能性也就更多。对于复杂的多表 Join，一方面由于其优化器受限，再者在 Join 这方面所下的功夫还不够，所以性能表现离 Oracle 等关系型数据库前辈还是有一定距离。但如果是简单的单表查询，这一差距就会极小甚至在有些场景下要优于这些数据库前辈。
2. 尽量少排序
  排序操作会消耗较多的 CPU 资源，所以减少排序可以在缓存命中率高等 IO 能力足够的场景下会较大影响 SQL 的响应时间。
  对于MySQL来说，减少排序有多种办法，比如：
  - 上面误区中提到的通过利用索引来排序的方式进行优化
  - 减少参与排序的记录条数
  - 非必要不对数据进行排序
  - …
3. 尽量避免 select *
  很多人看到这一点后觉得比较难理解，上面不是在误区中刚刚说 select 子句中字段的多少并不会影响到读取的数据吗？
  是的，大多数时候并不会影响到 IO 量，但是当我们还存在 order by 操作的时候，select 子句中的字段多少会在很大程度上影响到我们的排序效率，这一点可以通过我之前一篇介绍 MySQL ORDER BY 的实现分析的文章中有较为详细的介绍。
  此外，上面误区中不是也说了，只是大多数时候是不会影响到 IO 量，当我们的查询结果仅仅只需要在索引中就能找到的时候，还是会极大减少 IO 量的。
4. 尽量用 join 代替子查询
  虽然 Join 性能并不佳，但是和 MySQL 的子查询比起来还是有非常大的性能优势。MySQL 的子查询执行计划一直存在较大的问题，虽然这个问题已经存在多年，但是到目前已经发布的所有稳定版本中都普遍存在，一直没有太大改善。虽然官方也在很早就承认这一问题，并且承诺尽快解决，但是至少到目前为止我们还没有看到哪一个版本较好的解决了这一问题。
5. 尽量少 or
  当 where 子句中存在多个条件以“或”并存的时候，MySQL 的优化器并没有很好的解决其执行计划优化问题，再加上 MySQL 特有的 SQL 与 Storage 分层架构方式，造成了其性能比较低下，很多时候使用 union all 或者是union（必要的时候）的方式来代替“or”会得到更好的效果。
6. 尽量用 union all 代替 union
  union 和 union all 的差异主要是前者需要将两个（或者多个）结果集合并后再进行唯一性过滤操作，这就会涉及到排序，增加大量的 CPU 运算，加大资源消耗及延迟。所以当我们可以确认不可能出现重复结果集或者不在乎重复结果集的时候，尽量使用 union all 而不是 union。
7. 尽量早过滤
  这一优化策略其实最常见于索引的优化设计中（将过滤性更好的字段放得更靠前）。
  在 SQL 编写中同样可以使用这一原则来优化一些 Join 的 SQL。比如我们在多个表进行分页数据查询的时候，我们最好是能够在一个表上先过滤好数据分好页，然后再用分好页的结果集与另外的表 Join，这样可以尽可能多的减少不必要的 IO 操作，大大节省 IO 操作所消耗的时间。
8. 避免类型转换
  这里所说的“类型转换”是指 where 子句中出现 column 字段的类型和传入的参数类型不一致的时候发生的类型转换：
  - 人为在column_name 上通过转换函数进行转换
    直接导致 MySQL（实际上其他数据库也会有同样的问题）无法使用索引，如果非要转换，应该在传入的参数上进行转换
  - 由数据库自己进行转换
    如果我们传入的数据类型和字段类型不一致，同时我们又没有做任何类型转换处理，MySQL 可能会自己对我们的数据进行类型转换操作，也可能不进行处理而交由存储引擎去处理，这样一来，就会出现索引无法使用的情况而造成执行计划问题。
9. 优先优化高并发的 SQL，而不是执行频率低某些“大”SQL
  对于破坏性来说，高并发的 SQL 总是会比低频率的来得大，因为高并发的 SQL 一旦出现问题，甚至不会给我们任何喘息的机会就会将系统压跨。而对于一些虽然需要消耗大量 IO 而且响应很慢的 SQL，由于频率低，即使遇到，最多就是让整个系统响应慢一点，但至少可能撑一会儿，让我们有缓冲的机会。
10. 从全局出发优化，而不是片面调整
  SQL 优化不能是单独针对某一个进行，而应充分考虑系统中所有的 SQL，尤其是在通过调整索引优化 SQL 的执行计划的时候，千万不能顾此失彼，因小失大。
11. 尽可能对每一条运行在数据库中的SQL进行 explain
  优化 SQL，需要做到心中有数，知道 SQL 的执行计划才能判断是否有优化余地，才能判断是否存在执行计划问题。在对数据库中运行的 SQL 进行了一段时间的优化之后，很明显的问题 SQL 可能已经很少了，大多都需要去发掘，这时候就需要进行大量的 explain 操作收集执行计划，并判断是否需要进行优化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

sql

数据库性能优化之

MySQL 数据库性能优化之SQL优化的相关文章

使用连接池后如何处理过多的并发连接？

Scenario 假设您有一个拥有大量流量的网站或应用程序即使使用数据库连接池性能也会受到真正的打击站点应用程序甚至可能崩溃因为并发连接太多 Question 人们有什么选择来处理这个问题我的想法我在想有这个问题的人可以创建多
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
无法在 mysql-apt-config [Ubuntu 14.04] 中选择“确定”

我使用的是 Ubuntu 14 04 sudo apt get update总是给我这个选项来配置 mysql apt config 我尝试选择版本按 tab gt 在确定上突出显示的键按 Enter 但没有任何反应它再次返回并突
如何为我的整个 Node.js 应用程序使用相同的 MySQL 连接？

我有一个app js 我从那里运行我的整个应用程序在 app js 内部我require许多文件中都有代码对于每个文件我都这样做 var mysql require mysql var mclient mysql createCon
PDO语法错误

我在一个项目中使用 PDO 但提交时出现语法错误这是我的代码
插入记录后如何从SQL Server获取Identity值

我在数据库中添加一条记录identity价值我想在插入后获取身份值我不想通过存储过程来做到这一点这是我的代码 SQLString INSERT INTO myTable SQLString Cal1 Cal2 Cal3 Cal4 SQ
获取mysql中逗号分隔行中不同值的计数

一个表 Jobs 有 2 列 JobId 城市当我们保存工作时工作位置可能是多个城市如下所示 JobId City 1 New York 2 New York Ohio Virginia 3 New York Virginia 我如何
更改mysql数据库表中的日期格式

大家早上好只是一个简单的问题在我现有的 MySql 数据库中我几乎没有包含日期的列目前这些是年月日格式但现在我需要将其全部更改为年月日格式我试过了select date format curdate d m Y 但它不
连接到 OpenShift (Redhat Paas) mysql 实例

我正在尝试将我的 C 应用程序与 openshift 数据库连接但我得到了这个例外conn Open Eccezione gt MySql Data MySqlClient MySqlException 0x80004005 Unable
postgresql 不同的不工作

我使用以下代码从数据库获取值但是当我编写这段代码时测试看看问题出在哪里我注意到查询没有从数据库中获取不同的值这是查询 select distinct ca id as id acc name as accName pIsu name
SQL Server使用in关键字传递字符串数组查询

我认为 IN 子句不能接受具有多个值的绑定参数 Oracle 不能需要几分钟查询是 declare setting varchar max set setting Sales Entry Grid Cursor Customer Man
解析错误：语法错误，意外的 T_RETURN [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 遇到这个问
可以有一个带有可变列的表吗？

这可能是一个愚蠢的问题但这里是是否可以创建一个能够包含具有可变列数和自定义列名称的行的动态表我浏览过 EAV 建模但看起来很沉重现实生活中的例子可能是这样的假设我有一个客户登记册但每个客户可能需要输入不同的信息根据您要输入的
处理与不同相关实体的一对多的正确模式

我有一个 C 项目我使用实体框架作为 ORM 我有一个User 可以向多家银行付款每家银行都是一个独立的实体并且每家银行都由不同的字段描述问题是一User可以没有或有很多不同的Banks 我不太确定如何对此进行建模临时解决方案是
MySQL - 从数字列表中选择在表的 id 字段中没有对应项的数字

我有一个数字列表例如 2 4 5 6 7 我有一个表 foos 带有 foos ID 包括 1 2 3 4 8 9 我想获取我的号码列表并在我的表的 ID 字段中找到那些没有对应项的号码实现此目的的一种方法是创建一个表格栏在 ID
显示和随机化 php 数组

我有一个显示结果的数组如下所示 Array 0 gt 71 1 gt 56 2 gt 64 3 gt 82 4 gt 90 5 gt 80 6 gt 65 7 gt 62 8 gt 14 9 gt 3 我的代码是 while row my
无法与重定向器建立连接。确保“sql browser”服务正在运行

所以我尝试这个 sql server 2012 由于这个错误我无法打开任何 ssis 包无法与重定向器建立连接确保 sql browser 服务正在运行我的 Sql 浏览器肯定正在运行我尝试在本地服务本地系统和网络下更改它仍然没
更改表添加列并在同一条件 IF 语句中更新新列

我正在尝试添加列并在同一 if 语句中更新它 BEGIN TRAN IF NOT EXISTS SELECT 1 FROM sys columns WHERE Name N Code AND Object ID Object ID N Te
针对约 225 万行的单表选择查询的优化技术？

我有一个在 InnoDB 引擎上运行的 MySQL 表名为squares大约有 2 250 000 行表结构如下 squares square id int 7 unsigned NOT NULL ref coord lat doubl
总和和不同不会改变结果？

我是一个新手试图在这里解决这个问题到目前为止还没有运气非常感谢任何帮助 Select Distinct AB agency no ab branch no AS AGENCY BRANCH count AB agency no ab

随机推荐

无病呻吟4：关于简历，以及自我否定之否定

http blog csdn net hello world2001 article details 7229417 终于到了很多人喜欢的骂人环节了不知道各位看官 xff0c 在自己的简历上花了多少时间几个小时 xff0c 还是几天 x
6. 混在2002 - 欢乐的世界杯

http blog csdn net hello world2001 article details 7229422 写混在日本公司的日子前 xff0c 先简单回忆下2002年幸福的上半年 xff0c 以及随后我作出的一个影响我至今的决定吧
无病呻吟6：F4，圈子，与硬通货

http blog csdn net hello world2001 article details 7229429 F4是个小圈子 xff0c 当然不是台湾那几个奶油小生 xff0c 而是这个日本公司本人所在部门内的一个小团体其中的成员
7. 路在何方：第一次选择

http blog csdn net hello world2001 article details 7229430 2009年那次跳槽的时候 xff0c 不止一次的听到猎头和面试公司的人对我说过 xff0c 你的工作背景非常漂亮 xff0
9. 混在2002：和闷骚男的“同居”生活 - 1

http blog csdn net hello world2001 article details 7229434 说点开心的事情 xff0c 我当时的两个室友跟这两个人成为死党 xff0c 都是因为合租的缘故两个人一个叫老灵通 x
10. 混在2002：和闷骚男的“同居”生活 - 2

http blog csdn net hello world2001 article details 7248920 继续说当时的室友 xff0c 这两人都是比较有想法 xff0c 有点小浪漫 xff0c 敢想敢为 xff0c 又比较有毅力
11. 挑战500强管理职位前的苦逼生活

http blog csdn net hello world2001 article details 7351962 至于我当时的状态 xff0c 则是在迷茫中四处寻找突破口在一番折腾后 xff0c 我终于定下了一个宏大的目标 xff0c
第二次跳槽：意料之外的结局 - 上

http blog csdn net hello world2001 article details 7352015 2006年的跳槽是我所有跳槽经历中耗费时间最长 xff0c 最痛苦 xff0c 也最纠结的一次既有正沉浸在即将成功中的喜
14：第二次跳槽：意料之外的结局 - 下

http blog csdn net hello world2001 article details 7352028 这也是一个出乎我意料之外的机会在接到这个电话的时候 xff0c 我正跟Accenture IBM HP这些公司打得火热
推荐一个全新硬件/嵌入式刷题网站！免费！好用！

越来越多的人才从转码变成了转硬件 xff0c 但是转岗过程中会遇到一些问题 xff0c 比如 xff1a 对学习路线不清晰找不到专业的练习题企业真题搜寻困难 xff0c 不知道笔面试考察那些内容基础编程是一个计算机专业的必备技能 xf
my.cnf

http wenku baidu com view d10a7ea20029bd64783e2cdd html My cnf配置选项 mysqld程序目录和文件 basedir 61 path 使用给定目录作为根目录安装目录 chara
mysql 修改root密码的方法

如果是刚安装成功后 xff0c 密码为空 xff0c 修改密码方法为 mysqladmin u root password 39 11111 39 密码不为空 xff0c 修改密码方法有两种 xff1a 1 mysqladmin u roo
mysqldump用法小结

1 备份单个数据库普通备份 xff1a root 64 A server mysqldump u root p 39 111111 39 newjueqi default gt tmp newjueqi default sql root
MySQL数据库性能优化之缓存参数优化

作者 xff1a Sky Jian 可以任意转载但转载时务必以超链接形式标明文章原始出处和作者信息及版权声明链接 xff1a http isky000 com database mysql perfornamce tuning
magento中的启用https

在Magento的后台管理中 General gt web gt secure 有安全链接的设置 xff0c 所谓安全链接 xff0c 是指启用了https 协议的链接百度百科中关于https的介绍 xff08 http baike ba
解决magento中guest页面cookie保存时间过短问题

在magento新的企业版11 xff0c 有个新的功能退货 xff08 RMA xff09 xff0c 不仅能退货 xff0c 还能以guest的身份查看订单的各种信息 xff0c 但在IE下有个问题 xff1a cookies的保存时间
指定magento后台使用的theme

众所周知 xff0c magneto是能后台配置中指定前台使用的是哪个theme xff0c 但后台呢 xff1f 指定后台的theme xff0c 需要在添加如下的配置 xff1a lt config gt lt stores gt lt
MySQL 数据库性能优化之表结构优化

作者 xff1a Sky Jian 可以任意转载但转载时务必以超链接形式标明文章原始出处和作者信息及版权声明链接 xff1a http isky000 com database mysql perfornamce tuning
MySQL 数据库性能优化之索引优化

作者 xff1a Sky Jian 可以任意转载但转载时务必以超链接形式标明文章原始出处和作者信息及版权声明链接 xff1a http isky000 com database mysql performance tuning
MySQL 数据库性能优化之SQL优化

作者 xff1a Sky Jian 可以任意转载但转载时务必以超链接形式标明文章原始出处和作者信息及版权声明链接 xff1a http isky000 com database mysql performance tuning

MySQL 数据库性能优化之SQL优化

MySQL 数据库性能优化之SQL优化 的相关文章

随机推荐

热门标签

MySQL 数据库性能优化之SQL优化的相关文章