Sql server 千万级大数据SQL查询优化的几点建议

2023-11-09

1.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。

2.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，如：select id from t where num is null可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：select id from t where num=0

3.应尽量避免在 where 子句中使用!=或<>操作符，否则引擎将放弃使用索引而进行全表扫描。

4.应尽量避免在 where 子句中使用or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如：select id from t where num=10 or num=20可以这样查询：select id from t where num=10 union all select id from t where num=20

5.in 和 not in 也要慎用，否则会导致全表扫描，如：select id from t where num in(1,2,3) 对于连续的数值，能用 between 就不要用 in 了：select id from t where num between 1 and 3

6.下面的查询也将导致全表扫描：select id from t where name like ‘%李%’若要提高效率，可以考虑全文检索。

7. 如果在 where 子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描：select id from t where num=@num可以改为强制查询使用索引：select id from t with(index(索引名)) where num=@num

8.应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如：select id from t where num/2=100应改为:select id from t where num=100*2

9.应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：select id from t where substring(name,1,3)=’abc’ ，name以abc开头的id应改为:

select id from t where name like ‘abc%’

10.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引。

11.在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。

12.不要写一些没有意义的查询，如需要生成一个空表结构：select col1,col2 into #t from t where 1=0

这类代码不会返回任何结果集，但是会消耗系统资源的，应改成这样：
create table #t(…)

13.很多时候用 exists 代替 in 是一个好的选择：select num from a where num in(select num from b)

用下面的语句替换：
select num from a where exists(select 1 from b where num=a.num)

14.并不是所有索引对查询都有效，SQL是根据表中数据来进行查询优化的，当索引列有大量数据重复时，SQL查询可能不会去利用索引，如一表中有字段sex，male、female几乎各一半，那么即使在sex上建了索引也对查询效率起不了作用。

15. 索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。

16. 应尽可能的避免更新 clustered 索引数据列，因为 clustered 索引数据列的顺序就是表记录的物理存储顺序，一旦该列值改变将导致整个表记录的顺序的调整，会耗费相当大的资源。若应用系统需要频繁更新 clustered 索引数据列，那么需要考虑是否应将该索引建为 clustered 索引。

17.尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符，而对于数字型而言只需要比较一次就够了。

18.尽可能的使用 varchar/nvarchar 代替 char/nchar ，因为首先变长字段存储空间小，可以节省存储空间，其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些。

19.任何地方都不要使用 select * from t ，用具体的字段列表代替“*”，不要返回用不到的任何字段。

20.尽量使用表变量来代替临时表。如果表变量包含大量数据，请注意索引非常有限（只有主键索引）。

21.避免频繁创建和删除临时表，以减少系统表资源的消耗。

22.临时表并不是不可使用，适当地使用它们可以使某些例程更有效，例如，当需要重复引用大型表或常用表中的某个数据集时。但是，对于一次性事件，最好使用导出表。

23.在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert。

24.如果使用到了临时表，在存储过程的最后务必将所有的临时表显式删除，先 truncate table ，然后 drop table ，这样可以避免系统表的较长时间锁定。

25.尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万行，那么就应该考虑改写。

26.使用基于游标的方法或临时表方法之前，应先寻找基于集的解决方案来解决问题，基于集的方法通常更有效。

27. 与临时表一样，游标并不是不可使用。对小型数据集使用 FAST_FORWARD 游标通常要优于其他逐行处理方法，尤其是在必须引用几个表才能获得所需的数据时。在结果集中包括“合计”的例程通常要比使用游标执行的速度快。如果开发时间允许，基于游标的方法和基于集的方法都可以尝试一下，看哪一种方法的效果更好。

28.在所有的存储过程和触发器的开始处设置 SET NOCOUNT ON ，在结束时设置 SET NOCOUNT OFF 。无需在执行存储过程和触发器的每个语句后向客户端发送DONE_IN_PROC 消息。

29.尽量避免大事务操作，提高系统并发能力。

30.尽量避免向客户端返回大数据量，若数据量过大，应该考虑相应需求是否合理。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Sql server 千万级大数据SQL查询优化的几点建议的相关文章

慢思维大脑：SOP流程的心理学背景

1 背景介绍慢思维大脑 SOP流程的心理学背景慢思维是指人类大脑在处理复杂问题做出重要决策时所采用的思考方式它与快速自动的快思维相对主要通过以下几种方式表现深入思考慢思维会让人类大脑深入思考问题的本质从而找出更深层次的解决
AI大模型应用入门实战与进阶：从AI模型应用到商业转化

1 背景介绍人工智能 AI 已经成为当今世界最热门的技术话题之一其在各个领域的应用也不断拓展大型AI模型是人工智能领域的核心它们在自然语言处理图像识别语音识别等方面的表现力和性能都有着重要的作用然而如何将这些大型AI模型应用
流程管理的未来：人工智能如何改变业务运行

1 背景介绍流程管理是企业在实现业务目标时所采取的一系列有序连贯的活动它涉及到许多领域如生产销售研发财务等随着企业规模的扩大和市场竞争的激烈流程管理的复杂性也不断增加人工智能 AI 技术的发展为流程管理提供了新的机遇有
人工智能与模式识别的社会影响与应用

1 背景介绍人工智能 Artificial Intelligence AI 和模式识别 Pattern Recognition PR 是计算机科学领域的两个重要分支人工智能研究如何让计算机具有类似人类智能的能力如学习推理理解自然语
线性代数在数据挖掘中的应用

1 背景介绍线性代数是数学的一个分支主要研究的是线性方程组和向量的相关概念和方法在数据挖掘领域线性代数的应用非常广泛包括数据处理特征提取模型训练等方面本文将从以下几个方面进行阐述背景介绍核心概念与联系核心算法原理和具体
6 - 数据备份与恢复｜innobackupex

数据备份与恢复 innobackupex 数据备份与恢复数据备份相关概念物理备份与恢复逻辑备份推荐使用binlog日志文件实现对数据的时时备份使用日志恢复数据
spark相关

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言一 pandas是什么二使用步骤 1 引入库 2 读入数据总结前言提示这里可以添加本文要记录的大概内容例如随着人工智能的不断发展机器学习这门
【Mysql】InnoDB 引擎中的页目录

一页目录和槽现在知道记录在页中按照主键大小顺序串成了单链表那么我使用主键查询的时候最顺其自然的办法肯定是从第一条记录也就是 Infrimum 记录开始一直向后找只要存在总会找到这种在数据量少的时候还好说一旦数据多了遍历耗
【计算机毕业设计】病房管理系统

当下如果还依然使用纸质文档来记录并且管理相关信息可能会出现很多问题比如原始文件的丢失因为采用纸质文档很容易受潮或者怕火不容易备份需要花费大量的人员和资金来管理用纸质文档存储的信息最重要的是数据出现问题寻找起来很麻烦并且修改
【计算机毕业设计】出租车管理系统

现代经济快节奏发展以及不断完善升级的信息化技术让传统数据信息的管理升级为软件存储归纳集中处理数据信息的管理方式本出租车管理系统就是在这样的大环境下诞生其可以帮助管理者在短时间内处理完毕庞大的数据信息使用这种软件工具可以帮助管理人
【计算机毕业设计】航空信息管理系统

传统信息的管理大部分依赖于管理人员的手工登记与管理然而随着近些年信息技术的迅猛发展让许多比较老套的信息管理模式进行了更新迭代飞机票信息因为其管理内容繁杂管理数量繁多导致手工进行处理不能满足广大用户的需求因此就应运而生出相应的航空
扬帆证券：突发利好！外资重大转变，A股收到多份喜报

A股财报季利好音讯密集传来 1月16日晚间 A股多家上市公司披露了成绩预告其间成绩预增扭亏等利好公告数量占比超80 其间普瑞眼科公告估计2023年净赢利同比添加高达1163 98 1285 51 别的多家上市公司公告称估计20
深入了解 Python MongoDB 查询：find 和 find_one 方法完全解析

在 MongoDB 中我们使用 find 和 find one 方法来在集合中查找数据就像在MySQL数据库中使用 SELECT 语句来在表中查找数据一样查找单个文档要从MongoDB的集合中选择数据我们可以使用 find one
【计算机毕业设计】北工国际健身俱乐部

本系统为会员而设计制作北工国际健身俱乐部旨在实现北工国际健身俱乐部智能化现代化管理本北工国际健身俱乐部管理自动化系统的开发和研制的最终目的是将北工国际健身俱乐部的运作模式从手工记录数据转变为网络信息查询管理从而为现代管理人员的使用提
【计算机毕业设计】OA公文发文管理系统_xtv98

近年来人们的生活方式以网络为主题不断进化 OA公文发文管理就是其中的一部分现在无论是大型的还是小型的网站都随处可见不知不觉中已经成为我们生活中不可或缺的存在随着社会的发展除了对系统的需求外我们还要促进经济发展提高工作效率
Mysql中设置只允许指定ip能连接访问(可视化工具的方式)

场景 Mysql中怎样设置指定ip远程访问连接 Mysql中怎样设置指定ip远程访问连接 navicat for mysql 设置只有某个ip可以远程链接 CSDN博客前面设置root账户指定ip能连接访问是通过命令行的方式如果通过可视
毕业设计：基于python人脸识别系统 LBPH算法 sqlite数据库（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
温室气体排放更敏感的模型（即更高的平衡气候敏感性（ECS））在数年到数十年时间尺度上也具有更高的温度变化（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
对中国手机作恶的谷歌，印度CEO先后向三星和苹果低头求饶

日前苹果与谷歌宣布合作发布了 Find My Device Network 的草案旨在规范蓝牙追踪器的使用在以往苹果和谷歌的生态形成鲜明的壁垒各走各路如今双方竟然达成合作发生了什么事首先是谷歌安卓系统的市场份额显著下滑数年来

随机推荐

小蜜团队万字长文《读后简略概括》

1 对话系统主要分为三类闲聊型任务导向型问答型闲聊型就是瞎聊想聊啥就聊啥任务导向型考虑多轮对话根据对话的不同状态和槽位值进行回复策略的选择问答型一问一答识别询问者的意图从知识库中选取答案进行返回 2 任务导向型
perl编写之前的一些习惯细节

变量环境变量的传递文件文件目录文件名路径的解析操作命令行参数调用shell命令变量的debug 主体结构的划分编写简单package的模板脚本执行的关键信息保存在日志里代码整理下述信息仅供自己编写新脚本之前的回顾内容
web前端html+css基础项目实例
【C++笔记】数据结构栈、堆，内存占用中栈区、堆区的区别和理解

在计算机领域堆栈是一个不容忽视的概念我们编写的C语言程序基本上都要用到但对于很多的初学着来说堆栈是一个很模糊的概念堆栈一种数据结构一个在程序运行时用于存放的地方这可能是很多初学者的认识因为我曾经就是这么想的和汇编语言中的堆
matlab机器人工具箱（1）

1 机器人工具箱 2 Figure的基本组成 figure和axes的概念在实际绘图中一张图可能会有好几个子图这时axes表示生成的各个小图而figure则是绘制各图的大画布所以在之后设置图形属性时有时用到gca Axes 有
Python爬虫自动刷“问卷网”问卷（不锁IP）

大学很多项目都会要求征集问卷但很难找到渠道迅速收集大量样本如果是自己通过问卷网设计的问卷可以在设置不锁IP 默认情况下用本方法快速刷取大量样本且能保证问卷结果满足自身项目需求即使没有了解过爬虫稍有python基础看过本程序后
C++后台开发之我见

C 后台开发之我见 2017 2 6 工作也快两年了偶然看到自己以前写过的一些技术博客发现自己自毕业后一直没有更新过自己的技术博客趁现在是刚过完春节快要回公司工作之际谈谈我个人对后台开发的一些个人见解希望能够对在校的学生或者刚刚接
Python爬虫从入门到精通:今日作业_requests基础04_爬取药监总局中的企业详情数据_Python涛哥

今日作业爬取药监总局中的企业详情数据爬取药监总局中的企业详情数据 url http scxk nmpa gov cn 81 xk 需求将首页中每一家企业详情页对应的数据每一家企业详情页对应的数据将前5页企业的数据爬取即可难点用
scipy.sparse使用简例

CDIMC Net 1 中有个对整个数据集求 kNN 图的函数 get kNNgraph2 2 是用 dense 的 numpy ndarray 存的空间复杂度 O n 2 O n 2
HBuilder 制表符转换成空格

在学习BootStrap时看到编码规范 by mdo 里面有一条关于编辑器配置的用两个空格代替制表符 soft tab 即用空格代表 tab 符避免常见的代码不一致和差异然后找到了 HBuilder 制表符转换成空格的方法具体
Linux环境SVN用户权限修改

1 查看SVN配置文件位置系统环境 Linux 3 10 0 使用命令行查看SVN进程 ps ef grep svn 通过进程信息可以看到svnserve conf存放的目录 svnserve conf是svn配置文件 vim 目录 sv
OpenHarmony与HarmonyOS联系与区别

目录 1 背景 2 OpenHarmony 3 HarmonyOS 4 鸿蒙生态 5 OpenHarmony与HarmonyOS的技术上实现区别 1 语言支持 2 SDK 的不同 3 运行调测方式不同 4 对APK的兼容性不同 5 包含关系
Android CheckBox 多选以及反选清除已选项

前言疫情随着这个春天的到来已悄然离去你还记得填写问卷调查的那个时候么话不多少这篇文章要实现的就是一个问卷调查列表即 Listview 嵌套 Listview 实现 checkbox 多选以及反选清除已选项正文思路就是定义一个
web服务选择lighttpd，采用fcgi组件技术扩展处理业务层

目录一简介fcgi web和web服务器间数据传输的桥梁 2 二源码编译配置ARM Lighttpd Fastcgi C 3 1 交叉编译源文件都从官网下载 Fcgi lighttpd zlib 3 2 配置服务器server do
VMware上安装虚拟机的一些注意事项和VMware tools的安装

VMware上安装虚拟机 VMware是windows上的一个应用程序它可以虚拟出一个物理主机 pc机在该虚拟机上可以安装linux系统相关安装流程csdn上参考过多这里不再赘述虚拟机安装位置要求 1 不能和VMware放在同一个
为AI而生的数据库：Milvus详解及实战

1 向量数据库 1 1 向量数据库的由来在当今数字化时代人工智能AI正迅速改变着我们的生活和工作方式从智能助手到自动驾驶汽车 AI正在成为各行各业的创新引擎然而这种AI的崛起也带来了一个关键的挑战如何有效地处理和分析越来越丰富和
QSetting读取ini配置文件失败

今天碰到一个问题 QSettings读取配置文件失败同样的代码用5 13版本编译后读取正常用5 7版本编译读取不到排除了文件编码格式的问题最终问题解决了原因没有找到解决方法是试错试出来的解决方法是把相对路径换成了绝对路径问题
常见中间件漏洞复现

目录 Tomcat 1 Tomcat 文件上传 CVE 2017 12615 2 Tomcat 代码执行 CVE 2020 1938 3 Tomcat弱口令登录获取后台 Weblogic 4 Weblogic反序列化漏洞获取服务器权限 CV
Vuex4（Module）+Typescript的基本使用

一 Vuex4介绍 vuex 是一个专为 Vue js 应用程序开发的状态管理模式库它采用集中式存储管理应用的所有组件的状态并以相应的规则保证状态以一种可预测的方式发生变化 vuex包括五大核心概念分别是State Getter Mu
Sql server 千万级大数据SQL查询优化的几点建议

1 对查询进行优化应尽量避免全表扫描首先应考虑在 where 及 order by 涉及的列上建立索引 2 应尽量避免在 where 子句中对字段进行 null 值判断否则将导致引擎放弃使用索引而进行全表扫描如 select id

Sql server 千万级大数据SQL查询优化的几点建议

Sql server 千万级大数据SQL查询优化的几点建议 的相关文章

随机推荐

热门标签

Sql server 千万级大数据SQL查询优化的几点建议的相关文章