高性能Mysql——分区表详解

2023-11-01

分表和分区

分表
MySQL 的分表是真正的分表,一张表分成很多表后,每一个小表都是完整的一张表,都对应三个文件,一个.MYD数据文件,.MYI索引文件,.frm表结构文件。

分区
一张大表进行分区后,它还是一张表,不会变成多张表,但是存放数据的区块变多了。

分表和分区的区别

实现方式上
a) mysql的分表是真正的分表,一张表分成很多表后,每一个小表都是完正的一张表,都对应三个文件,一个 .MYD数据文件,.MYI索引文件,.frm表结构文件

[root@BlackGhost test]# ls |grep user    
    alluser.MRG    
    alluser.frm    
    user1.MYD    
    user1.MYI    
    user1.frm    
    user2.MYD    
    user2.MYI    
    user2.frm  

简单说明一下,上面的分表呢是利用了merge存储引擎(分表的一种),alluser是总表,下面有二个分表,user1,user2。他们二个都是独立的表,取数据的时候,我们可以通过总表来取。这里总表是没有.MYD,.MYI这二个文件的,也就是说,总表他不是一张表,没有数据,数据都放在分表里面

我们来看看.MRG到底是什么东西

[root@BlackGhost test]# cat alluser.MRG |more    
  user1    
  user2    
  #INSERT_METHOD=LAST  

从上面我们可以看出,alluser.MRG里面就存了一些分表的关系,以及插入数据的方式。可以把总表理解成一个外壳,或者是联接池。

b) 分区不一样,一张大表进行分区后,他还是一张表,不会变成二张表,但是他存放数据的区块变多了。

[root@BlackGhost test]# ls |grep user  
user#P#p1.MYD    
user#P#p1.MYI    
user#P#p2.MYD    
usera#P#p2.MYI    
user.frm    
user.par 

我们都知道一张表对应三个文件.MYD,.MYI,.frm。分区呢根据一定的规则把数据文件和索引文件进行了分割,还多出了一个.par文件,打开.par文件后你可以看出他记录了,这张表的分区信息,根分表中的.MRG有点像。分区后,还是一张,而不是多张表。

数据处理上
a) 分表后,数据都是存放在分表里,总表只是一个外壳,存取数据发生在一个一个的分表里面。看下面的例子: select * from alluser where id='12'表面上看,是对表alluser进行操作的,其实不是的。是对alluser里面的分表进行了操作。

b) 分区呢,不存在分表的概念,分区只不过把存放数据的文件分成了许多小块,分区后的表呢,还是一张表。数据处理还是由自己来完成。

提高性能上
a) 分表后,单表的并发能力提高了,磁盘I/O性能也提高了。并发能力为什么提高了呢,因为查寻一次所花的时间变短了,如果出现高并发的话,总表可以根据不同的查询,将并发压力分到不同的小表里面。磁盘I/O性能怎么搞高了呢,本来一个非常大的.MYD文件现在也分摊到各个小表的.MYD中去了。

b) mysql提出了分区的概念,我觉得就想突破磁盘I/O瓶颈,想提高磁盘的读写能力,来增加mysql性能。 在这一点上,分区和分表的测重点不同,分表重点是存取数据时,如何提高mysql并发能力上;而分区呢,如何突破磁盘的读写能力,从而达到提高mysql性能的目的。

实现的难易度上
a) 分表的方法有很多,用merge来分表,是最简单的一种方式。这种方式根分区难易度差不多,并且对程序代码来说可以做到透明的。如果是用其他分表方式就比分区麻烦了。
b) 分区实现是比较简单的,建立分区表,根建平常的表没什么区别,并且对开代码端来说是透明的。

分表和分区联系呢

  1. 都能提高mysql的性高,在高并发状态下都有一个良好的表面。
  2. 分表和分区不矛盾,可以相互配合的,对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式(如果merge这种分表方式,不能和分区配合的话,可以用其他的分表试),访问量不大,但是表数据很多的表,我们可以采取分区的方式等。

分区表分区方式

HASH分区

HASH分区的一大特点就是可以更平均的将数据分散到各个分区中,不会像RANGE分区一样数据可能会集中在一个分区中。HASH分区简单来说是基于取模运算结果进行的分区。HASH分区分为常规分区和线性分区。但是常规分区在分区管理上过于麻烦,所以我们一般使用线性分区。

CREATE TABLE C (
     ID INT NOT NULL,
     NAME  VARCHAR(20),
     SEX VARCHAR(20)
     )
     PARTITION BY LINEAR HASH (ID) PARTITIONS 4;

KEY分区
KEY分区和HASH分区类似,不过KEY分区只支持服务器提供的HASH函数,HASH分区只支持整数,KEY分区支持除BLOB ,Text类型外的其他类型作为分区键。

RANGE分区
按照RANGE分区的表示利用取值范围将数据分成区,区间是连续且不能相互叠加的。
RANGE分区一般用作日志归档,并按照时间来进行分区

CREATE TABLE B(
 ID  INT NOT NULL,
 NAME VARCHAR(30),
 JOB VARCHAR(30),
 TIME DATE NOT NULL DEFAULT '1998-01-01'
 )
 PARTITION BY RANGE(YEAR(TIME))(
 PARTITION P0 VALUES LESS THAN(1999),
 PARTITION P1 VALUES LESS THAN(2000),
 PARTITION P2 VALUES LESS THAN(2001)
 );

LIST分区
LIST分区和RANGE分区比较相似,不过LIST是以一个集合的形式建立分区的。使用LIST分区建立表的操作如下:

Columns分区
Columns分区是mysql5.5以后加入的,用来解决mysql5.1以前的RANGE和LIST分区只支持整数分区,造成的需要进行函数换算得到的整数值。Columns分区包括RANGE Columns和LIST Columns。同时支持整数,时间,字符串三大类型。
利用Columns分区,我们上边RANGE的按时间进行分区的表就可以不添加时间转换函数。具体操作如下:

CREATE TABLE B(
 ID  INT NOT NULL,
 NAME VARCHAR(30),
 JOB VARCHAR(30),
 TIME DATE NOT NULL DEFAULT '1998-01-01'
 )
 PARTITION BY RANGE COLUMNS(TIME)(
 PARTITION P0 VALUES LESS THAN('1999'),
 PARTITION P1 VALUES LESS THAN('2000'),
 PARTITION P2 VALUES LESS THAN('2001')
 );

分区管理

删除分区:

ALTER TABLE A DROP PARTITION P2;

以上语句从表A中删除了P2分区,删除分区后,分区内的数据也会被删除。
在RANGE分区中,再次加入原属于分区P2的数据时,会插入到P3分区内。但在LIST分区中,由于删除的是一个指定的集合,所以再次插入属于此集合的数据时会因找不到分区而出错。

加入分区:

ALTER TABLE A ADD PARTITION (PARTITION P3 VALUES LESS THAN (40));

以上语句在A中添加了p3分区,数值为小于40。在RANGE分区中,只能在分区列表的最大一端添加分区。但在LIST中可以添加在任意地方,不过新建的分区不能包括已有分区包含的元素

转移分区(归档)

ALTER TABLE A exchange PARTITION P1 WITH TABLE ARCH_A;

另外归档的ARCH_A表可以使用归档引擎archieve,归档引擎的好处是比INNODB所占的空间更小,但是只允许读操作,不允许写操作。

ALTER TABLE ARCH_A ENGINE=ARCHIEVE

分区表注意事项

  1. 结合业务场景选择分区方式。
  2. 避免跨分区查询。
  3. 对分区表进行查询最好在WHERE从句中包含分区键(避免跨分区扫描)。
  4. 具有主键或者唯一索引的表,主键或唯一索引必须是分区键的一部分。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

高性能Mysql——分区表详解 的相关文章

随机推荐

  • Qt 开发应用--颜色选择器ColorCopy

    Qt 开发应用 颜色选择器ColorCopy Qt颜色选择器 提供10大类100种颜色可选 点击即为复制 随处 Ctrl V 粘贴使用 提供有 Red Pink Purple Indigo Blue Green Yellow Orange
  • 进程和线程以及协程

    1 基本概念 进程和线程 进程 是系统资源分配的基本单位 实现了操作系统的并发 线程 是CPU调度的基本单位 实现了进程内的并发执行 并发是把任务在不同的时间点交给处理器进行处理 在同一时间点 任务并不会同时运行 并行是把每一个任务分配给每
  • 个人经济学管理tips

    摘录一些观点 作为茶余饭后的谈资 不清楚自己的热爱和目标时 每天把头脑最清醒的1小时留给自己 学习 思考 3个小时陪伴家人 剩下的时间 谁给钱多就给谁干 一居室好过养老年金险 房产保值升值 租金跑得赢通胀 一套刚需 一套改善 一套投资 三套
  • Win10系统下编译FFmpeg

    1 使用git下载源码 git clone git source ffmpeg org ffmpeg git ffmpeg 2 FFmpeg在windows平台编译需要使用MinGW w64来编译 单独使用MinGW w64比较麻烦 推荐使
  • pip镜像安装 python 安装库

    pip install openpyxl i https mirrors aliyun com pypi simple pip 本身更新 pip install upgrade pip vvv 上面是阿里云的 我用了特别快 语法 安装pip
  • 专利情况的基本了解

    专利 目标专利的拆解 提前关键词 构建检索式 适当的进行补充检 拆解已有技术的技术特征 申请书 说明书 权利要求 摘要 附图 优先权请求 发明 实用新型和外观设计 发明专利 实用新型专利和外观设计专利 发明专利 针对产品 方法或者产品 方法
  • c语言中两个有序数组合并,C语言算法:有序数组合并-2020-08-21

    方法 就是同时遍历两个数组 通过比大小 组成一个新数组 数组参数最好带上一个长度参数 防止越界 代码 合并数组 其中a b都是从小到大有序排列的数组 void mergeList int a int aLen int b int bLen
  • 高德地图api 地理编码(地址-->坐标)geocoder.getLocation在官方可以测试出结果,下载代码到本地却用不了 问题解决

    问题 高德地图api 地理编码 地址 gt 坐标 功能 通过输入 地址信息 得到 经纬度信息 geocoder getLocation在官方可以测试出结果 下载代码到本地却用不了 官方示例测试 可以从地址得到坐标 下载官方代码本地运行却出不
  • 最全的雅思8000词汇pdf_雅思听力场景分类词汇汇总,听力提分先搞定它!

    很多烤鸭来和哥聊天 聊听力的时候 大部分都会出现以下对话内容 为了让大家更加身临其境 我就做的趣味性点了哈 一 定 要 看 完 对 大家都是拿完资料就溜 一有问题就找哥谈心 不夸哥就算了 还不拿赞出来给哥 哼 抱住坚强的自己 擦干眼泪给你们
  • 2023 K8s 认证工程师 CKA 考题分析和题库练习(下)

    目录 10 考核知识 检查可用节点数量 题目内容 题目内容中文解释 做题解答 11 考核知识 一个 Pod 封装多个容器 题目内容 题目内容中文解释 官方文档搜索关键字 pod 编辑做题解答 12 考核知识 持久卷 PersistentVo
  • python列表+元组+字典+集合

    声明 本人的所有博客皆为个人笔记 作为个人知识索引使用 因此在叙述上存在逻辑不通顺 跨度大等问题 希望理解 分享出来仅供大家学习翻阅 若有错误希望指出 感谢 Python列表 序列中的每个元素都分配一个数字 它的位置 或索引 第一个索引是0
  • java设置多个数据源

    1 设置config properties文件 设置两个数据库连接 2 设置spring context xml文件 定义名为testDataSource和dataSource两个连接
  • LeetCode刷题顺序(新手入门)

    本刷题策略为leetcode官方的新手村策略 跟着主页官方的新手村策略刷题 按照每天刷三简单题或两中等题或一难题的速度刷题 每天预计花费1 5h 下面的顺序是探索卡中的顺序 数组 分为三部分 1 做好初始定义 2 运用基础算法思想 3 双索
  • 蛋白质组学数据的归一化/标准化处理

    1 前言 目的 调整由于技术 如处理 上样 预分 仪器等造成的样本间误差 这实际上是一种数据缩放的方法 一般在一个表达矩阵中 会涉及到多个样本 其表达量差异比较大 不能直接进行比较 比如某个样本表达量很大 在总体中就会占据绝对领导地位 这样
  • 邮件钓鱼的防守策略

    一 攻击背景 在历年的实战攻防演练中 人的漏洞是网络安全最大的脆弱点 而钓鱼攻击就是从内部攻破堡垒至关重要的手段 攻击者通过伪装成可信来源发送虚假邮件 诱导接收者点击恶意链接 提供敏感信息或执行恶意附件 从而获取机密信息或入侵系统 因此 在
  • MATLAB 之 基本概述

    文章目录 一 MATLAB 主要功能 1 数值计算功能 2 符号计算功能 3 绘图功能 4 程序设计语言功能 5 工具箱的扩展功能 二 MATLAB 操作界面 1 主窗口 2 命令行窗口 3 当前文件夹窗口 4 工作区窗口 5 搜索路径 三
  • [leetcode 周赛 149] 1154 一年中的第几天

    目录 1154 Day of the Year 一年中的第几天 描述 思路 代码实现 1154 Day of the Year 一年中的第几天 描述 给你一个按 YYYY MM DD 格式表示日期的字符串 date 请你计算并返回该日期是当
  • 【error】Lock wait timeout exceeded; try restarting transaction(mysql)事务锁

    目录 1 报错信息 2 解决方案 2 1 方案一 2 2 方案二 2 3 方案三 3 补充说明 3 1 三张表字段说明 原文链接 1 报错信息 背景 在做更新操作时 电脑重启了 重新运行mysql语句时报以下错误 报错信息 Lock wai
  • SQL中分组的一些用法group_concat

    分组查询 后面一篇文章我们将介绍MySQL的聚合函数 https blog csdn net qq 41453285 article details 88318318 group by通常与聚合函数放在一起使用 分组查询允许把数据分为多个逻
  • 高性能Mysql——分区表详解

    文章目录 分表和分区 分表和分区的区别 分表和分区联系呢 分区表分区方式 分区管理 分区表注意事项 分表和分区 分表 MySQL 的分表是真正的分表 一张表分成很多表后 每一个小表都是完整的一张表 都对应三个文件 一个 MYD数据文件 MY