Hbase split的三种方式和split的过程

2023-11-01

Hbase split的三种方式和split的过程

在Hbase中split是一个很重要的功能，Hbase是通过把数据分配到一定数量的region来达到负载均衡的。一个table会被分配到一个或多个region中，这些region会被分配到一个或者多个regionServer中。在自动split策略中，当一个region达到一定的大小就会自动split成两个region。table在region中是按照row key来排序的，并且一个row key所对应的行只会存储在一个region中，这一点保证了Hbase的强一致性。

在一个region中有一个或多个stroe，每个stroe对应一个column families(列族)。一个store中包含一个memstore 和 0 或多个store files。每个column family 是分开存放和分开访问的。

Pre-splitting

当一个table刚被创建的时候，Hbase默认的分配一个region给table。也就是说这个时候，所有的读写请求都会访问到同一个regionServer的同一个region中，这个时候就达不到负载均衡的效果了，集群中的其他regionServer就可能会处于比较空闲的状态。解决这个问题可以用pre-splitting,在创建table的时候就配置好，生成多个region。

在table初始化的时候如果不配置的话，Hbase是不知道如何去split region的，因为Hbase不知道应该那个row key可以作为split的开始点。如果我们可以大概预测到row key的分布，我们可以使用pre-spliting来帮助我们提前split region。不过如果我们预测得不准确的话，还是可能导致某个region过热，被集中访问，不过还好我们还有auto-split。最好的办法就是首先预测split的切分点，做pre-splitting,然后后面让auto-split来处理后面的负载均衡。

Hbase自带了两种pre-split的算法，分别是 HexStringSplit 和 UniformSplit 。如果我们的row key是十六进制的字符串作为前缀的，就比较适合用HexStringSplit，作为pre-split的算法。例如，我们使用HexHash(prefix)作为row key的前缀，其中Hexhash为最终得到十六进制字符串的hash算法。我们也可以用我们自己的split算法。

在hbase shell 下：

hbase org.apache.hadoop.hbase.util.RegionSplitter pre_split_table HexStringSplit -c 10 -f f1

-c 10 的意思为，最终的region数目为10个；-f f1为创建一个那么为f1的 column family.

执行scan 'hbase:meta' 可以看到meta表中的，

只截取了meta表中的2个region的记录（一共10个region），分别是rowkey范围是 '' ''~19999999 和19999999~33333332的region。

我们也可以自定义切分点，例如在hbase shell下使用如下命令：

create 't1', 'f1', {SPLITS => ['10', '20', '30', '40']}

自动splitting

当一个reion达到一定的大小，他会自动split称两个region。如果我们的Hbase版本是0.94 ，那么默认的有三种自动split的策略，ConstantSizeRegionSplitPolicy,IncreasingToUpperBoundRegionSplitPolicy还有 KeyPrefixRegionSplitPolicy.

在0.94版本之前ConstantSizeRegionSplitPolicy 是默认和唯一的split策略。当某个store（对应一个column family）的大小大于配置值 ‘hbase.hregion.max.filesize’的时候（默认10G）region就会自动分裂。

而0.94版本中，IncreasingToUpperBoundRegionSplitPolicy 是默认的split策略。

这个策略中，最小的分裂大小和table的某个region server的region 个数有关，当store file的大小大于如下公式得出的值的时候就会split，公式如下

Min (R^2 * “hbase.hregion.memstore.flush.size”, “hbase.hregion.max.filesize”)  R为同一个table中在同一个region server中region的个数。

例如:

hbase.hregion.memstore.flush.size 默认值 128MB。

hbase.hregion.max.filesize默认值为10GB 。

如果初始时R=1,那么Min(128MB,10GB)=128MB,也就是说在第一个flush的时候就会触发分裂操作。

当R=2的时候Min(2*2*128MB,10GB)=512MB ,当某个store file大小达到512MB的时候，就会触发分裂。

如此类推，当R=9的时候，store file 达到10GB的时候就会分裂，也就是说当R>=9的时候，store file 达到10GB的时候就会分裂。

split 点都位于region中row key的中间点。

KeyPrefixRegionSplitPolicy可以保证相同的前缀的row保存在同一个region中。

指定rowkey前缀位数划分region，通过读取 KeyPrefixRegionSplitPolicy.prefix_length 属性，该属性为数字类型，表示前缀长度，在进行split时，按此长度对splitPoint进行截取。此种策略比较适合固定前缀的rowkey。当table中没有设置该属性，指定此策略效果等同与使用IncreasingToUpperBoundRegionSplitPolicy。

我们可以通过配置 hbase.regionserver.region.split.policy 来指定split策略，我们也可以写我们自己的split策略。

强制split

Hbase 允许客户端强制执行split,在hbase shell中执行以下命令：

 split 'forced_table', 'b' //其中forced_table 为要split的table , ‘b’ 为split 点

region splits 执行过程：

region server处理写请求的时候，会先写入memstore，当memstore 达到一定大小的时候，会写入磁盘成为一个store file。这个过程叫做 memstore flush。当store files 堆积到一定大小的时候，region server 会执行‘compact’操作，把他们合成一个大的文件。当每次执行完flush 或者compact操作，都会判断是否需要split。当发生split的时候，会生成两个region A 和 region B但是parent region数据file并不会发生复制等操作，而是region A 和region B 会有这些file的引用。这些引用文件会在下次发生compact操作的时候清理掉，并且当region中有引用文件的时候是不会再进行split操作的。这个地方需要注意一下，如果当region中存在引用文件的时候，而且写操作很频繁和集中，可能会出现region变得很大，但是却不split。因为写操作比较频繁和集中，但是没有均匀到每个引用文件上去，所以region一直存在引用文件，不能进行分裂，这篇文章讲到了这个情况，总结得挺好的。http://koven2049.iteye.com/blog/1199519

虽然split region操作是region server单独确定的，但是split过程必须和很多其他部件合作。region server 在split开始前和结束前通知master,并且需要更新.META.表，这样，客户端就能知道有新的region。在hdfs中重新排列目录结构和数据文件。split是一个复杂的操作。在split region的时候会记录当前执行的状态，当出错的时候，会根据状态进行回滚。下图表示split中，执行的过程。（红色线表示region server 或者master的操作，绿色线表示client的操作。）

1.region server 决定split region，第一步，region server在zookeeper中创建在

/hbase/region-in-transition/region-name 目录下，创建一个znode，状态为SPLITTING.

2.因为master有对 region-in-transition 的znode做监听，所以，mater的得知parent region需要split

3.region server 在hdfs的parent region的目录下创建一个名为“.splits”的子目录

4.region server 关闭parent region。强制flush缓存，并且在本地数据结构中标记region为下线状态。如果这个时候客户端刚好请求到parent region，会抛出NotServingRegionException。这时客户端会进行补偿性重试。

5.region server在.split 目录下分别为两个daughter region创建目录和必要的数据结构。然后创建两个引用文件指向parent regions的文件。

6.region server 在HDFS中，创建真正的region目录，并且把引用文件移到对应的目录下。

7.region server 发送一个put的请求到.META.表中，并且在.META.表中设置parent region为下线状态，并且在parent region对应的row中两个daughter region的信息。但是这个时候在.META.表中daughter region 还不是独立的row。这个时候如果client scan .META.表，会发现parent region正在split，但是client还看不到daughter region的信息。当这个put 成功之后，parent region split会被正在的执行。如果在 RPC 成功之前 region server 就失败了，master和下次打开parent region的region server 会清除关于这次split的脏状态。但是当RPC返回结果给到parent region ，即.META.成功更新之后，，region split的流程还会继续进行下去。相当于是个补偿机制，下次在打开这个parent region的时候会进行相应的清理操作。

8.region server 打开两个daughter region接受写操作。

9.region server 在.META.表中增加daughters A 和 B region的相关信息，在这以后，client就能发现这两个新的regions并且能发送请求到这两个新的region了。client本地具体有.META.表的缓存，当他们访问到parent region的时候，发现parent region下线了，就会重新访问.META.表获取最新的信息，并且更新本地缓存。

10.region server 更新 znode 的状态为SPLIT。master就能知道状态更新了，master的平衡机制会判断是否需要把daughter regions 分配到其他region server 中。

11.在split之后，meta和HDFS依然会有引用指向parent region. 当compact 操作发生在daughter regions中，会重写数据file，这个时候引用就会被逐渐的去掉。垃圾回收任务会定时检测daughter regions是否还有引用指向parent files，如果没有引用指向parent files的话，parent region 就会被删除。

参考连接：

http://hortonworks.com/blog/apache-hbase-region-splitting-and-merging/ Hbase split

http://hbase.apache.org/book/regions.arch.html Hbase 官方文档(region)

http://blog.javachen.com/2014/01/16/hbase-region-split-policy/ split策略

http://blackproof.iteye.com/blog/2037159 split源码解析

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

云数据库

Hbase split的三种方式和split的过程的相关文章

云数据库MySQL的选择

架构介绍 xff1a 云数据库MySQL支持四种架构 xff1a 高可用版金融版单节点高IO版基础版其中单节点高IO版的只用于只读版本对比 xff1a 企业级别 xff0c 刚刚好公司没有自己的服务器机房的时候可以做对比选择一般
Hadoop Core、HBase 、ZooKeeper

adoop HBase ZooKeeper三者关系与安装配置复制链接 qqjue 论坛徽章 18 电梯直达 1
Hypertable 快速安装，仅需上载一个RPM包，零编译

Hypertable 快速安装仅需上载一个RPM包零编译 Hypertable 快速安装仅需下载一个RPM包零编译本文采用单机安装 1 Hypertable 安装 Hypertable 的几种安装方式单机安装于单机采用本地
Hadoop 2.4.0+zookeeper3.4.6+hbase0.98.3分布式集群搭建

Hadoop 2 4 0 zookeeper3 4 6 hbase0 98 3分布式集群搭建博客分类 hadoop Ip 主机名程序进程 192 168 137 11 h1 Jdk Hadoop hbase Namenode DFSZ
分布式系统一致性研究,paxos算法

感谢eric的敦促感谢shuai的感召我尝试记录一点混乱的思考什么是分布式系统毋庸置疑 Internet和DNS是两个典型的成功的分布式系统那么分布式系统是不是就是计算机网络 1990年 Sun Microsystems 公司提
开源大数据利器汇总

所有分类 gt 服务器软件 gt 分布式云计算大数据开源大数据利器汇总开源 2015 05 21 21 00 00 发布您的评价 0 0 收藏 0收藏类别名称官
阿里云数据库配置IP白名单操作方法（以MySQL为例）

阿里云数据库RDS创建成功后首次连接访问RDS需要配置IP白名单在阿里云RDS控制台即可配置IP白名单阿里云百科来详细说下阿里云服务器RDS配置白名单的方法阿里云服务器配置IP白名单阿里云百科以MySQL云数据库为例 RDS My
Hbase split的三种方式和split的过程

Hbase split的三种方式和split的过程在Hbase中split是一个很重要的功能 Hbase是通过把数据分配到一定数量的region来达到负载均衡的一个table会被分配到一个或多个region中这些region会被分配到
Spanner vs. F1：谷歌两大数据管理利器的整体对比及关联 2016-05-22 20:36 757人阅读评论(0) 收藏举报目录(?)[+] http://www.csdn.net/a

Spanner vs F1 谷歌两大数据管理利器的整体对比及关联 2016 05 22 20 36 757人阅读评论 0 收藏举报目录 http www csdn net article 2013 10 10 2817138 f1 a
分布式系统设计的求生之路

作者作者 Simon 腾讯后台开发高级工程师链接 http wetest qq com lab view id 105 著作权归作者所有商业转载请联系WeTest获得授权非商业转载请注明出处分布式系统理念渐渐成为了后台架构技术的重
分布式数据库资料

Hadoop是很多组件的集合主要包括但不限于MapReduce HDFS HBase ZooKeeper MapReduce模仿了Google MapReduce HDFS模仿了Google File System HBase模仿了Goo
Hash算法的使用

Hash算法的使用标签默认分类发表时间 2011 08 06 06 35 作者 GliderX khsing 分享到出处 http hi baidu com gliderx 在对语料文本进行2 3元切分时需要借助hash表来获得切
分布式查找过程[HBase]Region location

HBase的table是该region切分的 client操作一个row的时候如何知道这个row对应的region是在哪台Region server上呢这里有个region location过程主要涉及到2张系统表 ROOT META
一、MapReduce已死，Spark称霸

一 MapReduce已死 Spark称霸 2014 09 17 11 20 王家林 Spark亚太研究院字号 T T 综合评级想读 35 在读 13 已读 2 品书斋鉴 0 已有50人发表书评 Spark亚太研究院系列丛书 Spark
Hypertable sql

First create a new namespace called Test CREATE NAMESPACE Test and make it the current namespace USE Test Now let s crea
Hypertable 简介一个 C++ 的Bigtable开源实现

1 Introduction 随着互联网技术的发展尤其是云计算平台的出现分布式应用程序需要处理大量的数据 PB级在一个或多个云计算平台中成千上万的计算主机如何保证数据的有效存储和组织为应用提供高效和可靠的访问接口并且保持良好的
分布式数据库需要考虑的(BigTable VS Dynamo)

分布式数据库需要考虑的 BigTable VS Dynamo 在设计评价分布式数据库的时候需要考虑一些最基本的特性我想这些特性可能包括 1 存储系统一种是类似BigTable将存储交给GFS去做 GFS会保证写入数据的完整另外一种是
hadoop初级到资深

hadoop初级到资深 2015 06 13 12 08 165人阅读评论 0 收藏举报分类 hadoop 3 1 hadoop是什么适合大数据的分布式存储与计算平台 2 hadoop版本有哪些 Apache 官方版本 1 1 2
1.1.3　Hadoop生态系统

1 1 3 Hadoop生态系统 2013 05 08 09 38 16 我来说两句收藏我要投稿本文所属图书 gt Hadoop技术内幕深入解析Hadoop Common和HDFS架构设计与实现原理 Hadoop技术内幕共两册分别
hadoop使用（五）

博客园闪存首页新随笔联系管理订阅随笔 247 文章 122 评论 571 hadoop使用五第1章引言 1 1 编写目的对关于hadoop的文档及资料进行进一步的整理 1 2 相关网站毋庸置疑 http hadoop

随机推荐

C++静态成员函数访问非静态成员变量的方法

静态成员函数不能访问非静态成员这是因为静态函数属于类而不是属于整个对象静态函数中的 member可能都没有分配内存静态成员函数没有隐含的this自变量所以它就无法访问自己类的非静态成员但我们在一个class中要使用CreateT
CentOS Linux 8的yum源失效解决

问题描述 CentOS Linux 8 yum源下载软件失败 yum update CentOS Linux 8 AppStream 14 B s 38 B 00 02 Error Failed to download metadata f
大一python考试知识点_Python复习知识点（一）

python简介 Python是一种解释型语言 Python使用缩进对齐组织代码执行所以没有缩进的代码都会在载入时自动执行数据类型整形 int 无限大浮点型 float 小数复数 complex 由实数和虚数组成 Python中
Unity3D-使用图层，锁定背景图片

如题添加场景背景图片需要锁定背景图片防止对背景进行误操作 1 选中背景图片选择属性中的Layer 添加一个自定义图层 2 切换background背景图的layer为刚刚新建的然后锁定新建的图层防止在Scene布局中选中这样在
Python之callable

callable object return True if the object argument appears callable False if not 可以检查一个对象是否是可调用的无论是直接调用或是通过apply 对于函数方
2023上岸华为od~经验分享

说说我感觉中的华为OD吧华为OD的面试流程包括机试性格测试 HR面试技术一面技术二面和主管面试我是一名非计算机专业非应届生的211本科生曾尝试跨考计算机但失败了然而我学习过计算机组成原理数据结构操作系统和计算机网
numpy学习笔记

1 numpy概述 1 Numerical Python 数值的Python 补充了Python语言所欠缺的数值计算能力 2 是其他数据分析及机器学习库的底层库 3 完全标准C语言实现运行效率充分优化 4 开源免费2 numpy的核心多
TDH中的Transporter

本文主要介绍Transwarp的etl工具 Transporter 本文依托于星环的官方文档通过一个简单的实例来让大家熟悉Transporter的使用关注专栏 Transwarp系列了解更多Transwarp的技术知识目录一 Tr
【Qt】富文本处理简单介绍

文章目录 Qt富文本处理富文本文档结构文本块QTextBlock 表格列表图片查找功能语法高亮与HTML 参考 Qt Creator快速入门第三版 Qt富文本处理富文本Rich Text 简单说就是在文档中可以使用多种格式
基于javaweb+mysql的汽车租赁系统(java+SSM+JSP+LayUI+echarts+mysql)

ssm汽车租赁系统 carRental 系统概要汽车租赁系统总共分为两个大的模块分别是系统模块和业务模块其中系统模块和业务模块底下又有其子模块功能模块一业务模块 1 客户管理客户列表客户分页和模糊查询客户添加修改删除
人工蜂群算法(ABC算法)

为了解决多变量函数优化问题Karaboga在2005年提出了人工蜂群算法ABC模型 1 蜜蜂采蜜机理蜜蜂是一种群居昆虫虽然单个昆虫的行为极其简单但是由单个简单的个体所组成的群体却表现出极其复杂的行为真实的蜜蜂种群能够在任何环境下以
WSL 2 installation is incomplete.【BUG解决】【Docker之云原生基石】

问题描述本文解决俩个Docker报错分别是 1 WSL 2 installation is incomplete 2 System InvalidOperationException Failed to set version to d
STM32F103驱动DHT11温湿度传感器(STM32MXcube，HAL)

第一步配置STM32MXbube S1 配置时钟模式为外部高速晶振外部低速晶振可选 S2 配置下载方式为SW ST LINK S3 配置定时器用于延时us级别函数 S4 配置串口用于输出数据 S5 配置GPIO S6 配置总线频率
python3: error while loading shared libraries: libpython3.7m.so.1.0: cannot open shared object file

报错详情 python3 error while loading shared libraries libpython3 7m so 1 0 cannot open shared object file No such file or di
maven 多模块模板

1 建立模板项目 settings demo core settings src main java com test core resources test java resources demo db settings src main
前端基础5——UI框架Layui

文章目录一基本使用二管理后台布局 2 1 导航栏 2 2 主题颜色 2 3 字体图标三栅格系统四卡片面板五面包屑六按钮七表单八上传文件九数据表格 9 1 table模块常用参数 9 2 创建表格 9 3
用pyecharts画一个饼图

pyecharts是一款Python的图表库可以用来绘制各种类型的图表包括饼图下面是一个简单的例子展示如何使用pyecharts来画一个饼图首先需要安装pyecharts pip install pyecharts i http
PAT乙级 1001 害死人不偿命的(3n+1)猜想 (15分)

PAT乙级 1001 害死人不偿命的 3n 1 猜想 15分卡拉兹 Callatz 猜想对任何一个正整数 n 如果它是偶数那么把它砍掉一半如果它是奇数那么把 3n 1 砍掉一半这样一直反复砍下去最后一定在某一步得到 n 1 卡
由“智障”到“智能”到未来，从汽车AI语音交互看语言交互技术高山在哪？

文胡杨胡皓来源智能相对论 ID aixdlun 今天天气怎么样今日是晴天气温17到22度东北风3到4级那周五呢周五距今天还有2天重复唤醒答非所问这不是人工智能是人工智障智障这是大部分智能网联汽车用户对语音交互的
Hbase split的三种方式和split的过程

Hbase split的三种方式和split的过程在Hbase中split是一个很重要的功能 Hbase是通过把数据分配到一定数量的region来达到负载均衡的一个table会被分配到一个或多个region中这些region会被分配到

Hbase split的三种方式和split的过程

Hbase split的三种方式和split的过程

Hbase split的三种方式和split的过程 的相关文章

随机推荐

热门标签

Hbase split的三种方式和split的过程的相关文章