分布式查找过程[HBase]Region location

2023-11-08

HBase的table是该region切分的，client操作一个row的时候，如何知道这个row对应的region是在哪台Region server上呢？这里有个region location过程。主要涉及到2张系统表，-ROOT-，.META.。其结构见图

在zookeeper的/hbase/root-region-server节点中存着-ROOT-表所在的Region Server地址。

-ROOT-表的一个row代表着META的一个region信息，其key的结构是META表名,META表Region的startkey，RegionId。其value的主要保存regioninfo和server信息。ROOT表不能split

.META.表的一个row代表着用户表的一个region信息，其key的结构是其实就是用户表的regionName，用户表名，startKey，RegionId。其value同样保存着regioninfo和server信息。META表可以split，但是一个region默认有128M，可以存上亿个用户表的region信息，所以一般不会split。

其查找过程如下：

1.通过zk getData拿-ROOT-表的location

2.RPC -ROOT-表的rs，getClosestRowBefore，拿row对应的meta表的region location

3.RPC .META.表的某一个region，拿该row在真实table所在的region location

4.RPC对应region

region location需要3次网络IO，为了提升性能，client会cache数据。

LocationCache是一个2级Map，第一级的key是tableName的hash值，第二级的key是starRow，用SoftValueSortedMap包装了TreeMap实现，用软引用实现cache，内存不够时才会回收。Cache里存在META表和用户表的region location信息。

其代码实现如下，0.94版本：

HConnectionManager locateRegion入口

Java代码

private HRegionLocation locateRegion(final byte [] tableName,
final byte [] row, boolean useCache)
throws IOException {
.......
//检查下都应的zkTracker是否启动
ensureZookeeperTrackers();
//如果是-ROOT-表，则通过zk节点/hbase/root-region-server获取-ROOT-表所在的Location
if (Bytes.equals(tableName, HConstants.ROOT_TABLE_NAME)) {
try {
//通过zk的getData接口拿节点数据，此处会等待节点数据就位或者超时
ServerName servername = this.rootRegionTracker.waitRootRegionLocation(this.rpcTimeout);
LOG.debug("Looked up root region location, connection=" + this +
"; serverName=" + ((servername == null)? "": servername.toString()));
if (servername == null) return null;
//返回一个拼装的HRegionLocation，因为-ROOT-表只有一个region，而且不会split
return new HRegionLocation(HRegionInfo.ROOT_REGIONINFO,
servername.getHostname(), servername.getPort());
} catch (InterruptedException e) {
Thread.currentThread().interrupt();
return null;
}
}
//如果是.META.表，则请求.META.表，这里的row其实就是请求row拼装的regionName，类似test,key1,99999999999999
//如果没命中cache，则继续请求-ROOT-表，拿到这个row对应的.META.表的region location
else if (Bytes.equals(tableName, HConstants.META_TABLE_NAME)) {
return locateRegionInMeta(HConstants.ROOT_TABLE_NAME, tableName, row,
useCache, metaRegionLock);
}
//如果是用户表，则请求用户表，这里的row就是key1
//如果没命中cache，则请求.META.表，获取该row对应的region location
else {
// Region not in the cache - have to go to the meta RS
return locateRegionInMeta(HConstants.META_TABLE_NAME, tableName, row,
useCache, userRegionLock);
}
}

locateRegionInMeta方法

Java代码

private HRegionLocation locateRegionInMeta(final byte [] parentTable,
final byte [] tableName, final byte [] row, boolean useCache,
Object regionLockObject)
throws IOException {
HRegionLocation location;
// If we are supposed to be using the cache, look in the cache to see if
// we already have the region.
//先读cache，cache没有再往上找
//注意如果rowkey的region locatin变化了，RPC的时候会失败，客户端做重试的时候useCache是false
if (useCache) {
location = getCachedLocation(tableName, row);
if (location != null) {
return location;
}
}
// build the key of the meta region we should be looking for.
// the extra 9's on the end are necessary to allow "exact" matches
// without knowing the precise region names.
//先拼一个想查找的key，类似于test,key1,99999999999999
byte [] metaKey = HRegionInfo.createRegionName(tableName, row,
HConstants.NINES, false);
//默认重试10次
for (int tries = 0; true; tries++) {
//找不到
if (tries >= numRetries) {
throw new NoServerForRegionException("Unable to find region for "
+ Bytes.toStringBinary(row) + " after " + numRetries + " tries.");
}
HRegionLocation metaLocation = null;
try {
// locate the root or meta region
//递归查找parentTable
metaLocation = locateRegion(parentTable, metaKey);
// If null still, go around again.
if (metaLocation == null) continue;
//找到对应Region server地址之后，可以发起RPC请求了。
//这里先生成一个RPC Proxy对象，具体RPC分析见后文
HRegionInterface server =
getHRegionConnection(metaLocation.getHostname(), metaLocation.getPort());
Result regionInfoRow = null;
// This block guards against two threads trying to load the meta
// region at the same time. The first will load the meta region and
// the second will use the value that the first one found.
synchronized (regionLockObject) {
// If the parent table is META, we may want to pre-fetch some
// region info into the global region cache for this table.
//如果parentTable是.META.表，则预先获取.META.的一些数据，默认10条
if (Bytes.equals(parentTable, HConstants.META_TABLE_NAME) &&
(getRegionCachePrefetch(tableName)) ) {
prefetchRegionCache(tableName, row);
}
// Check the cache again for a hit in case some other thread made the
// same query while we were waiting on the lock. If not supposed to
// be using the cache, delete any existing cached location so it won't
// interfere.
if (useCache) {
location = getCachedLocation(tableName, row);
if (location != null) {
return location;
}
}
//如果不使用cache，则清除之，比如row对应的region发生了分裂，用老的location启动rpc时会抛异常，此时通过useCache=fasle重新
//寻址，并把老的cache删掉
else {
deleteCachedLocation(tableName, row);
}
// Query the root or meta region for the location of the meta region
//发起RPC请求，获取<=该key的行
regionInfoRow = server.getClosestRowBefore(
metaLocation.getRegionInfo().getRegionName(), metaKey,
HConstants.CATALOG_FAMILY);
}
if (regionInfoRow == null) {
throw new TableNotFoundException(Bytes.toString(tableName));
}
//region信息，做校验，region会处于不稳定状态
byte [] value = regionInfoRow.getValue(HConstants.CATALOG_FAMILY,
HConstants.REGIONINFO_QUALIFIER);
if (value == null || value.length == 0) {
throw new IOException("HRegionInfo was null or empty in " +
Bytes.toString(parentTable) + ", row=" + regionInfoRow);
}
// convert the row result into the HRegionLocation we need!
//反序列化
HRegionInfo regionInfo = (HRegionInfo) Writables.getWritable(
value, new HRegionInfo());
// possible we got a region of a different table...
//一些校验
if (!Bytes.equals(regionInfo.getTableName(), tableName)) {
throw new TableNotFoundException(
"Table '" + Bytes.toString(tableName) + "' was not found, got: " +
Bytes.toString(regionInfo.getTableName()) + ".");
}
if (regionInfo.isSplit()) {
throw new RegionOfflineException("the only available region for" +
" the required row is a split parent," +
" the daughters should be online soon: " +
regionInfo.getRegionNameAsString());
}
if (regionInfo.isOffline()) {
throw new RegionOfflineException("the region is offline, could" +
" be caused by a disable table call: " +
regionInfo.getRegionNameAsString());
}
//该region的server location
value = regionInfoRow.getValue(HConstants.CATALOG_FAMILY,
HConstants.SERVER_QUALIFIER);
String hostAndPort = "";
if (value != null) {
hostAndPort = Bytes.toString(value);
}
......
// Instantiate the location
String hostname = Addressing.parseHostname(hostAndPort);
int port = Addressing.parsePort(hostAndPort);
location = new HRegionLocation(regionInfo, hostname, port);
//cache之
cacheLocation(tableName, location);
return location;
} catch (TableNotFoundException e) {
// if we got this error, probably means the table just plain doesn't
// exist. rethrow the error immediately. this should always be coming
// from the HTable constructor.
throw e;
} catch (IOException e) {
if (e instanceof RemoteException) {
e = RemoteExceptionHandler.decodeRemoteException((RemoteException) e);
}
if (tries < numRetries - 1) {
.......
} else {
throw e;
}
// Only relocate the parent region if necessary
//网络有问题，则重新找
if(!(e instanceof RegionOfflineException ||
e instanceof NoServerForRegionException)) {
relocateRegion(parentTable, metaKey);
}
}
//重试次数越多，sleep越长，interrupt则退出重试
try{
Thread.sleep(ConnectionUtils.getPauseTime(this.pause, tries));
} catch (InterruptedException e) {
Thread.currentThread().interrupt();
throw new IOException("Giving up trying to location region in " +
"meta: thread is interrupted.");
}
}
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

云数据库

分布式查找过程[HBase]Region location 的相关文章

云数据库MySQL的选择

架构介绍 xff1a 云数据库MySQL支持四种架构 xff1a 高可用版金融版单节点高IO版基础版其中单节点高IO版的只用于只读版本对比 xff1a 企业级别 xff0c 刚刚好公司没有自己的服务器机房的时候可以做对比选择一般
淘宝TDDL数据库分库分表

淘宝TDDL数据库分库分表 2014 06 04 23 18 3334人阅读评论 0 收藏举报分类数据库 1 分库分表而且分库规则非常灵活 2 主键生成策略目前TDDL提供的id生成主要还是依托数据库来进行的 oracle可以直
Hadoop Core、HBase 、ZooKeeper

adoop HBase ZooKeeper三者关系与安装配置复制链接 qqjue 论坛徽章 18 电梯直达 1
Hypertable 快速安装，仅需上载一个RPM包，零编译

Hypertable 快速安装仅需上载一个RPM包零编译 Hypertable 快速安装仅需下载一个RPM包零编译本文采用单机安装 1 Hypertable 安装 Hypertable 的几种安装方式单机安装于单机采用本地
Hadoop 2.4.0+zookeeper3.4.6+hbase0.98.3分布式集群搭建

Hadoop 2 4 0 zookeeper3 4 6 hbase0 98 3分布式集群搭建博客分类 hadoop Ip 主机名程序进程 192 168 137 11 h1 Jdk Hadoop hbase Namenode DFSZ
阿里云数据库配置IP白名单操作方法（以MySQL为例）

阿里云数据库RDS创建成功后首次连接访问RDS需要配置IP白名单在阿里云RDS控制台即可配置IP白名单阿里云百科来详细说下阿里云服务器RDS配置白名单的方法阿里云服务器配置IP白名单阿里云百科以MySQL云数据库为例 RDS My
Hbase split的三种方式和split的过程

Hbase split的三种方式和split的过程在Hbase中split是一个很重要的功能 Hbase是通过把数据分配到一定数量的region来达到负载均衡的一个table会被分配到一个或多个region中这些region会被分配到
Spanner vs. F1：谷歌两大数据管理利器的整体对比及关联 2016-05-22 20:36 757人阅读评论(0) 收藏举报目录(?)[+] http://www.csdn.net/a

Spanner vs F1 谷歌两大数据管理利器的整体对比及关联 2016 05 22 20 36 757人阅读评论 0 收藏举报目录 http www csdn net article 2013 10 10 2817138 f1 a
分布式系统设计的求生之路

作者作者 Simon 腾讯后台开发高级工程师链接 http wetest qq com lab view id 105 著作权归作者所有商业转载请联系WeTest获得授权非商业转载请注明出处分布式系统理念渐渐成为了后台架构技术的重
分布式数据库资料

Hadoop是很多组件的集合主要包括但不限于MapReduce HDFS HBase ZooKeeper MapReduce模仿了Google MapReduce HDFS模仿了Google File System HBase模仿了Goo
Hash算法的使用

Hash算法的使用标签默认分类发表时间 2011 08 06 06 35 作者 GliderX khsing 分享到出处 http hi baidu com gliderx 在对语料文本进行2 3元切分时需要借助hash表来获得切
分布式查找过程[HBase]Region location

HBase的table是该region切分的 client操作一个row的时候如何知道这个row对应的region是在哪台Region server上呢这里有个region location过程主要涉及到2张系统表 ROOT META
一、MapReduce已死，Spark称霸

一 MapReduce已死 Spark称霸 2014 09 17 11 20 王家林 Spark亚太研究院字号 T T 综合评级想读 35 在读 13 已读 2 品书斋鉴 0 已有50人发表书评 Spark亚太研究院系列丛书 Spark
Hypertable sql

First create a new namespace called Test CREATE NAMESPACE Test and make it the current namespace USE Test Now let s crea
HBase介绍（列存储）

HBase介绍列存储 2013 11 26 23 25 5871人阅读评论 2 收藏举报分类云存储 2 Hbase简介 started by chad walters and jim 2006 11 G release paper
Hypertable 简介一个 C++ 的Bigtable开源实现

1 Introduction 随着互联网技术的发展尤其是云计算平台的出现分布式应用程序需要处理大量的数据 PB级在一个或多个云计算平台中成千上万的计算主机如何保证数据的有效存储和组织为应用提供高效和可靠的访问接口并且保持良好的
分布式数据库需要考虑的(BigTable VS Dynamo)

分布式数据库需要考虑的 BigTable VS Dynamo 在设计评价分布式数据库的时候需要考虑一些最基本的特性我想这些特性可能包括 1 存储系统一种是类似BigTable将存储交给GFS去做 GFS会保证写入数据的完整另外一种是
1.1.3　Hadoop生态系统

1 1 3 Hadoop生态系统 2013 05 08 09 38 16 我来说两句收藏我要投稿本文所属图书 gt Hadoop技术内幕深入解析Hadoop Common和HDFS架构设计与实现原理 Hadoop技术内幕共两册分别
云数据库知识学习——概述

一云计算是云数据库兴起的基础云计算是分布式计算并行计算效用计算网络存储虚拟化负载均衡等计算机和网络技术发展融合的产物云计算是由一系列可以动态升级和被虚拟化的资源组成的用户无需掌握云计算的技术只要通过网络就可以访问这些资源
hadoop使用（五）

博客园闪存首页新随笔联系管理订阅随笔 247 文章 122 评论 571 hadoop使用五第1章引言 1 1 编写目的对关于hadoop的文档及资料进行进一步的整理 1 2 相关网站毋庸置疑 http hadoop

随机推荐

页面性能优化，如何减少回流

在开发时不可避免的会遇到性能优化的问题怎么做性能才会更好说到页面性能优化我们就谈谈两个概念重绘和回流 1 什么是重绘什么是回流重绘当渲染树中的一些元素需要更新属性而这些属性只是影响元素的外观风格而不会影响布局的操作比如
windows搭建WEB打印机

文章目录 Web Print 添加一台虚拟打印机名称为 CS Print 发布到AD域客户端们都能够通过访问 https print www chinaskills com 查看打印机证书由CSK2021 ROOTCA进行签署颁发 1
skywalking和jpa冲突

1 报错 org springframework security authentication InternalAuthenticationServiceException No MethodInvocation found Check
【C语言】通讯录的动态存储版本

目录一前言二为什么要动态存储 1 动态存储的作用 2动态与静态存储的区别三动态存储的实现 1 通讯录容量 2 初始化通讯录 3 增加减少通讯录成员增加通讯录成员判断及实现扩容函数的实现减少通讯录成员判断及实现减容函数的
iOS开发常见错误代码对照表---真机调试常见错误及解决方案

iOS真机调试常见错误及解决方案地址https developer apple com library ios technotes tn2250 index html apple ref doc uid DTS40009933 CH1 T
11下滑半个屏幕_看完小米11发布会，2万粉购买小米，雷军给苹果的致命一击

2020年12月28日小米11发布会正式召开这次的小米很聪明很聪慧让我们看到了对用户满满的诚意首先就是跑分对于大部分用户而言手机的跑分就代表着手机的性能而小米搭配的高通骁龙888芯片就让我们有了全新的认知最终Antutu综
依赖注入的几种方式

获取bean对象也称为对象装配对象注入依赖注入对象装配的实现方法有3种 1 属性注入 2 构造方法注入 3 Setter注入再讲本节内容之前我们先来提两个传参的方式首先呢上节的文章里边我们提到了五大类注解和 Bean注解
STM32F407ZGTE6利用模拟PWM驱动42步进电机（与pwm驱动led闪烁一样）

前言 lmf老师来帮我解决42步进电机预转不转的问题利用引脚模拟pwm波形驱动42步进电机成功找到原因还顺便给我留下了另一种驱动思路直接引脚驱动解决问题 42电机原地不动的原因是线接触不良采用杜邦线拼接拟解决方案重新换
C++程序设计期末考试抱佛脚

大一上的今早的计算机概论压中一道大题我惊呆了先放点我看学友的复习总结 if嵌套配对书p45 内嵌平衡语句 if if else else if else else总是与写在它前面的最靠近的尚未与其他else配对的if配对其他
栈破坏下crash的分析方法

在众多的coredump中有一类crash调试起来是最麻烦的那就是栈被破坏导致的函数调用回溯结构破坏引发的coredump 本文主要讲讲这一类crash的成因原理以及调试方法 1 SMTC show me the code 首先
数据包络分析--保证域方法（assurance region method）附python代码以及案例

Data envelopment analysis Assurance region method 保证域方法 Data envelopment analysis Assurance region method model AR 有效 py
ARIMA时间序列预测MATLAB代码模板（无需调试）

小白专用直接改成自己的数据运行即可完成预测并画图我的数据在评论区自取 clear clc 小白专用需要自己输入仅在有这种注释的地方改成自己的数据即可一共有4个地方 DD readmatrix B xlsx 这里输入自己的单序列数据
云服务的应用场景，为什么要用云服务（学习心得）

降低IT支出成本云服务器无需硬件设施及机房兼具优质扩容能力门户网站社区网站电商网站免除硬件配置与升级的忧虑专注于服务功能的开发大大减少网站IT基础设施成本及运维成本弹性扩展云服务器当服务器需求不固定预先估计不准确时
基于动态规划的强化学习方法

quad quad 基于动态规划的强化学习方法 quad 动态规划 dynamic programming 是程序设计算法中非常重要的内容能够高效解决一些经典问题
VScode搭建Vue环境（2）

VScode搭建Vue环境 2 目录 1 全局安装下载vue cli 2 创建项目 1 命令行创建 2 GUI创建 3 如果无法在终端打开请看下方图片方法1 方法2 在上一篇文章中我们下载安装并配置好了nodejs 并可以在全局环境中下
jQuery的Ajax实例（附完整代码）

目录写在前边什么是Ajax Ajax基本结构实例实例1 实例2 小结写在前边作为一个前端刚入门没多久的小白想在这里分享一下我的学习内容就算是学习笔记了因为前端的大部分学习都是通过网站上的教程所以遇到不懂得问题也只有求助
linux下保护模式之CPL,RPL,DPL总结

linux下保护模式之CPL RPL DPL总结先说下特权级的概念在保护模式下系统依靠特权级来实施代码和数据的保护相当于权限啦特权级共有4 个级别 0 1 2 3 数字越小特权越高较为核心的代码和数据放在较高靠内的层级中处
RabbitMQ-安装与配置-linux

1 安装RabbitMQ 安装方式一下载rabbitmq镜像 3 management为带管理界面的rabbitmq 启动rabbitmq镜像 5672端口是客户端和容器的通信端口 15672端口是web管理界面的通信端口访问并登录we
Python批量插入数据

Python批量插入数据到mysql中相较于jdbc 简化了长度占位符使用的 s而不是 import mysql connector as conn def getConn db conn connect host localhost
分布式查找过程[HBase]Region location

HBase的table是该region切分的 client操作一个row的时候如何知道这个row对应的region是在哪台Region server上呢这里有个region location过程主要涉及到2张系统表 ROOT META

分布式查找过程[HBase]Region location

分布式查找过程[HBase]Region location 的相关文章

随机推荐

热门标签