1.视界
1. rowKey编码概述
注:Kylin源码分析系列基于Kylin的2.6.0版本的源码,其他版本可以类比。
2. 相关概念
前面介绍了Kylin中Cube构建的流程,但Cube数据具体是以什么样的形式存在,可能还不是特别清晰明了,这篇文章就详细介绍下Cube数据的数据格式,主要就是其rowKey的编码,看下Kylin是怎样来保存各种维度组合下的各种度量的统计值的。这里首先介绍下Cube数据立方的相关概念。
2.1 事实表Fact Table
事实表(Fact Table)是中心表,包含了大批数据并不冗余,其数据列可分为两类:
包含大量数据事实的列;与维表(Lookup Table)的primary key相对应的foreign key。
2.2 维表Lookup Table
Lookup Table包含对事实表的某些列进行扩充说明的字段。在Kylin的quick start中给出sample cube(kylin_sales_cube)——其Fact Ta