目录
什么是拉链表
拉链表的作用
拉链表的形成
什么是拉链表
一张表存储的每一条信息就是一条记录的一个生命周期,这样的表格即为拉链表。
拉链表的作用
用于记录一些 会发生变化但是变换频率不高的数据。比如某人的某个手机号使用情概况
通过对于日期的筛选可以看到某个日期的全部数据切片
拉链表的形成
1.起始的第一天的全部数据导入到,拉链表中,开始时间为当天日期,结束时间99999代表仍在使用的状态
2.接着第二天的新增及改变数据全部为,最新状态,结束时间应为99999,起始日期为当天
同时对比前一天的数据,发生改变的数据在今天的数据表中修改,结束时间从99999改为今天。意味着这条记录过期了,使用时间就是起始日期到今天,依次类推
在业务表中的示意图如下
最近一直在看表,建表。hive没学只能无脑建表和抄脚本,实在没啥好写的了。就先这样