项目背景
前提:参与人员均了解熟悉数据中心
业务痛点
始于一次吐槽大会
1.开发及使用人员信息不对称;
2.表中字段增减随意;
3.相似数据冗余;
4.定制化表过多,扩展功能不足,维护成本高;
5.缺少注释,全凭猜测,浪费时间;
项目计划
1.确定治理范围、周期、标准;
2.根据评估结果对各表按照主题分类;
3.对各表按照使用情况、影响范围、重要程度进行分级(ETL、存储过程、报表、定时任务等其他应用),根据分级结果进行逐个下线,并跟踪其下线结果;
执行方式
不成立专门的数据治理项目组,在不影响其他业务需求的同时,每天根据自己工作内容灵活调整自己负责的数据内容,数据中心使用人员根据各自应用范围进行评估,按照下线要求对各自负责的应用进行同步处理,文档同步更新;
项目成果
1.节省数据库空间;
2.数据进行标准化管理,统一数据口径,完善模型结构,使用数据不再大量东拼西凑;
3.节省猜测表名字段名的时间。
后续维护
1.针对新增模型及字段发出评审邮件,描述添加原因,添加方式,由数据中心人员评审后根据评审结果进行处理;
2.数据中心各项问题进行汇总,通过月度会议进行分享,并出具解决方案;
3.对元数据进行实时更新。
报表治理
1.整理报表列表;
2.报错报表与业务确认,确不使用则下线,继续使用则修复;
3.报表按照主题进行分类;
4.报表所用数据集进行整理,没有用到的数据集进行下线处理;
5.报表所用SQL中有写死码值的情况进行修复。