不同点:
特性 |
传统数仓 |
大数据数仓 |
数据存储位置 |
关系型数据库 |
HDFS |
数据集市位置 |
MPP平台 |
HDFS |
数据多样性 |
结构化数据 |
结构化数据、非结构化数据、半结构化数据 |
节点数量 |
几千 |
几千~几万 |
数据量 |
TB级别 |
PB级别 |
商业价值 |
较为单一 |
极高 |
用途 |
BI |
AI |
应用开发接口 |
SQL |
SQL,多种编程接口 |
事务支持 |
支持完整 |
支持有限 |
操作难易度 |
较高,需要专业人员 |
较低,可以批量培训 |
相同点:
- 逻辑架构
- 数据建模
- 数据治理
- 数据标准规范
“大数据数仓”是在“传统数仓”基础上发展而来,绝大部分数据建设理论仍然是一脉相承,它们处理的对象都是“海量数据”,服务目的和商业价值也基本相同;但“大数据”技术又在产品创新、高性能、低成本、拓展性、场景多样性等方面取得了巨大突破,更是让只有大型企业玩得转的大数据项目可以“平民化”从而推进商业形态朝前进化。