我刚刚读到数据仓库建模 https://en.wikipedia.org/wiki/Data_vault_modeling据我了解,集线器仅包含密钥(和记录源)。
所以我想知道为什么我应该创建这些中心表,只是为了存储记录源?仅拥有卫星和链接还不够吗?
顺便说一句:我正在寻找数据保险库形式的简单 mysql 表来下载和使用。
中心是应用多个源的被动集成的地方。您将有一个数据源列,并在每个密钥首次到达您的中心时记录它的所有实例。例如,如果我有一个 CRM 系统和一个 ERP 系统,并且我首先从 CRM 系统同步数据,然后 ERP 数据就可用。我将添加 CRM 系统中的所有键,数据源列值为“CRM”。然后,当我引入 ERP 系统时,假设我的表具有相同的键结构,我只会添加仅存在于数据源为“ERP”的 ERP 系统中的新键。如果密钥不同,您将必须添加两个系统中的所有数据。关键是您要保留所有正在运行的系统的所有数据。当您移动到下一层(无论是业务数据仓库还是数据集市)时,您将根据“业务规则”对中心和卫星应用业务逻辑,以获取两个系统(如果适用)的单个结果行。如果您在将转换存储在此中间状态之前使用转换,您将失去审核能力以及稍后更改业务规则的能力。合理?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)