我有一个关于硬规则(原始库)和软规则(业务规则)的问题。
我的例子是一个源系统有一个名为 Pets 的非规范化表,其中 Pets 包含猫、狗和鸟,它们通过类型代码进行区分(1 – 猫,2 – 狗,3 – 鸟)。
我的问题是关于将数据加载到 Rawvault 与 Business Vault 时的硬规则与软规则。加载 Pets 表时,是否可以在 rawvault 中创建 h_cat、h_dog 和 h_bird 集线器,并根据类型代码 1 过滤源表 pets 为 h_cat,类型代码 2 为 h_dog,类型代码 3 为 h_bird?这是硬规则还是软规则?
Or
当基于类型代码过滤数据时,我们是否应该在 rawvault 中创建 h_pet 中心,使数据尽可能接近源,在 Businessvault 中创建 h_cat、h_dog 和 h_bird,因为这将被归类为软规则?
在您的情况下,您将拥有一个针对所有三种动物类型的中心。任何更改数据的逻辑都会添加到原始保管库之后。
这是软规则和硬规则之间的一个很好的区别:
硬性规定
这些应该在数据存储到 DataVault 之前应用。此处应用的任何规则都不会更改数据的内容或粒度,并保持可审核性。
- 数据输入
- 规范化/反规范化
- 添加系统字段(标签)
- 重复数据删除
- 按记录结构拆分
- 修剪字符串中的空格
软规则
例如,更改或解释数据的规则添加业务逻辑。这改变了数据的粒度。
- 连接名称字段
- 标准化地址
- 计算每月销售额
- 聚结
- 合并
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)