链接维度的不同粒度级别的事实表

2024-03-16

数据仓库设计新手。我有一个代表地理位置(例如郊区、城市、州)的非规范化维度表。这是一个缓慢变化的维度。

还有多个事实表,每个事实表都有不同的粒度级别。

是否可以对此进行建模,以便事实表使用代理键,同时维护非规范化维度表?


如果您实际上拥有相同的维度数据但粒度不同,那么您可以通过创建“聚合”维度来处理此问题。在您的示例中,复制 dim_geo 表定义(而不是数据),将 dim 命名为类似 dim_geo_city 的名称,并以比 city 更低的粒度删除所有列(例如 suburb_id、suburb)。如果您有州级别的事实,那么您将以相同的方式创建 dim_geo_state - 对于任何进一步的聚合级别依此类推。

Fact_population将继续引用dim_geo,但fact_housing应引用dim_geo_city。

填充聚合 Dim 的最简单方法是在基本 Dim (dim_geo) 上运行 SELECT DISTINCT,并且仅包含目标 Dim (dim_geo_city) 中存在的列 - 然后获取结果数据并应用适当的 SCD 逻辑来插入/将其更新为目标暗淡。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

链接维度的不同粒度级别的事实表 的相关文章

  • 事实表是标准化形式还是非标准化形式?

    我对事实表做了一些研究和开发 无论它们是标准化的还是非标准化的 我发现了一些让我困惑的发现 根据Kimball 维度模型结合了规范化和非规范化的表结构 描述性信息的维度表是高度非规范化的 在同一个表中具有详细且分层的汇总属性 同时 具有性能
  • 将 SQL Server 数据库数据移至 SAP BW

    我读过一些关于将数据从 SAP BW 移入 SQL Server 的文章 我找不到任何有关将数据从 SQL Server 移动到 SAP BW 的文章 这是否可能 如果可以 处理此问题的最佳方法是什么 在搜索这个主题后 我发现了许多解决这个
  • 数据库表越多越好吗?

    最近 我一直在重新思考几个月前所做的数据库设计 主要原因是昨晚我读了vBulletin的数据库模式 发现他们使用了很多很多表 我当前用于模式 例如我的日志表 的 想法 是通过将日志类型与整数进行区分 将所有内容保留在一个表中 id type
  • 实体框架 CTP5 代码优先映射 - 同一个表中的外键

    我如何使用模型构建器来映射这样的东西 哪里有一个可以为空的外键引用相同的表主键 Table Task taskID int pk taskName varchar parentTaskID int nullable FK 任务类别 publ
  • 数据库设计 - 为用户存储积分的方法

    只是寻找一些有关如何为此进行数据库设计的建议 在我的网站上 用户可以通过执行不同的活动获得积分 目前 我有 3 项奖励积分的活动 但设计必须具有可扩展性 我也可以添加其他奖励积分的活动 所以今天 用户获得积分 1 当他添加一个新商店时 他获
  • 数据仓库模式:在DWH中直接链接事实表可以吗?

    在DWH中直接链接事实表可以吗 据我了解 在星系模式中事实表没有链接 它们只是有共同的维度表 但是 如果有一个 DWH 模式假设直接链接它们呢 IMO 他们不应该这样做 即使他们可以 事实表通常很大 可能有数十亿行 并以一定的粒度保存度量
  • 是否应该对 OLAP 数据库进行非规范化以提高读取性能? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我一直认为数据库应该针对读取性能进行非规范化 就像针对 OLAP 数据库设计所做的那样 而不是针对 OLTP 设计进一步夸大 3NF 各种职位的
  • 完全可审计的数据模型的最佳实现?

    我的要求是一个数据模型 其中保留每个对象的每个属性的更改的完整审计跟踪 对象定义也是流动的 新属性可能会随着时间的推移而出现或消失 此审计跟踪将与原始数据库分开存在 因此基于触发器的审计模型将不起作用 在关系数据库中 我可以使用一个大型 A
  • 将表列移动到新表并在 PostgreSQL 中作为外键引用

    假设我们有一个包含字段的数据库表 id category subcategory brand name description etc 创建单独的表的好方法是什么category subcategory and brand以及原始表中相应的
  • SQL 数据仓库,需要帮助使用 T SQL SELECT 或更好的替代方案填充我的 DIMENSION?

    我的 SQL Server 中有一个表 我在其中 暂存 来自 ERP 系统的数据仓库提取内容 从这个暂存表 表名 DBO DWUSD LIVE 我构建维度并加载事实数据 示例 DIMENSION 表称为 SHIPTO 该维度具有以下列 sh
  • DB2 的数据模型工具

    我在 DB2 中创建了一个数据库和具有关系的表 我想根据我在 DB2 中的数据库设计创建一个 ER 图 MS SQL 有一种从 DB 模式创建 ER 图的工具 但 DB2 似乎没有 至少据我所知 有人知道 DB2 本身有任何开源工具 设施吗
  • 代理密钥、合成密钥和人工密钥之间有区别吗?

    代理密钥 合成密钥和人工密钥之间有什么区别吗 我不清楚具体的区别 代理密钥 合成密钥和人工密钥是同义词 技术关键是另一个 它们的意思都是 没有商业意义的主键 它们与自然密钥或业务密钥不同 后者的含义超出了当前系统的范围 例如 考虑 SO 用
  • 如何对数据仓库中的流程和状态历史进行建模?

    假设我们有D PROCESS D WORKER and D STATUS作为尺寸和事实F EVENT将流程 内容 与工作人员 负责人 和 当前 状态联系起来 进程状态随时间而变化 我们应该存储在F EVENT每个进程 状态 工作人员一行 或
  • Firebase 的喜欢/不喜欢功能

    该系统本身很容易理解 但实施起来却很棘手 此外 安全原因让我思考如何做到这一点 我正在考虑让该功能在前端 Firebase 脚本中工作 只需执行所有操作即可检查该用户是否已经发布了喜欢 不喜欢的内容 并在用户单击时删除 添加 切换 问题在于
  • 从 glmmTMB 类的 ZINB 模型生成预测计数分布

    在上一个问题中 R 中没有从 Zeroinfl 对象预测零 https stackoverflow com questions 22314921 no zeros predicted from zeroinfl object in r 有一
  • 如何通过与 Mongoid 和 mongodb 的关系来实现 has_many ?

    使用这个修改后的例子Rails 指南 http guides rubyonrails org association basics html the has many through association 如何使用 mongoid 建模关
  • PostgreSQL 有一个好的数据库建模工具吗? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 如何在多个表之间强制执行唯一性

    我在 MySQL 服务器中有以下表 Companies UID unique NAME other relevant data Offices UID unique CompanyID ExternalID other data Emplo
  • Rails 建模:将 HABTM 转换为 has_many :through

    我正在现有的 Rails 站点上进行维护工作 并且遇到了一些由多对多关联引起的问题 看起来该网站最初是使用has and belongs to many对于一些业务逻辑变得更加复杂的关系 所以我需要使用has many through而是支
  • 从头开始构建 OLAP 解决方案时应该注意什么?

    我在一家运行基于 MS SQL 数据库服务器的软件产品的公司工作 多年来我已经用 PHP 开发了 20 30 个相当高级的报告 直接从数据库获取数据 这非常成功 人们对此感到高兴 但它有一些缺点 对于新的变化 它可能是相当开发密集型的 用户

随机推荐