有谁知道一种用于获取基于星型模式数据仓库的 OLAP 多维数据集的粗略大小的方法。基于维度的数量、维度表中的记录数量和事实记录的数量,最后是聚合或不同记录的数量等。
我正在查看的数据库有一个超过 200 亿行的事实表和一些包含 2000 万、7000 万和 13 亿行的维度表。
谢谢
尼古拉斯
我可以看到创建此估计的一些障碍。单独了解维度表的行数和基数并不像了解它们之间的关系那么重要。
想象两个低基数维度n
and m
分别具有独特的值。在这些维度上缓存 OLAP 聚合会产生以下任意位置n + m
价值观n * m
值取决于关系与纯双射的相似程度。仅根据您提供的信息,您只能说您最终得到的将少于3.64 * 10^34
值,这不是很有用。
我很悲观,有一种算法足够快,以至于生成立方体并在完成后对其进行称重没有更有意义。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)