如何计算 OLAP 多维数据集的可能大小

2024-01-16

有谁知道一种用于获取基于星型模式数据仓库的 OLAP 多维数据集的粗略大小的方法。基于维度的数量、维度表中的记录数量和事实记录的数量,最后是聚合或不同记录的数量等。

我正在查看的数据库有一个超过 200 亿行的事实表和一些包含 2000 万、7000 万和 13 亿行的维度表。

谢谢 尼古拉斯


我可以看到创建此估计的一些障碍。单独了解维度表的行数和基数并不像了解它们之间的关系那么重要。

想象两个低基数维度n and m分别具有独特的值。在这些维度上缓存 OLAP 聚合会产生以下任意位置n + m价值观n * m值取决于关系与纯双射的相似程度。仅根据您提供的信息,您只能说您最终得到的将少于3.64 * 10^34值,这不是很有用。

我很悲观,有一种算法足够快,以至于生成立方体并在完成后对其进行称重没有更有意义。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何计算 OLAP 多维数据集的可能大小 的相关文章

  • 解析错误:语法错误,意外的 T_RETURN [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 遇到这个问
  • MySQL JOIN 滥用?情况会变得有多糟糕?

    我读了很多关于关系数据库的文章 在每个 SELECT 上使用许多 JOIN 语句 但是 我一直想知道滥用这种方法从长远来看是否会出现任何性能问题 例如 假设我们有一个users桌子 我通常会添加 最常用 的数据 而不是进行任何额外的联接 例
  • SQL:如何从一个表中获取另一个表中每一行的随机行数

    我有两个数据不相关的表 对于表 A 中的每一行 我想要例如表 B 中的 3 个随机行 使用光标这相当容易 但速度非常慢 那么我该如何用单个语句来表达这一点以避免 RBAR 呢 要获得 0 到 N 1 之间的随机数 可以使用 abs chec
  • SQL Server 查询中 UNION ALL 与 OR 条件

    我必须根据表上不存在的条件选择一些行 如果我使用如下的 union all 它会在不到 1 秒的时间内执行 SELECT 1 FROM dummyTable WHERE NOT EXISTS SELECT 1 FROM TABLE t WH
  • MySQL“列计数与第 1 行的值计数不匹配”是什么意思

    这是我收到的消息 ER WRONG VALUE COUNT ON ROW 列计数与第 1 行的值计数不匹配 这是我的全部代码 我的错误在哪里 DROP TABLE student CREATE TABLE employee emp id I
  • SQL Server 中离线索引重建和在线索引重建有什么区别?

    重建索引时 有一个选项ONLINE OFF and ONLINE ON 我知道当ONLINE模式打开时 它会复制索引 切换新查询以利用它 然后重建原始索引 使用版本控制跟踪两者的更改 如果我错了 请纠正我 但是 SQL 在离线模式下会做什么
  • MySQL 概念:会话与连接

    我对 MySQL 的概念有点困惑 会话与连接 当谈论连接到 MySQL 时 我们使用连接术语 连接池等 然而在 MySQL 在线文档中 http dev mysql com doc refman 4 1 en server system v
  • 使用用户定义函数 MySql 时出错

    您好 请帮我解决这个问题 提前致谢 我在数据库中定义了这些函数 CREATE FUNCTION levenshtein s1 VARCHAR 255 s2 VARCHAR 255 RETURNS INT DETERMINISTIC BEGI
  • 总和和不同不会改变结果?

    我是一个新手 试图在这里解决这个问题 到目前为止还没有运气 非常感谢任何帮助 Select Distinct AB agency no ab branch no AS AGENCY BRANCH count AB agency no ab
  • mysql 不带空字符串和 NULL 的不同值

    如何检索没有空字符串值和NULL值的mysql不同值 SELECT DISTINCT CON EMAILADDRESS AS E MAIL FROM STUDENT INNER JOIN CONTACT CON ON STUDENT CON
  • 如何使用 SQL Server 2008 执行多个 CASE WHEN 条件?

    我想做的是对同一列使用多个 CASE WHEN 条件 这是我的查询代码 SELECT Url p ArtNo p Description p Specification CASE WHEN 1 1 or 1 1 THEN 1 ELSE 0
  • 消息 203,级别 16,状态 2,不是有效标识符

    我收到以下错误 消息 203 级别 16 状态 2 过程 getQuestion 第 18 行名称 select top 1 from tlb Question inner join tlb options on tlb options q
  • pg_restore错误:角色XXX不存在

    尝试将数据库从一个系统复制到另一个系统 涉及的版本是9 5 0 源 和9 5 2 目标 源数据库名称是foodb与主人pgdba并且目标数据库名称将被命名foodb dev与主人pgdev 所有命令都在将托管副本的目标系统上运行 The p
  • 如何使用 MySQL 选择有特定值的 2 个连续行?

    我正在构建一个系统 该系统应该显示学生何时连续缺席两天 例如 此表包含缺勤情况 day id missed 2016 10 6 1 true 2016 10 6 2 true 2016 10 6 3 false 2016 10 7 1 tr
  • SKIP加锁和nowait的区别

    pl sql 中 SKIP 锁定游标和 nowait 游标之间的区别 我认为我找到的这张图片是描述差异的最佳例子 详细说明 http viralpatel net blogs oracle skip locked
  • PostgreSQL函数中sql语言和plpgsql语言的区别

    我很新数据库开发所以我对下面的例子有一些疑问 函数 f1 语言 SQL create or replace function f1 istr varchar returns text as select hello varchar istr
  • 如何在 SQL Server 2012 中选择除一列之外的所有列? [复制]

    这个问题在这里已经有答案了 有没有一种方法可以选择所有列 但只选择我不想选择的特定列 我的意思是有时我会遇到这样的问题 表有数百个字段 而我只需要删除一个字段 我需要重写所有列吗 有什么窍门吗 喜欢select
  • 基本的多对多sql选择查询

    我认为这应该很容易 但它却在逃避我 我的帐户和帐户组之间存在多对多关系 一个帐户可以位于零个或多个组中 因此我使用标准连接表 Accounts ID BankName AcctNumber Balance AccountGroups ID
  • CONTAINS 不适用于 Oracle Text

    我在执行此查询时遇到问题 SELECT FROM gob attachment WHERE CONTAINS gob a document java gt 0 它给了我 ORA 29902 error in executing ODCIIn
  • Oracle REGEXP_INSTR() 和“a-z”字符范围与预期不匹配

    我想用REGEXP INSTR 在 oracle 数据库中检查小写 大写字符 我知道 upper and lower POSIX 字符类 但我选择了a z这给了我非常奇怪的结果 我不明白 有人可以解释一下吗 SELECT REGEXP IN

随机推荐

  • 如何根据文本覆盖的 ImageView 的颜色更改文本的颜色?

    所以我在上传的用户上设置了带有白色文本标签的透明按钮ImageView 如果用户上传的图像大部分为白色 则按钮即使不是完全不可见 也很难看到 有谁知道一种方法来获得平均颜色ImageView的源图片 绘图 如果我能做到这一点 我可以将其与我
  • Git:Cherry-Pick 到工作副本而不提交

    我有几个分支 我在其中保留了某些提交 我想时不时地应用到我的工作副本 最初我尝试了择优挑选 但我不想稍后在目标分支中提交 所以我做了cherry pick reset HEAD 1 soft 有没有像只挑选工作副本这样简单的东西 使用 n
  • 如何将数组或对象的数组转换为关联数组?

    我习惯了 perl 的 map 函数 其中回调可以分配键和值 从而创建一个输入为平面数组的关联数组 我知道array fill keys http www php net manual en function array fill keys
  • Jersey ContainerResponseFilter 中的 @Context HttpServletRequest 范围

    我正在编写泽西响应过滤器 我正在使用泽西岛 1 17 我想访问过滤器 API 中 httpServletRequest 的一些属性 我现在正在做的方式如下 像下面的代码片段一样注入 servletRequest 是否安全 或者这会导致某种并
  • 使用父实例初始化子实例

    我有一个返回 Parent 类实例的函数 def generateParent do stuff return Parent some parameters 现在我想用调用的结果来初始化 Parent 的子类generateParent c
  • 如何对领域迁移进行单元测试?

    我正在尝试对 Realm 上的迁移进行单元测试 我的主要问题是 如何维护 RealmObject 的不同架构版本 以便能够创建旧对象的实例 进行迁移 然后根据新架构版本检查它是否正确 我首先尝试保留不同的架构版本 但它不会编译 因为对象具有
  • 在 jquery 中使用 css calc()

    我怎样才能做到这一点 element animate width calc 100 278px 800 element animate width calc 100 78px 800 我能做到 只要它只是 或仅px 但不是calc 我可以使
  • SQL Server 触发器 - 需要更改

    我需要更改 SQL Server 中的触发器 完成后 我是否只执行类似于存储过程的触发器 ALTER TRIGGER 是的 没错 只需使用ALTER 如果您在 SSMS 的对象资源管理器中右键单击触发器并选择脚本触发器 as ALTER T
  • stdout 不是 tty。将 bash 用于节点 + 磁带 + Tap-spec

    正在看磁带 点击视频并试图让它发挥作用 操作系统 Windows 7 Git Bash 外壳 node main js node modules bin tap spec stdout 不是 tty main js var test req
  • 我们需要手动启动Appium的Android模拟器吗?

    我是 appium 新手 我正在使用以下代码运行计算器示例测试 DesiredCapabilities capabilities new DesiredCapabilities capabilities setCapability devi
  • 如何在 Spark DataFrame/DataSet 中将行拆分为不同的列?

    假设我有如下数据集 Name Subject Y1 Y2 A math 1998 2000 B 1996 1999 science 2004 2005 我想分割该数据集的行 以便消除 Y2 列 如下所示 Name Subject Y1 A
  • ggplot 使用小饼图作为点与 geom_point

    我想用 ggplot 制作一个图表 如下所示 这个想法是绘制两个分类变量之间的 百分比匹配 通过改变点的大小很容易接近 但我想知道是否可以制作这些小饼图 用于绘制此图的示例代码 并使用点的大小作为分数的度量 temp lt data fra
  • 如何跟踪 Git 中共享公共代码的多个项目?

    我开发了一个网站 现在必须为几个客户克隆该网站 每个客户都希望进行超出视觉方面的定制 并且不能通过配置文件 偏好或类似的东西来处理 在这种情况下 我想在 Git 中使用公共代码维护一个主存储库 然后为每个客户端维护一个分支 这样 我可以在每
  • 如何使用 PHP Curl 模拟启用 JavaScript?

    我想使用 PHP Curl 解析网页中的 HTML 代码 但有一条错误消息 表明我无法在没有 JavaScript 的情况下访问该网站 我可以使用 PHP Curl 启用 JavaScript 吗 JavaScript由浏览器执行 cURL
  • 未捕获的类型错误:_this2.props.selectBook 不是函数

    我是 ReactJS 的新手 正在学习 udemy 上的 React 基础课程 我的控制台日志上出现以下错误 有人可以帮助我吗 bundle js 21818 Uncaught TypeError this2 props selectBoo
  • 如何在启动时启用“填充列指示器”

    我在 OS X 10 9 4 上使用 Aquamacs 我的中有以下几行Preferences el文件 这类似于 emacs初始化文件 add to list load path emacs d require fill column i
  • 禁用上下文 LOB 创建,因为 createClob() 方法引发错误

    我正在使用 Hibernate 3 5 6 和 Oracle 10g 我在初始化期间看到以下异常 但应用程序本身工作正常 出现这个异常的原因是什么 以及如何纠正 例外禁用上下文 LOB 创建createClob 方法抛出错误 java la
  • Sparksql.sql.codegen 没有提供任何改进

    我正在 Spark sql 中执行查询 如下所示 表的数据存储在 Hive 表的 2 个不同节点中 但由于查询有点慢 我尝试在 Spark 中找到一些选项 以便查询可以执行得更快 所以我发现我们可以配置sparksql sql codege
  • JFrame尺寸太小

    我在netbeans中创建了一个JFrame 但是当我运行该程序时 Jframe 尺寸太小 这是我的代码 import javax swing JFrame public class Window private static void d
  • 如何计算 OLAP 多维数据集的可能大小

    有谁知道一种用于获取基于星型模式数据仓库的 OLAP 多维数据集的粗略大小的方法 基于维度的数量 维度表中的记录数量和事实记录的数量 最后是聚合或不同记录的数量等 我正在查看的数据库有一个超过 200 亿行的事实表和一些包含 2000 万