为什么 Redshift 不需要物化视图或索引？

2024-05-05

In the 红移常见问题解答 https://aws.amazon.com/redshift/faqs/ under

问：与大多数用于数据仓储和分析的传统数据库相比，Amazon Redshift 的性能如何？

它说如下：

高级压缩：列式数据存储比基于行的数据存储可以压缩更多，因为类似的数据按顺序存储在磁盘上。 Amazon Redshift 采用多种压缩技术，通常可以实现相对于传统关系数据存储的显着压缩。此外，Amazon Redshift 不需要索引或物化视图，因此比传统关系数据库系统使用更少的空间。将数据加载到空表时，Amazon Redshift 会自动对您的数据进行采样并选择最合适的压缩方案。

为什么会这样呢？

说实话，这有点不诚实（在我看来）。虽然 RedShift 没有这些，但我不确定这是否等同于说它不会从它们中受益。

物化视图

我真的不知道他们为什么这么说。可能是因为他们认为引擎的性能如此之高，以至于拥有它们的收益微乎其微。

我对此有异议，我所开发的产品保留了自己的具体化视图，并且可以通过这样做显示出显着的性能提升。也许 AWS 认为我一开始就一定做错了什么？

Indexes

RedShift 没有索引。

它确实有SORT ORDER这与聚集索引非常相似。它只是一个用于对数据进行排序的字段列表（类似于复合聚集索引）。

甚至最近还推出了INTERLEAVED SORT KEYS。这是对多个独立排序顺序的直接尝试。而不是按顺序订购a THEN b THEN c it 有效地他们每个人的订单同时.

由于 RedShift 实现其列存储的方式，这变得可能。
- 每列与其他列分开存储
- 每列存储在 1MB 块中
- 每个1MB块都有汇总统计数据

除了作为存储模式之外，它实际上还成为一组伪索引。
- 如果数据按以下顺序排序a then b then x
- 但你想要z = 1234
- RedShift 首先查看块统计信息（针对 z 列）
- 这些统计数据将显示该块存储的最小值和最大值
- 这允许 Redshift 在某些条件下跳过许多这样的块
- 该实习生允许 RedShift 识别从其他列读取哪些块

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

amazonredshift

materializedviews

为什么 Redshift 不需要物化视图或索引？的相关文章

如何检查oracle数据库中分配给模式、角色的对象的权限（DDL、DML、DCL）？

大多数时候我们都在与愚蠢的事情作斗争以获取架构角色及其对象的权限详细信息并尝试找到一些简单的方法来获取有关它的所有详细信息以及伪查询代码以批量生成授予语句以供进一步使用执行所以我们在这里得到它关于数据字典视图前缀的一些简单介绍
SQL Server Like 查询不区分大小写

Query SELECT from Table 2 WHERE name like Joe Output 1 100 Joe 2 200 JOE 3 300 jOE 4 400 joe 为什么不区分大小写 Problem 查询不区分大小写
如何比较行内的重叠值？

我似乎对这个 SQL 查询有问题 SELECT FROM appts WHERE timeStart gt timeStart AND timeEnd lt timeEnd AND dayappt boatdate 时间格式为军用时间物流
如何将事物的组合映射到关系数据库？

我有一个表其记录代表某些对象为了简单起见我假设该表只有一列这是唯一的ObjectId 现在我需要一种方法来存储该表中的对象组合组合必须是唯一的但可以是任意长度例如如果我有ObjectIds 1 2 3 4 我想存储以下组合
在 SQL 中按键组对行进行顺序编号？

SQL中有没有办法按顺序添加行号按关键组假设一个表包含任意 CODE NAME 元组示例表 CODE NAME A Apple A Angel A Arizona B Bravo C Charlie C Cat D Dog D Dopp
SQL 约束最小值/最大值？

有没有办法为数字字段设置 SQL 约束最小值应为 1234 最大值应为 4523 SQL Server 语法为the check约束 http technet microsoft com en us library ms179491 as
PostgreSQL 在递归查询中找到所有可能的组合（排列）

输入是一个长度为 n 的数组我需要生成数组元素的所有可能组合包括输入数组中元素较少的所有组合 IN j A B C OUT k A AB AC ABC ACB B BA BC BAC BCA 随着重复所以AB BA 我尝试过这样的事情
私人聊天系统MYSQL查询显示发送者/接收者的最后一条消息

在这里我延伸一下我之前的问题私人聊天系统MYSQL查询ORDERBY和GROUPBY https stackoverflow com questions 10929366 private chat system mysql query o
我应该使用平面表还是标准化数据库？

我目前正在开发一个使用 MySQL 数据库作为后端的 Web 应用程序在继续下一步之前我需要知道什么更适合我的情况简而言之在这个应用程序中用户将能够使用任何数字字段他们决定构建自己的表单现在我将其全部存储在通过外键链接的几个
使用条件 SQL 统计每月汇总记录

我有一张桌子我们就叫他们桌子吧SUMMARYDATA NIP NAME DEPARTMENT STATUSIN STATUSOUT TOTALLOSTTIME A1 ARIA BB 2020 01 21 08 06 23 2020 01
如何计算 Postgres 上图表中所有连接的节点（行）？

我的桌子有account id and device id One account id可以有多个device ids 反之亦然我正在尝试计算每个连接的多对多关系的深度 Ex account id device id 1 10 1 11
使用 .NET 中的类型化数据集将 SQL 参数传递给 IN() 子句

首先道歉因为该网站上有类似的问题但没有一个直接回答这个问题我在 VS 2010 中使用类型化数据集我在数据集中创建一个 TableAdapter 查询如下 SELECT from Table WHERE ID IN IDs 现在如果
在 PostgreSql 中计算百分比

例如我有一个这样的表 string adm A 2 A 1 B 2 A 1 C 1 A 2 通过 SQL 查询我想要这样的结果 string perc adm A 50 B 100 C 0 我想要每个字符串中数字 2 出现的百分比我可以
java库维护数据库结构

我的应用程序一直在开发所以偶尔当版本升级时需要创建更改删除一些表修改一些数据等通常需要执行一些sql代码是否有一个 Java 库可用于使我的数据库结构保持最新通过分析类似 db structure version 信息并执
根据由另一列分组的不同列的最大值获取值[重复]

这个问题在这里已经有答案了我想根据由另一列分组的不同列的最大值来获取列的值我有这张表 KEY NUM VAL A 1 AB B 1 CD B 2 EF C 2 GH C 3 HI D 1 JK D 3 LM 并想要这样的结果 KEY V
使用联接更新表？

我正在尝试使用表 B 中的数据更新表 A 我以为我可以做这样的事情 update A set A DISCOUNT 3 from INVOICE ITEMS A join ITEM PRICE QUNTITY B on A ITEM PRI
选择多列按一列分组按计数排序

我在Oracle中有以下数据集 c1 c2 c3 1A2 cat black 1G2 dog red B11 frog green 1G2 girl red 试图得到以下结果基本上我首先尝试获取具有重复 c1 的行 c1 c2 c3 1G
H2 SQL 日期比较

在 H2 数据库中如何在 TIMESTAMP 类型的列上运行查询 SELECT FROM RECORDS WHERE TRAN DATE lt 2012 07 24 Try 2012 07 24
时间序列数据的自连接

我需要一些帮助来完成我认为应该是相当简单的自连接查询只需要将两条记录中匹配的开始时间和结束时间合并为一条记录假设我的表中有以下内容 Time Event 08 00 Start 09 00 Stop 10 30 Start 10 45
Oracle：按月分区表

我的解决方案德语几个月 PARTITION BY LIST to char GEBURTSDATUM Month PARTITION p1 VALUES JANUAR PARTITION p2 VALUES Februar PARTITI

随机推荐

选择特定值之后的项目

说这是我的sql SELECT title author ISBN FROM bs books ORDER BY ISBN LIMIT 3 它只是从某个表中选择所有内容标题作者等假设我想选择某个标题后面的所有项目而不是按字母顺序或其
Servlet 包含 Tomcat 中的 HTTP 标头

我有一个 servlet 它的请求调度程序包含另一个 servlet 包含的 servlet 设置了我想在包括小服务程序因此我在 include 方法中传入一个自定义 HTTPResponse 对象该对象捕获来自 servlet 的所
在 Xcode 中添加较大的 Power 值

我是 Objective C 和 iPhone 开发的新手我正在使用基本计算器我想在文本字段中添加一个大值如何在 Xcode 中显示像这样的大值 6 67543 x 10 34 谢谢您可以使用 NSNumberFormatterSc
C 中的数组初始化

我对以下代码有疑问 int main int array1 1 2 3 4 5 error in c warning in c int array2 1 2 3 4 5 int array3 5 1 2 3 4 5 这段代码在第 3 行给出
在 Python 3.5 64 位上通过 pip 安装 OpenCV

我尝试安装 OpenCV 但找不到任何合适的 pip 软件包我决定上网查找有关如何安装它的官方文档并发现this https opencv python tutroals readthedocs io en latest py tuto
DbContext 因 PrimitiveType != null 错误而崩溃

使用 Entity Framework Code First Web 应用程序在调用 DbContext 时崩溃并出现以下错误断言失败表达式 primitiveType null 描述断言失败 primitiveType null
如何正确定向从 AVCaptureVideoDataOutputSampleBufferDelegate 生成的图像

我在用着AVCaptureVideoDataOutputSampleBufferDelegate我收到一个CMSampleBufferRef我将其转换为UIImage 但生成的图像方向不正确 Get a CMSampleBuffer s C
bitblt 在 Windows 10 版本 1703 上失败 (15063.138)

使用 Visual Studio 2017 vc141 以下代码应该从前游戏窗口获取屏幕截图但现在它返回黑色和空白图像唯一的游戏问题尝试过 OpenGL 和 Vulkan ogl 返回黑色 vulkan 返回白色在升级到 Windo
是否可以在 Flutter 中创建自定义快速设置图块？

我搜索了 Flutter 文档并用谷歌搜索了这个但结果为零我正在开发我的第一个 Android Flutter 应用程序我想为其创建一个自定义的快速设置图块我的目标是牛轧糖及以上我知道这在 Java 和 Kotlin 中是可能的
ios safari - getUserMedia 无法正常工作

我真的有this https stackoverflow com q 45692526 6048715问题但 OP 的解决方案对我不起作用重申一下我正在使用navigator mediaDevices getUserMedia 在浏览
生成非连续组合

我正在尝试创建一个生成器支持执行 next 的迭代器可能在 python 中使用yield 它给出来自 1 2 n n 和 r 是参数的 r 元素的所有组合这样在选出的r个元素没有两个是连续的例如对于 r 2 且 n 4 生成
如何在 Linux 上调用 Python 中的内联机器代码？

我正在尝试从 Linux 上的纯 Python 代码调用内联机器代码为此我将代码嵌入到字节文字中 code b x55 x89 xe5 x5d xc3 然后打电话mprotect http www kernel org doc man
Google Analytics 是否具有针对长时间运行的网络应用程序的“心跳”功能？

我正在制作一个专注于观看嵌入内容的网络应用程序我希望应用程序客户端向 GA Google Analytics 发送心跳类型的信号以保持会话继续进行现在看来如果访问者观看视频 5 10 分钟 GA 就会假设他已经离开页面并将用户的
使用未解析的运算符 <=

我正在尝试使用 Swift 3 for 循环但没有成功这是我所拥有的 for assumedPayRate Double in 0 25 lt billRate where assumedPayRate 0 25 On the lt 它
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
C# 隐式更新传递给没有返回类型且没有 out 或 ref 使用的方法的参数

这对我来说太时髦了显然开发人员应该使用关键字 out 但我不敢相信这竟然有效 public BusinessResponse
将引导加载程序存储在软盘映像上的哪里？

我将编写并测试引导加载程序为了做到这一点我计划将引导加载程序复制到软盘映像文件上并将其安装在虚拟机中但是我不确定将引导加载程序的机器代码放在哪里它是否只是转储到文件的前几个字节中软盘的引导扇区是第一个扇区如果您谈论的是原始软盘
如何在 Rails 中每天缓存一个值？

在 Rails 中每天缓存一个值的最佳方法是什么我有一个可通过 API 访问的数据库调用我想每天制作并存储它做到这一点的最佳方法做法是什么假设你有一个widget price您只想每 24 小时更新一次通常你使用Widget c
从 Dockerfile 写入 docker 卷不起作用

请考虑以下 Dockerfile FROM phusion baseimage VOLUME data RUN touch data HELLO RUN ls ls data 问题 data 目录不包含 HELLO 文件此外任何其他写入
为什么 Redshift 不需要物化视图或索引？

In the 红移常见问题解答 https aws amazon com redshift faqs under 问与大多数用于数据仓储和分析的传统数据库相比 Amazon Redshift 的性能如何它说如下高级压缩列式数据存储比

为什么 Redshift 不需要物化视图或索引？

为什么 Redshift 不需要物化视图或索引？ 的相关文章

随机推荐

热门标签

为什么 Redshift 不需要物化视图或索引？的相关文章