尝试使用 Redshift SQL 对累积不同实体进行计数

2024-04-28

我正在尝试获取某个时间序列中 Redshift 中不同对象的累积计数。最简单的事情就是使用COUNT(DISTINCT myfield) OVER (ORDER BY timefield DESC ROWS UNBOUNDED PRECEDING)，但 Redshift 给出“不支持窗口定义”错误。

例如，下面的代码尝试查找从第一周到现在每周的累计不同用户。但是，我收到“不支持窗口功能”错误。

SELECT user_time.weeks_ago, 
       COUNT(distinct user_time.user_id) OVER
            (ORDER BY weeks_ago desc ROWS UNBOUNDED PRECEDING) as count
FROM   (SELECT FLOOR(EXTRACT(DAY FROM sysdate - ev.time) / 7) AS weeks_ago,
               ev.user_id as user_id
        FROM events as ev
        WHERE ev.action='some_user_action') as user_time

目标是构建已执行操作的唯一用户的累积时间序列。关于如何做到这一点有什么想法吗？

以下是如何将其应用到引用的示例中here http://www.bigdatamark.com/count-distinct-window-function-redshift，另外我还添加了另一行，复制“2015-01-01”的“表”，以演示如何计算不同值。

该示例的作者对解决方案的看法是错误的，但我只是使用他的示例。

create table public.test
(
  "date" date,
  item varchar(8),
  measure int
)

insert into public.test
    values
      ('2015-01-01', 'table',   12),
      ('2015-01-01', 'table',   120),
      ('2015-01-01', 'chair',   51),
      ('2015-01-01', 'lamp',    8),
      ('2015-01-02', 'table',   17),
      ('2015-01-02', 'chair',   72),
      ('2015-01-02', 'lamp',    23),
      ('2015-01-02', 'bed',     1),
      ('2015-01-02', 'dresser', 2),
      ('2015-01-03', 'bed',     1);

WITH x AS (
    SELECT
      *,
      DENSE_RANK()
      OVER (PARTITION BY date
        ORDER BY item) AS dense_rank
    FROM public.test
)
SELECT
  "date",
  item,
  measure,
  max(dense_rank)
  OVER (PARTITION BY "date")
FROM x
ORDER BY 1;

CTE 为您提供dense每个日期每个项目的排名，然后主查询会获取每个日期的密集排名的最大值，即每个日期的项目的不同计数。

你需要dense排名而不是直接排名来计算不同值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

amazonredshift

尝试使用 Redshift SQL 对累积不同实体进行计数的相关文章

触发器以捕获服务器中的架构更改

是否可以实现类似以下触发器的东西 CREATE TRIGGER tr AU ddl All Server ON DATABASE WITH EXECUTE AS self FOR DDL DATABASE LEVEL EVENTS AS D
oracle 数据透视表中的列

示例选择 select from select 1 cnt 2 sm 55 name 12 month 2011 year 12 2011 mnth txt from dual union all select 1 cnt 2 sm 54
android sqlite 如果不存在则创建表

创建新表时遇到一点问题当我使用 CREATE TABLE 命令时我的新表按应有的方式形成但是当我退出活动时应用程序崩溃并且我在 logcat 中得到一个表已存在如果我使用 CREATE TABLE IF NOT EXISTS 则
SQL Server 2005 - 达到表行大小限制

有没有一种干净的方法可以在向表添加新列之前确定表的行大小并且不超过 8060 字节的限制例如如果表行长度当前为 8055 字节并且我想添加日期时间 8 字节则这将结束因为它将变为 8063 字节不包括空映射但是如果我添加一
Postgres - 这是在布尔列上创建部分索引的正确方法吗？

我有下表 CREATE TABLE recipemetadata Lots of columns diet glutenfree boolean NOT NULL 大多数每一行都会被设置为FALSE除非有人想出一些席卷全国的疯狂新无麸质饮食
SQL Server - 在设置 COLLATE Latin1_General_CS_AS 的情况下搜索不区分大小写

家长提问 https stackoverflow com questions 50974562 sql server update to match and replace only exact words感谢 Iamdave 部分问题得到
SQL Server：将 varchar 转换为十进制（也考虑指数表示法）

我需要转换表的数据并进行一些操作其中一种列数据类型是Varchar 但它存储decimal数字我正在努力转换varchar into decimal 我努力了CAST TempPercent1 AS DECIMAL 28 16 问题是数
Visual Studio 2008 (C#) 与 SQL Compact Edition 数据库错误：26

与网络相关或特定于实例的建立时发生错误连接到 SQL Server 服务器未找到或无法访问验证实例名称是否为正确并且 SQL Server 是配置为允许远程连接提供商 SQL 网络接口错误 26 错误定位指定服务器实
在调用存储过程 Sql Server 2008 时使用嵌套存储过程结果

是否可以在另一个存储过程中使用一个存储过程的结果 I e CREATE PROCEDURE dbo Proc1 ID INT mfgID INT DealerID INT AS BEGIN DECLARE Proc1Result UserD
SQL 删除自动命名约束

我使用脚本在表上创建了一些约束但未指定约束名称结果我最终受到了像这样的限制FK DOC OBGS kntr 54E63309例如是否可以在不指定确切的约束名称的情况下删除该约束例如类似这样的东西不起作用 ALTER TABLE
在触发器中记录更新操作

我有一个 UPDATE 触发器它生成 INSERTED 和 DELETED 表如下所示 INSERTED Id Name Surname 1 Stack Overflow 2 Luigi Saggese DELETED Id Name
如何授予用户访问 SQL Server 中的 sys.master_files 的权限？

我需要授予数据库用户读取权限sys master files桌子我怎样才能做到这一点目前用户拥有以下权限 Calling SELECT on sys master files返回空结果我还使用以下命令测试了相同的查询sa用户按预期工作
Oracle中如何转义单引号？ [复制]

这个问题在这里已经有答案了我有一列包含某些存储为文本字符串的表达式其中包括单个引号例如错过的交易包括引号发生这种情况时如何使用 where 子句 select from table where reason missed tra
如何在一列中存储数组或多个值

运行 Postgres 7 4 是的我们正在升级我需要将 1 到 100 个选定项目存储到数据库的一个字段中 98 的情况下只会输入 1 个项目而 2 的情况下如果是这样的话会输入多个项目这些项目只不过是文本描述截至目前长
在tomcat中显示Spring-security的SQL错误

我使用 spring security 框架创建了一个 Web 应用程序我设置了一个数据库来存储用户及其角色但 tomcat 给出以下错误 17 sep 2010 11 56 14 org springframework beans f
从 ISO 周中提取日期 (201905) BigQuery

我需要从 ISO 周数中提取星期日的日期即 201905 它需要位于 standardSQL 中因为它将使用不支持旧版本的脚本进行调度我尝试从 Google Sheets 调整工作公式但无法弄清楚 Google Sheets 的原始
在 Oracle SQL 中执行 MERGE 时，如何更新 SOURCE 中不匹配的行？

我有一个main数据库和一个report数据库我需要同步一个表main into report 但是当项目在main数据库我只想设置一个IsDeleted标志在report数据库执行此操作的优雅方法是什么我目前正在使用 MERGE
带有 viewbags 的 MVC 数据集

如何将数据集放入视图袋中并在视图中显示结果我有一个来自模型的数据集并将其写入视图包我想使用 foreach 循环从视图中的视图包中获取数据行我已经有一个变量进入视图所以我无法正常传递数据集每页我还会有许多其他数据集所以我认为
从Oracle表中删除重复行

我正在 Oracle 中测试某些内容并使用一些示例数据填充表但在此过程中我不小心加载了重复记录因此现在我无法使用某些列创建主键如何删除所有重复行并只保留其中一行 Use the rowid伪列 DELETE FROM your tab
如何重命名 SQL Server 中名称中带有方括号的内容？

我的一张桌子上有一列周围有方括号 Book Category 我想重命名为Book Category 我尝试了以下查询 sp rename BookPublisher Book Category Book Category COLUMN

随机推荐

如何在 C 中将浮点数转换为 4 字节字符？

我想将浮点数例如 2 45 转换为 4 字节字符数组所以 2 45 应该是这样的 FS 这是二进制的 IEEE 表示2 45 01000000 00011100 11001100 11001101 我已经解决了这个问题但它的复杂性很差
将数据从表单插入表中

我已经有 3 年没有使用 VB 或 VBA 代码了我正在开展一个工作项目我需要获取表单上列出的信息并将其插入到表格中我所坚持的是代码的最后一部分即值部分这是我到目前为止所拥有的插入志愿者姓名电子邮件电话号码紧急联系人紧
如何从 std::vector 自动删除已完成的 future

在下面的示例中 mEventExecutors 是一个std vector
从 xsl:template 传递字符串参数并在另一个 xsl 文件中使用它
在 Angular http Post 请求中获取完整响应

我正在尝试从 POST 请求获得完整响应我已经阅读了如何获得角度官方网站上提到的获取请求的完整响应角度 http https angular io guide http 它说的是添加 observe response 但这适用于get请
使用 PyGTK 的右键菜单（上下文菜单）

所以我对 Python 还很陌生并且已经学习了几个月了但我试图弄清楚的一件事是说你有一个基本的窗口 usr bin env python import sys os import pygtk gtk gobject class app
VS Code 中的输出窗口是不可编辑的，那么我们如何在程序要求时键入输入呢？

当我在输出窗口中输入任何内容时会显示错误 https i stack imgur com 7Lhu4 png 顾名思义输出窗口仅用于显示输出您似乎正在使用 VSCode Coderunner 扩展它默认在输出窗口中运行程序要将其更
Linux环境下串口数据转换为TCP/IP

我需要从Linux系统的串口获取数据并将其转换为TCP IP发送到服务器这很难做到吗我有一些基本的编程经验但对 Linux 的经验不多有没有开源应用程序可以做到这一点在 Linux 中您不需要编写程序来执行此操作只是pipe h
如何检测UITableView的滚动？

有一个与此类似的问题但答案非常笼统模糊检测 UITableView 滚动 https stackoverflow com questions 1587855 detecting uitableview scrolling 请不要驳回
如何阻止 Firefox 在按住 Ctrl 键的情况下在新选项卡中打开 gridview 标头排序回发链接

我试图让 ASP Net 中的 gridview 控件根据用户在尝试通过单击列名称进行排序时是否按下 Ctrl 键进行多重排序问题是当我使用 Firefox 时如果我按下 Ctrl 键单击列名称浏览器会尝试在新选项卡中打开 java
有没有java对象到对象映射的工具？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
SKPaymentTransaction：transactionDate 到底是什么？

在苹果的文档中transactionDate is 交易添加到 App Store 支付队列的日期只读我只是想澄清一下在以下情况下 transactionDate 是什么在时间 T1 购买了一些东西交易日期是 T1 在时间 T2 恢
在浮动元素周围放置边框

假设我有类似以下代码的内容我想在左右浮动的两个图像之间显示一些文本 img src testImage1 png alt Test Image 1 img src testImage2 png alt Test Image 2 p Tes
如何减少 MediaCodec 视频/avc 解码中的延迟

我执行了一些简单的计时电影播放器 java https github com google grafika blob master src com android grafika MoviePlayer java in the Grafik
Mongoose findOneAndUpdate 如何知道对象是否存在以及是否被修改

我在用findOneAndUpdate猫鼬的方法 function update one record Model unique constraint new updated values obj Model findOneAndUpdat
如何在 http POST 请求中发送 HTML 代码？

我正在从 Google Web Toolkit 应用程序向 php 脚本发送 HTTP POST 请求内容类型现在是 application x www form urlencoded 所以我可以将变量发送到 php 并使用 POST 在
使用斐波那契堆时 Dijkstra 是否更快？

使用斐波那契堆时 Dijkstra 是否比使用二进制堆更快我自己做了一些实现斐波那契堆的实验并在 Dijkstra 中使用它我还检查了 fibheap 库中现成的斐波那契堆但没有一个实现能够更快地找到使用以下命令的最短路径二进制堆
多列多对一

我有一个遗留数据库和两个表之间一对一的关系问题是关系使用两列而不是一列在 nhibernate 中是否有某种方法可以说当获取引用的实体时它在 join 语句中使用了两列而不是一列我有一个类似的表结构任务进度进度ID Tas
从纬度和经度获取 Windows TimeZoneInfo

在网络应用程序中我让人们输入他们的地址然后我使用Google 的地理编码 API获取他们的纬度和经度接下来我想得到他们的Windows 时区名称使用这些坐标这样我就可以处理夏令时正确通过 NetTimeZoneInfo objec
尝试使用 Redshift SQL 对累积不同实体进行计数

我正在尝试获取某个时间序列中 Redshift 中不同对象的累积计数最简单的事情就是使用COUNT DISTINCT myfield OVER ORDER BY timefield DESC ROWS UNBOUNDED PRECEDIN

尝试使用 Redshift SQL 对累积不同实体进行计数

尝试使用 Redshift SQL 对累积不同实体进行计数 的相关文章

随机推荐

热门标签

尝试使用 Redshift SQL 对累积不同实体进行计数的相关文章