窗口函数过滤当前行

2024-02-23

这是后续this https://stackoverflow.com/questions/48000013/optimize-slow-aggregates-in-lateral-join问题，我的查询被改进为使用窗口函数而不是内部的聚合LATERAL加入。虽然现在查询速度快得多，但我发现结果不正确。

我需要对 x 年跟踪时间范围执行计算。例如，price_to_maximum_earnings通过获取每行计算max(earnings)十多年前到当前行，并除以price通过结果。为简单起见，我们在这里使用 1 年。

SQL小提琴 http://sqlfiddle.com/#!17/648ff/11对于这个问题。（Postgres 9.6）

举个简单的例子，price and peak_earnings for 2010-01-01可以像这样单独计算：

SELECT price
FROM security_data
WHERE date = '2010-01-01'
AND security_id = 'SPX';

SELECT max(earnings) AS min_earnings
FROM bloomberg.security_data
WHERE date >= '2000-01-01'
AND date <= '2010-01-01'
AND security_id = 'SPX';

去做这个per row，我使用以下内容：

SELECT security_id, date, price
     , CASE WHEN date1 >= min_date
            THEN price / NULLIF(max(earnings) FILTER (WHERE date >= date1) OVER w, 0) END AS price_to_peak_earnings
FROM
(
  SELECT record_id, security_id, price, date, earnings
           , (date - interval '1 y')::date AS date1
           , min(date) OVER (PARTITION BY security_id) AS min_date
      FROM   security_data
) d
WINDOW w AS (PARTITION BY security_id);

我相信这里的问题源于使用FILTER，因为它似乎没有按照我想要的方式工作。请注意，在链接的 SQL Fiddle 中，我显示了以下结果FILTER，并且对于每一行peak_earnings and minimum_earnings只是整个数据集的最大值和最小值。他们should是最大/最小值earnings从 1 年前到当前行。

这里发生了什么？我从答案中知道this https://stackoverflow.com/questions/31396434/referencing-current-row-in-filter-clause-of-window-function我不能简单地说出的问题FILTER (WHERE date >= date1 AND date <= current_row.date)，那么我缺少什么解决方案吗？我不能使用窗框，因为在任何给定的时间范围内我的行数都不确定，所以我不能只是说OVER (ROWS BETWEEN 365 PRECEDING AND CURRENT ROW)。我可以使用框架吗and过滤器？这可能是一年多以前，然后过滤器可以捕获每个无效日期。我已经尝试过这个但没有成功。

我可以使用框架和过滤器吗？

You can。但两者都有限制：

中的表达式为FILTER子句只能看到它获取值的相应行。无法引用窗口函数计算值的行。所以我没有找到一种方法来制定过滤器that行除非我们做了一个巨大、昂贵交叉连接 - 同一行用于许多不同的计算。或者我们回到LATERAL子查询can引用父行。
另一方面，框架定义根本不允许变量。它需要一个固定的数字，正如您引用的相关答案中所讨论的：
- 在窗口函数的 FILTER 子句中引用当前行 https://stackoverflow.com/questions/31396434/referencing-current-row-in-filter-clause-of-window-function

这些限制使您的特定查询难以实现。这应该是correct now:

SELECT *
FROM  (
   SELECT record_id, security_id, date, price
        , CASE WHEN do_calc THEN                max(earnings) OVER w1     END AS peak_earnings
        , CASE WHEN do_calc THEN                min(earnings) OVER w1     END AS minimum_earnings
        , CASE WHEN do_calc THEN price / NULLIF(max(earnings) OVER w1, 0) END AS price_to_peak_earnings
        , CASE WHEN do_calc THEN price / NULLIF(min(earnings) OVER w1, 0) END AS price_to_minimum_earnings
   FROM  (
      SELECT *, (date - 365) >= min_date AND s.record_id IS NOT NULL AS do_calc
      FROM  (
         SELECT security_id, min_date
              , generate_series(min_date, max_date, interval '1 day')::date AS date
         FROM  (
            SELECT security_id, min(date) AS min_date, max(date) AS max_date
            FROM   security_data
            GROUP  BY 1
            ) minmax
         ) d
      LEFT   JOIN  security_data s USING (security_id, date)
      ) sub1
   WINDOW w1 AS (PARTITION BY security_id ORDER BY date ROWS BETWEEN 365 PRECEDING AND 1 PRECEDING)
   ) sub2
WHERE  record_id IS NOT NULL 
ORDER  BY 1, 2;

SQL 小提琴。 http://sqlfiddle.com/#!17/b0fd2/2

Notes

问题中没有任何内容表明每个security_id将会有同一天的行。计算最小/最大日期security_id在子查询中minmax给我们最短的时间范围。
计算的时间范围正好是该行当前日期之前的 365 天，并且not包括当前行（ROWS BETWEEN 365 PRECEDING AND 1 PRECEDING）。它通常更有用exclude聚合中的当前行与当前行进行比较。
我将计算条件调整为同一时间范围，以避免出现极端情况：(date - 365) >= min_date
In the fiddle http://sqlfiddle.com/#!17/b0fd2/2，您为每年 1 月 1 日添加 1 行，您可以看到闰年与固定天数 365 天的对比效果。闰年（2001 年、2005 年……）之后窗框是空的。
我正在使用所有子查询，这通常比 CTE 快一点。
可以肯定的是，我们需要包括ORDER BY在框架定义中。我相应地更新了您链接到的旧答案：
- 在窗口函数的 FILTER 子句中引用当前行 https://stackoverflow.com/questions/31396434/referencing-current-row-in-filter-clause-of-window-function
I use w1作为窗口name，“1 年”期间。你可能会添加w2等，并且每个可以有任意天数。如果你需要的话，你毕竟可以适应闰年。甚至可能根据当前日期生成整个查询......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

窗口函数过滤当前行的相关文章

如何使用表内的 JSONB 数据类型和 PostgreSQL JDBC 驱动程序将 JSON 对象存储到 PostgreSQL 中

我想将以下 json 对象保存到 PostgreSQL 数据库表中as jsonb fname john lname doe 我当前使用 PGObject 创建对象并将类型设置为 jsonb 并将值作为 json 字符串传递寻找更好的 m
Postgres < 9.0 的 DO 块相当于什么

Postgres 8 4 8 相当于什么 DO BEGIN IF NOT EXISTS THEN EXECUTE END IF END create function f returns void as BEGIN IF NOT EXIST
SQL Server 批量插入 - “批量加载数据转换错误”

bulk insert dbo A FROM d AData csv WITH FIELDTERMINATOR ROWTERMINATOR n 将批量数据插入数据库时在检查可疑数据后我遇到了无法解释的错误消息 4867 16 级状态
Magento 设置脚本中的 ALTER TABLE 不使用 SQL

乔纳森戴 https stackoverflow com users 336905 jonathan day says 更新不应采用以下形式 SQL命令我没遇到过任何 DDL 或 DML 语句不能通过 Magento 的配置执行结
从 PL/SQL 调用 shell 脚本，但 shell 以 grid 用户而非 oracle 身份执行

我正在尝试使用 Runtime getRuntime exec 从 Oracle 数据库内部执行 shell 脚本在 Red Hat 5 5 上运行的 Oracle 11 2 0 4 EE CREATE OR REPLACE proced
PostgreSQL：使用for循环迭代表行，根据当前行检索列值

我有以下2张表 CREATE TABLE salesperson t salespersonid numeric 4 0 NOT NULL salespersonname character varying 25 salespersonte
通过 SQLAlchemy 获取随机行

如何使用 SQLAlchemy 从表中选择一个或多个随机行这在很大程度上是一个特定于数据库的问题我知道 PostgreSQL SQLite MySQL 和 Oracle 具有通过随机函数排序的能力因此您可以在 SQLAlchemy 中
Django 中从 sqlite 迁移到 postgresql

我想迁移自sqlite to PostgreSQL db 我安装了 postgresql 并在其 shell 上创建数据库然后配置我的 django 设置如下 default ENGINE django db backends postg
如何创建不返回任何内容的函数

我想写一个函数pl pgsql 我在用着Postgres 企业管理器 v3并使用 shell 来创建一个函数但在 shell 中我必须定义返回类型如果我不定义返回类型我将无法创建函数如何创建一个不返回结果的函数即创建一个新表的函数
java -postgresql 最后插入的 id 插入时未获取

我有一个插入功能postgresql如下 CREATE OR REPLACE FUNCTION insert orderhead order id integer order dt text customer id integer rout
使用条件 SQL 统计每月汇总记录

我有一张桌子我们就叫他们桌子吧SUMMARYDATA NIP NAME DEPARTMENT STATUSIN STATUSOUT TOTALLOSTTIME A1 ARIA BB 2020 01 21 08 06 23 2020 01
Magento --“SQLSTATE[23000]：违反完整性约束..”客户更新

迁移服务器后每次尝试更新客户信息时都会出现错误我正在使用一个客户激活插件 http www magentocommerce com magento connect vinai extension 489 customer activat
Google App Engine Flexi 上 Django 的 Postgres 设置

我正在尝试在应用程序引擎灵活环境中使用 postgres 设置 django 我按照这里的说明进行操作 https cloud google com appengine docs flexible python using cloud sq
如何引用下一行的数据？

我正在 PostgreSQL 9 2 中编写一个函数对于股票价格和日期的表我想计算每个条目较前一天的百分比变化对于最早一天的数据不会有前一天因此该条目可以简单地为 Nil 我知道WITH声明可能不应该高于IF陈述到目前为止这就
Spring Data JPA 选择不同

我有一个情况我需要建立一个select distinct a address from Person a 其中地址是 Person 内的地址实体类型的查询我正在使用规范动态构建我的 where 子句并使用findAll Specifi
Postgres JSON 数据类型 Rails 查询

我正在使用 Postgres 的 json 数据类型但想要使用嵌套在 json 中的数据进行查询排序我想在 json 数据类型上使用 where 进行订购或查询例如我想查询关注者数量 gt 500 的用户或者我想按关注者或关注数
自动删除主键序列中的间隙

我正在创建一个网页该网页根据用户操作将数据存储到 MySQL 数据库中数据库有很多行行的主键是列 rowID 它只是按顺序对行进行编号例如 1 2 3 4 用户可以选择删除行问题是当用户删除最后一行以外的行时 rowID 中有一个
postgreSQL 在 WAMP 上的集成

我刚刚在 Windows 7 上安装了 postgreSQL 我正在尝试将 postgreSQL 与 WAMP 服务器集成为此我在 httpd conf 和 php ini 文件中进行了以下更改 1个加载模块c path to libp
java库维护数据库结构

我的应用程序一直在开发所以偶尔当版本升级时需要创建更改删除一些表修改一些数据等通常需要执行一些sql代码是否有一个 Java 库可用于使我的数据库结构保持最新通过分析类似 db structure version 信息并执
配置“DataSource”以使用 SSL/TLS 加密连接到 Digital Ocean 上的托管 Postgres 服务器

我正在尝试托管数据库服务 https www digitalocean com products managed databases on 数字海洋网 https en wikipedia org wiki DigitalOcean 创建了

随机推荐

如何在 StreamBuilder 中更新 Flutter 卡而不重置状态？

我让 StreamBuilder 正常工作 1 件事每次 1 个元素更改时整个列表都会重置例如每张卡都有一个计数器我希望在不改变屏幕的情况下看到它的加法和减法我怎样才能做到这一点这是我的代码使用完整文件堆栈更新 final
Android：如何从 gridview 中删除一个项目，并将剩余的项目随机就位

背景我有一个包含 36 个按钮的网格假设有 6 行和 6 列编号为 1 到 36 通过 GridView 和自定义适配器一次显示 2 行网格显示良好并且所有滚动都正常工作问题我希望能够单击一个项目将其从网格中删除并将剩余的
从 Qt 5.7 切换到 Qt 5.8 - “代理类型对此操作无效”

我正在尝试使用 Qt 5 8 重新编译一个与 Qt 5 7 配合良好的网络应用程序然而使用Qt 5 8 服务器无法listen int myPort 52000 some accessible port QTcpServer serve
在使用 linq-to-entities 的一对多连接中仅获取一条（最后一条）记录

我在 linq to entities 中有以下内容 clientprojects from p in this SAPMappingEntities SAP Master Projects join c in this SAPMappin
在 GitHub Actions 中缓存 node_modules

我有一个 Yarn monorepo 工作区有 2 个包后端 Node js TypeScript 和前端 React Typescript package json 已修剪 workspaces backend frontend 我正
Xamarin.IOS 上的内存管理如何工作

我正在尝试了解使用 xamarin ios 并在实际 iOS 设备上运行该应用程序时内存管理的工作原理我的理解是iOS平台没有垃圾收集器但是平台使用ARC Automatci Reference Counting 编译后的应用程序真的会
Powershell 在 System.Drawing 中使用 .NET .DrawImage

我正在制作一个工具可以自动裁剪和定位无需将图像大小调整为其他图像我发现this https learn microsoft com en us dotnet api system drawing graphics drawimageu
我正在评估 Google Pub/Sub 与 Kafka。有什么区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我对kafka的工作不多但想在GCE中构建数据管道所以我们想了解 Kafka 与 PUB Sub 基本上我想知道Kafka和Pub
转换为 Func 与新 Func？

下面两条语句有什么区别吗他们都工作 if Func
如何在 C# 中为控件添加移动效果？

我的 C 表单中有一个面板并且有一个按钮当我单击按钮时会显示不可见的面板相反我希望面板移入或滑入例如当您单击组合框时下拉列表不会弹出我希望我的面板像那样显示我怎样才能做到这一点窗口动画是 Windows 的内置功能这
无法传入 lambda 来申请 pandas DataFrame

我正在尝试将函数应用于 pandas DataFrame 的所有行实际上只是该 DataFrame 中的一列我确信这是一个语法错误但我知道我做错了什么 df col apply lambda x y x y total seconds
CLR 项目的智能感知 - 例如没有智能感知系统.Windows.窗体

我一直在关注一些关于某些内容的两个教程Visual C 基础知识 http www functionx com vccli general introprogramming htm但他们似乎都缺乏有关我如何在 Visual Studio 2
Google AppInvites 中断构建

您的应用程序的一部分build gradle这是 tasks withType com android build gradle tasks PackageApplication pkgTask gt pkgTask jniFolders
如何在v-html中运行脚本

我从数据库获取嵌入代码 Instagram Twitter 等如何将它们绑定到 vue 组件有没有办法在v html中执行脚本标签简短的回答你不能一旦 dom 加载您的浏览器就会阻止脚本标签的执行长答案您可以尝试匹配脚本的
如何保留对 NPM 模块所做的本地更改？

我已经使用 NPM 拉下了一个节点模块并将其添加到package json 然而需要更改模块的一些代码因为它没有 100 满足我的要求通常当我使用节点时git我会忽略node modules目录及使用npm install部署到服务
CSS - 并排的内联块，宽度为 100%

我有两个带有文本的块文本的长度不是恒定的用户输入左侧块中包含短文本但右侧块可能包含非常长的文本这些块应该并排出现并且分布在父级恒定宽度的 100 上不多也不少简化示例 https jsfiddle net hh6a03cy
在恒定空间和线性时间内向后打印单链表

我听到一个面试问题向后打印单链表在恒定空间和线性时间中我的解决方案是反转链接列表然后像这样打印它还有其他非破坏性的解决方案吗您已经找到了大部分答案将链表反转到位然后将列表遍历回开头以打印它为了防止它永久破坏性请就地反
AtomicBoolean 与同步块

我试图通过替换一些来减少代码中的线程争用synchronized块与AtomicBoolean 这是一个例子synchronized public void toggleCondition synchronized this mutex i
Subversion 和 CVS 中添加自动内容的标签怎么称呼？

像 log and version 在签入文件时添加数据我有兴趣查看其他人以及他们可以提供哪些信息但除非我知道他们叫什么否则我无法获得太多信息 Subversion 和 CVS 都称它们为Keywords 在这里查看 SVN 手册 h
窗口函数过滤当前行

这是后续this https stackoverflow com questions 48000013 optimize slow aggregates in lateral join问题我的查询被改进为使用窗口函数而不是内部的聚合LAT

窗口函数过滤当前行

Notes

窗口函数过滤当前行 的相关文章

随机推荐

热门标签

窗口函数过滤当前行的相关文章