这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？

2024-01-26

我有以下 sql 语句，它运行得很好。我希望看到如何重构它，这样它就不需要使用 RANK/PARTITION ...如果可能的话。

SELECT LogEntryId, FileId, CreatedOn, EventTypeId
FROM (SELECT a.LogEntryId, a.FileId, a.CreatedOn,  a.EventTypeId, 
        RANK() OVER (PARTITION BY ClientName ORDER BY a.CreatedOn DESC) AS MostRecentEventRank
    FROM LogEntries a
    WHERE (a.EventTypeId = 2 or a.EventTypeId = 4)) SubQuery
WHERE MostRecentEventRank = 1

它想做什么？

获取表中的所有记录，按客户名称分组，然后按最近创建的顺序排序。
仅按事件类型 #2（连接）或 #4（断开连接）对此进行过滤。
现在，对于每个客户名称，检索最新记录。

这实际上是为表中的每个唯一用户获取最近的事件（连接或断开连接）。

我确实喜欢排名/分区，但我希望看看是否可以不使用它。

还有另一种变体：选择客户端，然后使用 CROSS APPLY (.. TOP (1) ... ORDER BY ...) 获取相关条目。

SELECT c.ClientName,r.LogEntryId, r.FileId, r.CreatedOn,  r.EventTypeId
FROM (
 SELECT DISTINCT ClientName
 FROM LogEntries
 WHERE EventTypeId IN (2,4)) as c
CROSS APPLY (
   SELECT TOP (1) a.LogEntryId, a.FileId, a.CreatedOn,  a.EventTypeId
   FROM LogEntries as a
   WHERE a.ClientName = c.ClientName
   AND a.EventTypeId IN (2,4)
   ORDER BY a.CreatedOn DESC) as r;

Update

在不了解架构的情况下谈论 T-SQL 查询的性能是没有意义的。该查询在正确设计的架构上满足其需求是完美的最佳选择。由于访问是通过 ClientName 和 CreatedOn 进行的，因此即使是简单的模式也需要考虑到这一点：

CREATE TABLE LogEntries (
   LogEntryId int identity(1,1),
   FileID int,
   CreatedOn datetime,
   EventTypeID int,
   ClientName varchar(30)
);

create clustered index cdxLogEntries on LogEntries (
    ClientName, CreatedOn DESC);
go

让我们加载包含 240 万行的表：

declare @i int;
set @i = 0;

while @i < 1000
begin
    insert into LogEntries (FileId, CreatedOn, EventTypeId, ClientName)
    select cast(rand()*100 as int),
        dateadd(minute, -rand()*10000, getdate()),
        cast(rand() * 5 as int),
        'Client' + cast(@i as varchar(10))
        from master..spt_values;
    set @i = @i+1;
end

我们的时间和 IO 是多少set statistics io on; set statistics time on;在预热的缓存上？

(410 row(s) affected)
Table 'LogEntries'. Scan count 411, logical reads 14354, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

SQL Server Execution Times:
   CPU time = 1219 ms,  elapsed time = 1932 ms.

1.9 秒即可从我的笔记本电脑（已使用 4 年且具有 1Gb RAM）上的 240 万个条目中获取数据。而且模式设计仍有很大的改进空间。将 ClientName 分离到规范化表中，并使用来自 LogEntries 的可信外键将其显着减少时间。 EntryTypeId IN (2,4) 上正确的过滤索引也会有所帮助。我们甚至没有开始探索并行可能性。

这就是 SQL，性能是在架构的绘图板上获得的，而不是在查询的文本编辑器中获得的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？的相关文章

查询嵌套查询结果中两列的位置

我正在编写这样的查询 select from myTable where X in select X from Y and XX in select X from Y X 列和 XX 列的值必须位于同一查询的结果中 select X fro
访问数据库 LIMIT 关键字

我试图让我的页面列表功能在 ASP 中与 Access 数据库一起工作但我不知道 Microsoft SQL 中 LIMIT 的替代方案我已经尝试过 TOP 但这似乎不起作用这是 MySQL 中使用的语句 SELECT FROM cu
MySQL 正在将我的时间戳值转换为 0000-00-00

我是 PHP 新手目前仍在学习中我认为我的注册表有问题 username password email全部成功插入MySQL registered and last seen不要我以为我正在使用getTimestamp 错了但它呼应
SQL Server 2008 R2 内连接无法匹配 varchar 字段，因为它包含特殊字符

我们正在将 Microsoft SQL Server 2008 R2 用于我们的经典 ASP 应用程序之一我们有两张表 TableA TableB TableA有以下列 InstName varchar 1024 TableB有这些列 I
MYSQL 按喜欢/不喜欢和受欢迎程度排序

我有评论表其中包括喜欢和不喜欢的内容现在我在正确的顺序上遇到了问题实际上我的系统在顶部显示了最多点赞的评论我正在 youtube 上寻找类似系统的东西这意味着 100like 100dislikes 的评论的顺序高于 1 1 我
SQL Server“未找到网络路径”在不同环境中随机且不频繁地发生

类似如果不是同一个问题随机遇到网络路径未找到异常 https stackoverflow com questions 38696448 network path not found exception encountered rando
SQL Android 错误：没有这样的表

因此每次我在位于 AddContacts 类中的 EditText 字段中输入数据时我的对话框都会显示我已成功添加信息但在日志 cat 中却显示没有这样的表 contactsTable 我认为错误出在我的数据库类中的 onCreate
主键默认可以为NULL吗？为什么这样描述呢？

我有一张桌子当我describe这是 mysql gt DESC my table Field Type Null Key Default Extra contact id int 11 NO PRI NULL auto incremen
SQL Server 每年的第一个星期一

如何使用 T SQL 查找一年中的第一个星期一这是 ngruson 发布的链接中的示例 http sqlbump blogspot nl 2010 01 first monday of year html http sqlbump bl
如何授予 SQL Server 代理访问权限以便能够写入/修改系统文件？

我的工作有一个存储过程运行 BCP 来查询一些数据如果我单独运行 QUERYOUT 命令它就会起作用但是如果我尝试在作业中运行它它会创建文件但挂起并且数据永远不会放入文件中这会永远挂起所以我通常终止 BCP exe 我的
<表值函数> 不是可识别的内置函数名称

我收到此错误消息 195 第 15 级状态 10 第 1 行 fnParseName 不是可识别的内置函数名称对于这个查询 SELECT fnParseName DOCTORFIRSTNAME DOCTORLASTNAME FROM
Python Rope：如何在所有子模块重构中查找所有缺失的导入和错误

我试图找到每个模块及其子模块的所有丢失的导入语句和错误是否有专门的工具来完成我想要做的事情我写的代码但看起来真的很糟糕也许这样的东西已经存在了 import os def find missing imports walk for
无法访问 Big Query 中类型为 ARRAY> 的字段

我正在尝试在 BigQuery 上使用标准 SQL 方言即不是旧版 SQL 运行查询我的查询是 SELECT date hits referer FROM refresh ga sessions xxxxxx LIMIT 1000 但不
SQL Server 中全文搜索的奇怪行为

我的 MyTable 带有列消息 NVARCHAR MAX ID 为 1 的记录包含消息 0123456789333444 Test 当我运行以下查询时 DECLARE Keyword NVARCHAR 100 SET Keyword 01
SQL Server 端口 445 和 1433

SQL Server 端口 445 和 1433 之间有什么区别以及每个端口的用途是什么 445不是SQL端口是SMB端口仅当您使用命名管道协议时它才会参与 SQL Server 因为命名管道通过 SMB 进行传输而这反过来又使用
查询获取每条记录的最小日期[重复]

这个问题在这里已经有答案了我想获取表中每条记录的最小日期该表具有多个带有一个主键的日期条目看看我的桌子 CaseNo Entry date ABC 001 2 12 13 ABC 002 2 09 13 ABC 001 1 01 13
pyspark.sql.functions.window 函数的“startTime”参数和 window.start 有何作用？

示例如下 df spark createDataFrame 1 2017 05 15 23 12 26 2 5 1 2017 05 09 15 26 58 3 5 1 2017 05 18 15 26 58 3 6 2 2017 05 15
PostgreSQL 窗口函数：row_number() over（按 col2 分区 col 顺序）

以下结果集源自具有一些连接和联合的 SQL 查询 SQL 查询已经对 Date 和 game 上的行进行了分组我需要一列来描述按日期列分区的游戏的尝试次数 Username Game ID Date johndoe1 Game 1 100
如何在 CAST/CONVERT 之前检查 VARCHAR(n) 的 XML 格式是否正确

我的公司有一个日志表其中包含VARCHAR N 放置字符串的列即supposed是 XML 但事实证明它并不总是格式良好的为了对日志记录进行分析以确定错误趋势等我一直在使用LIKE陈述然而这非常慢最近我发现SQL Serv
火鸟删除速度很慢

我正在做这个简单的交易 DELETE FROM ominve01 WHERE CVE OBS IN SELECT CVE OBS FROM minve01 M WHERE M FECHA DOCU lt 31 12 2010 OR FECH

随机推荐

使用带有子存储库和子模块的深层 Git 存储库-存储库更改权限？

我决定默认限制存储库树中的可见范围以便为精美的东西创建公共文件夹现在因为有很多子存储库我得到了一个痛苦的提交或一些聪明的想法我不确定最好的方法我考虑过使用 find 遍历存储库然后对每个存储库进行一致的虚拟提交例如 defau
如何将网络摄像头转为 rtsp

我有一个产品可以在输入 rtsp url 后分析视频我想使用网络摄像头通过网络摄像头 rtsp 流式传输并提供我的产品我怎样才能做到这一点这取决于您使用的网络摄像头大多数支持 RTSP 但许多不发布访问流的接口因为它们设计为与网
了解 Spark 创建的分区数量

读取 csv 时 pyspark sql 将创建多少个分区我对此的理解是 number of partitions math ceil file size spark conf get spark sql files maxPartiti
如果行中的其他单元格与值匹配，则将单元格从一个工作表复制到另一个工作表

我想要的是将单元格从一张纸复制到另一张纸前提是同一行不同列中的另一个单元格在 Google 表格中具有特定值理想情况下我希望这是实时的如果我在第一张表中添加一行并且条件匹配第二张表也会更新这是一个例子 Sheet one C
无法从 docker 容器内部访问 datadog 代理

我在 Amazon linux ec2 上安装了 dd agent 如果我直接在主机上运行 python 脚本我使用名为 dogstatsd python 的 SDK 则所有指标都可以发送到 datadog 我登录到 datadoghq
在 onStart() 之后直接调用 Fragment onStop() - 为什么？

我的应用程序遇到了一个奇怪的问题 A 有一个包含片段的片段活动该片段启动 AsyncTask onCreate 并取消 AsyncTask onStop 我的问题出现是因为尽管我的 Fragment 保持运行并且没有被遮挡但 onSt
使用 Spring IoC 设置枚举值

有没有办法在构造时通过 Spring IoC 设置此类枚举值我想做的是在类加载时注入硬编码在下面的代码片段中的值 public enum Car NANO Very Cheap India MERCEDES Expensive Germa
现有类型是否可以扩展以与 Seq.sum 等一起使用？

最近一直在处理很多时间跨度并且需要获得总和和平均值但是 TimeSpan 既没有定义运算符 get Zero 也没有定义 DivideByInt 因此 Seq sum 和 Seq average 不能直接与此类型一起使用以下情况无法编
PEP572 中的海象运算符示例

中给出的示例之一PEP572 https www python org dev peps pep 0572 is Reuse a value that s expensive to compute y f x y 2 y 3 目前在 pyt
变换后的子项在 Safari 中被父项背景剪裁，与 z-index 无关。为什么？

我有这个加载器在所有内容中都渲染得很好但 Safari 除外 pageLoader min height 100vh min width 100vw background color white z index 2 position f
更新 /.pub-cache 中的 flutter 依赖项

我在文件夹里删除了 pub cache hosted pub dartlang org this plugin 更新里面的依赖的命令是什么pubsec yaml 我相信是的颤振包获取下的文件夹 pub cache仍然不是最新的注意有
当视图模型没有域模型那么多的字段时，如何忽略/保留 MVC 中的值？

我有一个网站我正在使用 FluentNhibernate 和 Asp net MVC 我有一个编辑视图允许用户编辑该记录对象的 10 个属性中的 8 个当您提交表单和模型绑定时两个不可编辑的字段将作为空字符串或默认日期时间值返回
提取边界内的图像区域

我必须使用 2D CT 图像做一个项目并使用 Matlab 仅对其中的肝脏和肿瘤进行分割最初我必须单独分割肝脏区域我使用区域生长进行肝脏分割它获取种子点作为输入输出是具有肝脏区域边界的图像现在我需要仅由边界包围的区域我的程序
java.lang.IndexOutOfBoundsException: setSpan (N ... N) 结束长度超出 10500

当我打电话时我得到这个异常EditText setSelection java lang IndexOutOfBoundsException setSpan N N ends beyond length 10500 N 可以是任意数字例如
jqGrid 字体设置被 jQueryUI 选项卡设置覆盖

我有类似的问题this one https stackoverflow com questions 7282130 wrong font size when using jqgrid inside jqueryui tab 我使用 jQue
删除 PANDAS 中的第二行标题

我在 PANDAS 中有一个数据框其中有两行标题如何删除第二行例如我有以下内容 AA BB CC DD A B C D Index 1 1 2 3 4 2 5 6 7 8 3 9 1 2 3 我想要得到这样的东西 AA BB CC
“自动化错误：调用的对象已与其客户端断开连接”

我明白了尼克的建议以下是我收到的错误号和描述 2147417848 80010108 自动化错误调用的对象有与客户断开连接我调试时突出显示的代码行是 Rows Lst Insert Shift xlDown 我以为我在这个或另一个论
ReactJS 使用动态键及其数据迭代状态数组

我有一个像这样的数组 data key1 key val1 data1 key val2 data2 key val3 data3 key val4 data4 key2 key val1 data1 key val2 data2 key
Maven依赖groovy

我正在运行一个依赖于 groovy 1 7 beta 1 的项目 gmaven 插件使用 groovy 版本 1 6 作为依赖项在我的 pom 中我在依赖管理部分将 grooyv all 版本指定为
这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？

我有以下 sql 语句它运行得很好我希望看到如何重构它这样它就不需要使用 RANK PARTITION 如果可能的话 SELECT LogEntryId FileId CreatedOn EventTypeId FROM SELECT

这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？

这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？ 的相关文章

随机推荐

热门标签

这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？的相关文章