SQL ROW_NUMBER() 过度性能问题

2024-03-16

我有这个 SQL 工作正常。

希望我的过滤器返回具有最高 UserSessionSequenceID 的最新唯一 SessionGuids。

问题是性能很糟糕 - 即使我有很好的索引。我如何重写它 - 以省略 ROW_NUMBER 行？

SELECT TOP(@resultCount) * FROM 
(
    SELECT
        [UserSessionSequenceID]
        ,[SessionGuid]
        ,[IP]
        ,[Url]
        ,[UrlTitle]
        ,[SiteID]
        ,[BrowserWidth]
        ,[BrowserHeight]
        ,[Browser]
        ,[BrowserVersion]
        ,[Referer]
        ,[Timestamp]
        ,ROW_NUMBER() over (PARTITION BY [SessionGuid] 
                                    ORDER BY UserSessionSequenceID DESC) AS sort 
   FROM [tblSequence]
) AS t     
WHERE ([Timestamp] > DATEADD(mi, -@minutes, GETDATE())) 
  AND (SiteID = @siteID) 
  AND sort = 1
ORDER BY [UserSessionSequenceID] DESC

多谢：-）

即使我有很好的索引

无意冒犯，但让我们来判断一下。始终发布exact当询问 SQL Server 性能问题时，表的架构，包括所有索引和基数。

例如，让我们考虑以下表结构：

create table tblSequence (
 [UserSessionSequenceID] int not null
        ,[SessionGuid] uniqueidentifier not null
        ,[SiteID] int not null
        ,[Timestamp] datetime not null
        , filler varchar(512));
go

create clustered index cdxSequence on tblSequence (SiteID, [Timestamp]);
go

与您的相同，但与性能问题无关的所有字段都聚合到通用填充符中。让我们看看，例如，大约 50k 会话的 1M 行的性能有多差？让我们用随机数据填充表格，但我们将模拟“用户活动”的内容：

set nocount on;
declare @i int = 0, @sc int = 1;
declare @SessionGuid uniqueidentifier = newid()
    , @siteID int = 1
    , @Timestamp datetime = dateadd(day, rand()*1000, '20070101')
    , @UserSessionSequenceID int = 0;
begin tran;
while @i<1000000
begin
    insert into tblSequence (
        [UserSessionSequenceID]
        ,[SessionGuid]
        ,[SiteID]
        ,[Timestamp]
        , filler)
    values (
        @UserSessionSequenceID
        , @SessionGuid
        , @siteID
        , @timestamp
        , replicate('X', rand()*512));

    if rand()*100 < 5
    begin
        set @SessionGuid = newid();
        set @siteID = rand() * 10;
        set @Timestamp = dateadd(day, rand()*1000, '20070101');
        set @UserSessionSequenceID = 0;
        set @sc += 1;
    end
    else
    begin
        set @timestamp = dateadd(second, rand()*300, @timestamp);
        set @UserSessionSequenceID += 1;
    end

    set @i += 1;
    if (@i % 1000) = 0
    begin
        raiserror(N'Inserted %i rows, %i sessions', 0, 1, @i, @sc);
        commit;
        begin tran;
    end
end
commit;

这大约需要 1 分钟才能充满。现在让我们查询您提出的相同查询：过去 Y 分钟内站点 X 上的任何用户会话的最后一个操作是什么？我必须使用@now的特定日期而不是GETDATE()，因为emy dtaa是模拟的，而不是真实的，所以我使用为SiteId 1随机填充的最大时间戳：

set statistics time on;
set statistics io on;

declare @resultCount int = 30;
declare @minutes int = 60*24;
declare @siteID int = 1;
declare @now datetime = '2009-09-26 02:08:27.000';

SELECT TOP(@resultCount) * FROM  
( 
    SELECT 
        [UserSessionSequenceID] 
        ,[SessionGuid] 
        , SiteID
        , Filler
        ,[Timestamp] 
        ,ROW_NUMBER() over (PARTITION BY [SessionGuid]  
                                    ORDER BY UserSessionSequenceID DESC) AS sort  
   FROM [tblSequence] 
   where SiteID = @siteID
   and [Timestamp] > DATEADD(mi, -@minutes, @now)
) AS t      
WHERE sort = 1 
ORDER BY [UserSessionSequenceID] DESC ;

这与您的查询相同，但限制性过滤器已移动insideROW_NUMBER() 部分子查询。结果返回：

Table 'tblSequence'. Scan count 1, logical reads 12, physical reads 0.

 SQL Server Execution Times:
   CPU time = 0 ms,  elapsed time = 31 ms.

热缓存上的响应时间为 31 毫秒，从表的近 60k 页中读取了 12 页。

Updated

再次阅读原始查询后，我意识到修改后的查询是不同的。你只需要new会议。我仍然相信通过 SiteID 和 Timestmap 进行过滤是获得必要性能的唯一方法，因此解决方案是使用 NOT EXISTS 条件验证候选发现：

SELECT TOP(@resultCount) * FROM  
( 
    SELECT 
        [UserSessionSequenceID] 
        ,[SessionGuid] 
        , SiteID
        , Filler
        ,[Timestamp] 
        ,ROW_NUMBER() over (
            PARTITION BY [SessionGuid]  
            ORDER BY UserSessionSequenceID DESC) 
         AS sort  
   FROM [tblSequence] 
   where SiteID = @siteID
   and [Timestamp] > DATEADD(mi, -@minutes, @now)
) AS new
WHERE sort = 1 
and not exists (
    select SessionGuid 
    from tblSequence
    where SiteID = @siteID
    and SessionGuid = new.SessionGuid
    and [TimeStamp] < DATEADD(mi, -@minutes, @now)
)
ORDER BY [UserSessionSequenceID] DESC

这在我的笔记本电脑上返回，在 40 毫秒内从热缓存中返回超过 400k 会话的 1M 行：

Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0
Table 'tblSequence'. Scan count 2, logical reads 709, physical reads 0

 SQL Server Execution Times:
   CPU time = 16 ms,  elapsed time = 40 ms.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SQL ROW_NUMBER() 过度性能问题的相关文章

java.sql.SQLException: ORA-01005: 给定的密码为空；登录被拒绝

我在尝试连接到数据库时遇到以下异常 java sql SQLException ORA 01005 null password given logon denied at oracle jdbc driver T4CTTIoer proce
需要帮助在 MS Access 中实施完全外部联接

我无法让查询在 Access 中正常工作我需要 dbo cardpurchases 和 dbo vendors 上的完整外部联接以便所有所有供应商都将出现在查询中无论是否在该供应商处进行购买但 Access 不支持完全外部联接我还
oracle 数据透视表中的列

示例选择 select from select 1 cnt 2 sm 55 name 12 month 2011 year 12 2011 mnth txt from dual union all select 1 cnt 2 sm 54
选择表中的人员并排除妻子，但合并他们的名字

我有一张桌子Person PersonID FirstName LastName 1 John Doe 2 Jane Doe 3 NoSpouse Morales 4 Jonathan Brand 5 Shiela Wife And a R
从 oracle 中为每个组选择最新行

我在留言簿中有一张包含用户评论的表格列有 id user id 标题评论时间戳我需要为每个用户选择最新行我尝试使用 group by 执行此操作但没有管理它因为我无法在按 user id 分组的同一查询中选择任何其他内容 SE
通过“SELECT”命令选择每组的前两条记录的最佳方法是什么？

例如我有下表 id group data 1 1 aaa 2 1 aaa 3 2 aaa 4 2 aaa 5 2 aaa 6 3 aaa 7 3 aaa 8 3 aaa 通过 SELECT 命令选择每组的前两条记录的最佳方法是什么如果没有
SQL查询：按字符长度排序？

是否可以按字符总数对sql数据行进行排序 e g SELECT FROM database ORDER BY data length 我想你想用这个 http dev mysql com doc refman 5 0 en string f
导出 Azure SQL 数据库时出现错误 SQL71501

导出 Azure SQL 数据库时出现奇怪的错误导出一直工作正常直到最近发生一些架构更改但现在出现错误 SQL71501 该数据库是V12 兼容性级别130 尽管master数据库仍兼容级别 120 该问题似乎是由一个新的表值函数引起
SQL：使用相等的键和最近的键进行连接（类似于 Pandas 的合并）

例如我有2个这样的表对于表 1 中的每一行我想获取该行 same customer id and nearest date 就我而言 table2 date lt table1 date 结果应该是这样的我怎样才能在 SQL 中做到
Visual Studio 2008 (C#) 与 SQL Compact Edition 数据库错误：26

与网络相关或特定于实例的建立时发生错误连接到 SQL Server 服务器未找到或无法访问验证实例名称是否为正确并且 SQL Server 是配置为允许远程连接提供商 SQL 网络接口错误 26 错误定位指定服务器实
在调用存储过程 Sql Server 2008 时使用嵌套存储过程结果

是否可以在另一个存储过程中使用一个存储过程的结果 I e CREATE PROCEDURE dbo Proc1 ID INT mfgID INT DealerID INT AS BEGIN DECLARE Proc1Result UserD
将 Python 中创建的 pandas 数据框插入 SQL Server

如前所述我在 Python 中创建了一个数据集合 40k 行 5 列我想将其插入 SQL Server 表中通常在 SQL 中我会做一个 select into myTable from dataTable 调用来执行插入但是 p
当添加列较少时追加到现有 SQLite 表，而不将数据库读入 R

是否有一些简单的方法无论是在 SQL 端还是在 R 端将 data frame 附加到具有更多列的现有表缺失的列应该用 NA 填充如果它能够优雅地处理比表 1 列数更多的表 2 那么会加分吗 library RSQLite Crea
在触发器中记录更新操作

我有一个 UPDATE 触发器它生成 INSERTED 和 DELETED 表如下所示 INSERTED Id Name Surname 1 Stack Overflow 2 Luigi Saggese DELETED Id Name
Oracle中如何转义单引号？ [复制]

这个问题在这里已经有答案了我有一列包含某些存储为文本字符串的表达式其中包括单个引号例如错过的交易包括引号发生这种情况时如何使用 where 子句 select from table where reason missed tra
SQL 解析键值字符串

我有一个像这样的逗号分隔字符串 key1 value1 key2 value2 key3 value3 key1 value1 1 key2 value2 1 key3 value3 1 我想将它解析成一个如下所示的表 Key1 Key2
寻找多列索引的最佳顺序

假设我有一个包含两个索引的表一个位于 a 列一个位于 a b 和 c 列我注意到根据索引定义中列的顺序 MySQL 可能最终使用单列索引而不是多列索引即使多列索引中的所有三列都在 ON 中引用JOIN 的一部分这有点引出了一个问
想要从字符格式转换为带小数的数字格式

想要将字符格式 00001000000 转换为10000 00 请帮我我已经尝试过 select to number 00012300 9999999999 99 nls numeric characters from dual 这个脚本
获取MySql中重复行的列表

我有一张这样的桌子 ID nachname vorname 1 john doe 2 john doe 3 jim doe 4 Michael Knight 我需要一个查询该查询将从具有相同 nachname 和 vorname 的记录
sql查询连接两个服务器中不同数据库的两个表

我在 ServerS 上的数据库中有两个表 tableA 在 ServerB 上的数据库中有两个表我只想根据这些表的公共字段名对这些表执行 fullouter join 在 SQL Server 中您可以创建一个链接服务器在 Mana

随机推荐

Android-NDK-添加本机支持-NDK 位置在首选项中无效

我正在尝试使用调试模式调试为 Android 本机应用程序控制台说我需要添加本机支持但是当我按照说明进行操作时它显示如下图我应该如何处理 NDK 位置在首选项中无效任何意见将是有益的我对此很陌生谢谢该示例是 NDK 示例
为带有附件的电子邮件设置多部分

从我的应用程序中我发送带有附件的邮件完整的代码在这里 public int sendMail MailDraft mailDraftInstance mailInstance path Send the mail String mail
为什么.NET Core DI容器不注入ILogger？

我正在尝试在基于 NET Core 2 1 的 C 控制台应用程序中登录并运行我将以下代码添加到我的 DI 声明中 var sc new ServiceCollection sc AddLogging builder gt builder
GDB 在 macOS Catalina 上冻结

我在 mac 上运行了 helloworld 来尝试 GDB 但在输入 run 后输出 New Thread 0x1903 of process 69034 然后就什么也没有了我等了一个小时了还是没有任何动静完成认证并禁用startu
使用 PDO 连接 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 刚刚开始使用 PDO 请解释我的连接
如何使用 PHP 打印 JavaScript

我需要将一些 JS 变量传递给 PHP 但遇到了一些麻烦我已经尝试过以下方法 product id echo product id 但这只是将其打印为字符串我将如何存储该 JS 变量然后echo它使用 PHP 吗我对 PHP 很陌生
不同数据的单独链接/关联表？

哪种设计方法更好为数据库中的每种数据类型建立单独的链接关联表还是将通用标识合并到公共链接关联表中因为如果没有例子这个问题真的没有意义假设我有一个数据库其中包含作者和书籍的数据使用人们可以轻松掌握和识别的示例为了简单起见每
如何用 C 语言检查 Windows 上的目录是否存在？

Question 在 Windows C 应用程序中我想验证传递给函数的参数以确保指定的路径存在如何用 C 语言检查 Windows 上的目录是否存在我知道你可能会陷入竞争条件在你检查路径是否存在和使用它不再存在的时间之间但我可以
如何调整组合框下拉列表中的字符？

如何证明下拉部分中列出的值的合理性ttk Combobox 我努力了justify center 但这似乎只配置所选项目如果有的话也可以使用资源链接我找不到它 try In order to be able to import tkin
MediaSource 从不在 React 中发出 sourceopen 事件

我正在尝试在 React 自定义挂钩中使用 Javascript 的 MediaSource API 流式传输视频文件这是我的代码片段 const useMyHook videoRef React MutableRefObject
如何使用 Google Closure 编译器删除未使用的 JavaScript 代码？

如何使用 Google Closure 编译器删除未使用的代码我正在使用 JQuery Slider 控件但没有使用 JQuery 中的其他任何内容所以我读到了 Google Closure 编译器Advanced模式可以删除未使用的
为什么 Whitenoise 在 Heroku 上的默认 Django 项目中崩溃？

我正在尝试按照 Heroku 的说明启动一个新的 Django 应用程序当我开始激活白噪音时它崩溃了我什至还没有编写任何应用程序代码出了什么问题这是网络工作者崩溃的回溯 2015 06 26 20 37 36 0000 11 ER
关系中的核心数据总和

我有一个类别实体有很多费用我想获得给定月份内某个类别的所有费用总和 NSNumber totalForMonth NSDate date NSPredicate sumPredicate NSPredicate predicateWit
为什么php的mail()函数发送邮件成功但字段为空？

电子邮件已到达目标地址但字段为空原因是什么我的使用mail 如下
使用 keras 保存的 ML.NET 加载模型

我有一个用 Python 和 Keras 实现的神经网络训练完成后我导出了模型并得到了两个文件 model js 和 model h5 现在我想在 NET 项目中进行实时分类并且我想使用经过训练的神经网络 ML NET 中是否有一种
在 R 绘图子图上获取单独的轴标签

使用 R 时plotly包版本 4 5 6 我无法弄清楚如何在使用组合多个图时显示轴标签subplot 以下是未显示 x 轴标签的示例 require plotly a lt data frame x1 1 3 y 30 32 b lt d
获取 MongoDB 中数组的第 n 个元素

作为 MongoDB 文档的一部分我存储了一个对象数组例如如何仅查询数组的第四个元素所以我不想取出整个数组只取出第四个元素 Use slice db foo find bar xyz my array slice n 1 将检索
没有名为flask_script的模块

我正在尝试运行一个需要flask script 的程序 Flask既安装在我的机器上又安装在虚拟环境中我无法让我的机器或虚拟环境找到flask script 请指教运行Ubuntu 你真的安装了 Flask Script 吗如果没有
从mongodb集合中获取最新记录

我想知道集合中最新的记录怎么做注意我知道以下命令行查询有效 1 db test find sort idate 1 limit 1 forEach printjson 2 db test find skip db test count
SQL ROW_NUMBER() 过度性能问题

我有这个 SQL 工作正常希望我的过滤器返回具有最高 UserSessionSequenceID 的最新唯一 SessionGuids 问题是性能很糟糕即使我有很好的索引我如何重写它以省略 ROW NUMBER 行 SELECT T

SQL ROW_NUMBER() 过度性能问题

SQL ROW_NUMBER() 过度性能问题 的相关文章

随机推荐

热门标签

SQL ROW_NUMBER() 过度性能问题的相关文章