SQL Server：合并性能

2023-12-06

我有一个包含 500 万行的数据库表。聚集索引是自增标识列。还有PK是生成256字节的代码VARCHAR这是 URL 的 SHA256 哈希值，这是表上的非聚集索引。

表格如下：

CREATE TABLE [dbo].[store_image](
    [imageSHAID] [nvarchar](256) NOT NULL,
    [imageGUID] [uniqueidentifier] NOT NULL,
    [imageURL] [nvarchar](2000) NOT NULL,
    [showCount] [bigint] NOT NULL,
    [imageURLIndex]  AS (CONVERT([nvarchar](450),[imageURL],(0))),
    [autoIncID] [bigint] IDENTITY(1,1) NOT NULL,
 CONSTRAINT [PK_imageSHAID] PRIMARY KEY NONCLUSTERED 
(
    [imageSHAID] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
) ON [PRIMARY]

GO

CREATE CLUSTERED INDEX [autoIncPK] ON [dbo].[store_image] 
(
    [autoIncID] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
GO

imageSHAID是图像 URL 的 SHA256 哈希值，例如”http://blah.com/image1.jpg"，它被散列成 256 长度的 varchar。
imageGUID是一个代码生成的 guid，我在其中标识图像（稍后将用作索引，但现在我省略了此列作为索引）
imageURL是图像的完整 URL（最多 2000 个字符）
showCount是图像显示的次数，每次显示该特定图像时都会递增。
imageURLIndex是一个限制为 450 个字符的计算列，这允许我在 imageURL 上进行文本搜索（如果我选择的话），它是可索引的（为了简洁起见，再次省略了索引）
autoIncID是聚集索引，应该允许更快地插入数据。

我定期从临时表合并到store_image桌子。临时表结构如下（与store_image表非常相似）：

CREATE TABLE [dbo].[store_image_temp](
    [imageSHAID] [nvarchar](256) NULL,
    [imageURL] [nvarchar](2000) NULL,
    [showCount] [bigint] NULL,
) ON [PRIMARY]

GO

当合并过程运行时，我写了一个DataTable使用以下代码到临时表：

using (SqlBulkCopy bulk = new SqlBulkCopy(storeConn, SqlBulkCopyOptions.KeepIdentity | SqlBulkCopyOptions.KeepNulls, null))
{
    bulk.DestinationTableName = "[dbo].[store_image_temp]";
    bulk.WriteToServer(imageTableUpsetDataTable);
}

然后我运行合并命令来更新showCount in the store_image表通过基于临时表合并imageSHAID。如果图像当前不存在于store_image表，我创建它：

merge into store_image as Target using [dbo].[store_image_temp] as Source
on Target.imageSHAID=Source.imageSHAID 
when matched then update set 
Target.showCount=Target.showCount+Source.showCount 
when not matched then insert values (Source.imageSHAID,NEWID(), Source.imageURL, Source.showCount);

我通常尝试将临时表中的 2k-5k 行合并到store_image任何一个合并过程中的表。

我曾经在 SSD 上运行此数据库（仅连接 SATA 1），速度非常快（低于 200 毫秒）。我的 SSD 空间不足，因此我将 DB 更换为 1TB 7200 缓存旋转磁盘，此后完成时间超过 6-100 秒（6000 - 100000MS）。当批量插入运行时，我可以看到磁盘活动约为 1MB-2MB/秒，CPU 使用率较低。

这是这种数据量的典型写入时间吗？我觉得有点慢，是什么导致性能缓慢？肯定与imageSHAID被索引后，我们应该期望比这更快的寻道时间？

任何帮助，将不胜感激。

谢谢你的时间。

Your UPDATE中的条款MERGE更新showCount。这需要对聚集索引进行键查找。

然而，聚集索引也被声明为非唯一的。即使基础列是唯一的，这也会向优化器提供信息。

所以，我会做出这些改变

聚集主键为autoIncID
目前的PKimageSHAID成为独立的唯一索引（非约束）并添加 INCLUDEshowCount。唯一约束不能包含 INCLUDE

更多观察：

你不需要nvarchar对于哈希或 URL 列。这些不是 unicode。
哈希值也是固定长度的，因此可以char(64)（对于 SHA2-512）。
列的长度定义分配给查询的内存量。请参阅此了解更多信息：varchar(500) 比 varchar(8000) 有优势吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

sqlserver

MERGE

sqlperformance

SQL Server：合并性能的相关文章

如何在 SqlDataReader.Read() 期间从死锁异常中恢复

我的 NET 应用程序的事件日志显示它在从 Sql Server 读取数据时偶尔会出现死锁这种情况通常非常罕见因为我们已经优化了查询以避免死锁但有时仍然会发生过去我们在调用ExecuteReader函数在我们的SqlComman
如何在事务中使用链接服务器插入远程表？

我的链接服务器设置正确我能够执行以下查询插入远程服务器表 SELECT FROM 本地服务器表然而当我做同样的事情时交易内开始传输插入远程服务器表 SELECT FROM 本地服务器表提交交易我收到类似的错误用于
SQL Server 中的嵌套事务

sql server 允许嵌套事务吗如果是的话那么交易的优先级是什么来自 SQL Server 上的 MSDN 文档嵌套交易 http msdn microsoft com en us library ms189336 SQL 90
计算包含字母/数字的行数

我想要实现的目标很简单但是解释起来有点困难我不知道在 postgres 中这是否真的可能我处于相当基础的水平 SELECT FROM WHERE LEFT JOIN ON HAVING 等等基本的东西我正在尝试计算包含特定字母数字
MySQL 最佳实践：SELECT 子递归尽可能提高性能？

我想选择一个根项目及其子项使其性能尽可能高我更喜欢使用嵌套集模型但这次表结构遵循邻接模型有关嵌套集和邻接模型的更多信息 http mikehillyer com articles managing hierarchical data
如何搜索表中的所有列？

如何在 SQL Server 中搜索表的所有列 SELECT FROM yourtable WHERE val IN field1 field2 field3 field4 如果您正在寻找精确的全场比赛如果你正在寻找子字符串匹配你将不得
sql join 告诉我 ID 是否存在于其他表中

我有 2 张桌子 A B ID FKID 1 3 2 3 3 4 4 4 我需要一个 select 语句它显示 A 的所有内容其中一个字段告诉我表 B 是否有任何与该 ID 匹配的 id Desired Result ID hasB 1
Sql Server 的夏令时

我们正在使用一个以 C Unix 格式存储日期的旧应用程序 C 时间基本上是自 1970 年 1 月 1 日以来的秒数日期以整数形式存储在 SQL Server 数据库中我正在为使用这些日期的报告编写视图到目前为止我正在使用以下命令
Postgres LIMIT/OFFSET 奇怪的行为

我正在使用 PostgreSQL 9 6 我有一个这样的查询 SELECT anon 1 id AS anon 1 id anon 1 is valid AS anon 1 is valid anon 1 first name AS ano
在 SQL Server 中将 UTC 毫秒转换为 DATETIME

我想在 SQL Server 中将 UTC 毫秒转换为 DateTime 这可以通过以下代码在 C 中轻松完成 DateTime startDate new DateTime 1970 1 1 AddMilliseconds 1348203
使用转义换行符和回车符取消转义字符串

我正在尝试编写一个 PLPGSQL 函数来混淆审查编辑文本 Obfuscate a body of text by replacing lowercase letters and numbers with symbols CREATE
将图像列保存到 SQL Server 2000 中的文件

我在 SQL Server 2000 中有一个包含图像列的表我需要将图像数据保存到文件系统上的文件中在 SQL Server 2005 中我可以使用 ADODB Stream 对象进行文件 I O 但这在 SQL Server 200
Oracle 删除约束级联等效于 Sql Server

在Oracle中删除约束PK SAI我使用语法 ALTER TABLE SAISIE DROP CONSTRAINT PK SAI CASCADE SQL Server 中与此等效的是什么您正在考虑与实际 DELETE 语句相关的 FO
对于返回超过1个值的SQL select，当Id为GUID时它们如何排序？

我想知道 SQL Server 如何对查询返回的数据进行排序并且各个表的 Id 列都是 uniqueidentifier 类型我在创建所有 GUID 时使用 NHibernate GuidComb 并执行以下操作 Sheet sheet
SQL Server Like 查询不区分大小写

Query SELECT from Table 2 WHERE name like Joe Output 1 100 Joe 2 200 JOE 3 300 jOE 4 400 joe 为什么不区分大小写 Problem 查询不区分大小写
删除重复的行并需要在mysql中保留所有行中的一个[重复]

这个问题在这里已经有答案了我想删除基于两列的重复行但需要保留所有行 1 行重复行可以多于两行例如 ID NAME PHONE 1 NIL 1234 2 NIL 1234 3 NIL 1234 4 MES 5989 我想从上面 3 行
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
创建日期范围表

我正在编写一份需要显示每天值的报告我有查询的开始日期和结束日期但我希望避免丢失日期以防表不包含特定日期的值我正在考虑创建一个基本日期范围表其中包含开始和结束之间的所有日期然后将其与数据表左连接以显示每一天的值我找到了一些适用于
在 SQL 中按键组对行进行顺序编号？

SQL中有没有办法按顺序添加行号按关键组假设一个表包含任意 CODE NAME 元组示例表 CODE NAME A Apple A Angel A Arizona B Bravo C Charlie C Cat D Dog D Dopp
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged

随机推荐

git push --force，在幕后

当你使用 force 进行 git push 时到底会发生什么我已经在网上搜索了大约一个小时我能找到的最相关的答案是 Same as git push but force the push even if it results in a
如何将列表项从字符串转换为整数？

我有一个字符串列表列表如下所示l 1 2 3 4 5 6 2 3 2 3 4 我想从第 2 项开始将列表视为 int 以下代码实现了目的但没有将列表项转换为 int gt gt gt l i 2 for i in range len l
在管理中列出过滤器和搜索结果

在我覆盖之后get search results方法 list filter不起作用但搜索字段按我的预期工作 class NaruceniProduktiAdmin admin ModelAdmin search fields broj
使用 Eloquent/Raw Laravel 查询的 Group Concat

我有一个以 Eloquent 形式存储的对象结构 item id 2 item color Black item size L item Quantity 5 item id 2 item color Black item size M i
为什么将列表转换为集合比将生成器转换为集合更快？

这是一个例子 gt gt gt from timeit import timeit gt gt gt print timeit y for y in range 100 number 100000 0 7025867114395824 gt
简单的素数程序 - 线程 C# 的奇怪问题

这是我的代码 using System using System Collections Generic using System Linq using System Text using System Threading namespac
删除工作表/图表事件 VBA

我试图在删除工作表 Excel 时触发宏自 2010 年以来出现了不同的删除事件应用程序级别 Application SheetBeforeDelete 事件工作簿级别 Workbook SheetBeforeDelete 事件工
在Shiny R中，有没有办法在observeEvent之后立即运行observeEvent而没有延迟（renderUI的问题）？

好吧我的标题有点令人困惑但让我解释一下我正在使用 renderUI 来获取音频标签但是我想以较低的音量启动音频因为它太大声了下面的代码工作正常除了因为我添加了延迟它以较高的音量开始然后迅速转到较低的音量但它仍然非常明显
世博会开发者菜单未显示

我正在使用 expo 工具并进行原生反应没有任何问题但在我的模拟器上升级 Expo Go 应用程序后出现了问题开发者菜单不会像以前那样显示并且菜单中的项目不会显示我的expo go版本 2 25 1 我正在使用 Genymoti
张量流成本函数是张量，而不是标量 - 为什么？优化失败

以下代码可以运行但不起作用变量cost总是一个充满 1 0 的张量但为什么呢我估计了一个标量因为 1x5 矩阵乘以 5x1 矩阵就是一个标量优化时偏差和权重也不会改变我究竟做错了什么 KI Model x tf placeho
luasocket的问题

我试图从 lua 套接字读取一些二进制数据但上面的代码不会终止重复循环我如何知道流已到达末尾 client require socket client socket connect www google com 80 client
将（自定义）解码器添加到 WebMVC 端点

我有一个 WebMVC 端点 RequestMapping path execution id method RequestMethod POST public ResponseEntity lt gt execute PathVariab
Android socket.io 在不丢失连接的情况下切换活动

我开发了一个游戏它将使用socket io连接我的服务器是用node js编写的我的android客户端使用socket io 现在我的问题是我如何在不失去与服务器连接的情况下切换活动我至少有 4 个活动聊天游戏视图在线玩
Cordova ios 上的 Ajax 调用 SecurityError: DOM Exception 18

您好我正在通过 Cordova 5 1 1 Phonegap 构建 iOS 应用程序但有一个无法解决的问题 A basic Ajax调用抛出一个SecurityError DOM Exception 18我尝试了有关白名单的所有技巧但
MySQL：如何对 ORDER BY 子句使用 CASE

我有一个存储过程必须在根据输入过滤行后返回一个表其中两个输入是sort column and sort dir 查询必须 ORDER BYsort column in the sort dir方向 ASC 或 DESC 我尝试过以下查询
在 Mac 上的 SwiftUI 中处理“打开方式”中的多个 URL

在 SwiftUI 中我们被赋予了onOpenURL 执行功能但是在 macOS 中我们可以在 Finder 中选择多个文件然后单击打开方式如果我使用带有以下代码的应用程序打开这些文件 main struct testURL
康威的生命游戏更新（下一代）

我正在研究 Conway 的生命游戏 java 代码并且我正在与我的更新方法也称为下一代创建者作斗争我将发布我迄今为止编写的代码请让我知道我可以做什么来修复更新方法如果在 T 时刻没有细胞就会诞生一个细胞 1 并且它的三个邻居
EnableRaisingEvents 是否可以在应用程序启动时已在运行的进程上使用？

目前我有一个程序启动另一个应用程序并监视该应用程序以使用以下代码保持其运行 System Diagnostics Process startProgram System Diagnostics Process Start program e
C++：在构造函数中初始化变量的位置[重复]

这个问题在这里已经有答案了可能的重复 C 初始化列表选项 1 与选项 2 初始化变量的优缺点是什么 class MyClass public MyClass float f char a private float mFloat cha
SQL Server：合并性能

我有一个包含 500 万行的数据库表聚集索引是自增标识列还有PK是生成256字节的代码VARCHAR这是 URL 的 SHA256 哈希值这是表上的非聚集索引表格如下 CREATE TABLE dbo store image ima

SQL Server：合并性能

SQL Server：合并性能 的相关文章

随机推荐

热门标签

SQL Server：合并性能的相关文章