SQL Server 中非常大的表

2023-11-22

我们有一个非常大的表（> 77M 记录并且还在不断增长）在 SQL Server 2005 64 位标准版上运行，并且我们发现了一些性能问题。每天添加多达十万条记录。

有谁知道SQL Server标准版可以处理的记录数量是否有限制？应该考虑转向企业版还是有一些我们可以使用的技巧？

附加信息：

所讨论的表非常扁平（14 列），有一个包含 6 个字段的聚集索引，还有两个针对单个字段的索引。

我们使用一个问题查询中的选择中的 3 个字段添加了第四个索引，并且在估计性能方面没有看到任何差异（该查询是必须在非工作时间运行的流程的一部分，因此我们没有指标然而）。这些字段是聚集索引的一部分。

同意上面 Marc 和 Unkown 的观点...聚集索引中的 6 个索引太多了，尤其是在只有 14 列的表上。你不应该超过 3 或 4 个，如果是的话，我会说 1 或可能 2。你可能知道聚集索引是磁盘上的实际表，所以当插入一条记录时，数据库引擎必须对其进行排序并将其放在磁盘上已排序的组织位置中。非聚集索引则不然，它们支持查找“表”。我的 VLDB 根据下面的第一点布置在磁盘上（聚集索引）。

将聚集索引减少到 1 或 2。最好的字段选择是 IDENTITY (INT)（如果有）、日期字段（其中的字段将添加到数据库）或其他一些自然排序的字段。您的数据如何添加到数据库中。关键是您试图将这些数据保留在表的底部......或者将其以您将读取记录的最佳方式（90%+）放置在磁盘上。这样就不会发生重组，或者只需要一次点击即可将数据放在正确的位置以实现最佳读取。请务必将删除的字段放入非聚集索引中，这样就不会失去查找功效。我从来没有在 VLDB 上放置超过 4 个字段。如果您有经常更新的字段并且它们包含在聚集索引中，哎呀，这将重新组织磁盘上的记录并导致代价高昂的碎片。
检查索引上的填充因子。填充因子数字 (100) 越大，数据页和索引页就越满。关于您拥有的记录数以及要插入的记录数，您将更改非聚集索引的填充因子#（+或-），以在插入记录时留出填充空间。如果将聚集索引更改为顺序数据字段，那么这对于聚集索引来说就不那么重要了。根据经验（IMO），高写入的填充因子为 60-70，中等写入的填充因子为 70-90，高读取/低写入的填充因子为 90-100。将填充因子降低到 70 意味着页面上每 100 条记录写入 70 条记录，这将为新记录或重组记录留下 30 条记录的可用空间。占用更多空间，但它肯定比每晚必须进行碎片整理（参见下面的 4）
确保统计信息存在于表中。如果你想使用“sp_createstats 'indexonly'”扫描数据库来创建统计信息，那么SQL Server将在引擎累积的所有索引上创建所有统计信息作为需要统计信息。但不要忽略“indexonly”属性，否则您将为每个字段添加统计信息，这样就不好了。
使用 DBCC SHOWCONTIG 检查表/索引，以查看哪些索引碎片最多。我不会在这里详细介绍，只需知道您需要这样做即可。然后根据该信息，根据索引正在经历的变化以及变化的速度（随着时间的推移）向上或向下更改填充因子。
设置一个作业计划，对各个索引执行联机 (DBCC INDEXDEFRAG) 或脱机 (DBCC DBREINDEX) 操作以对其进行碎片整理。警告：如果不在维护期间，请勿在这么大的表上执行 DBCC DBREINDEX，因为它会导致应用程序崩溃……尤其是在聚集索引上。你已被警告过。测试并测试这部分。
使用执行计划查看存在哪些 SCANS 和 FAT PIPES 并调整索引，然后整理碎片并重写存储过程以消除这些热点。如果您在执行计划中看到红色对象，那是因为该字段没有统计信息。那很糟。这一步更像是“艺术而不是科学”。
在非高峰时间，运行 UPDATE STATISTICS WITH FULLSCAN 为查询引擎提供尽可能多的有关数据分布的信息。否则，在工作日晚上或更频繁地在表上执行标准 UPDATE STATISTICS（使用标准 10% 扫描），只要您认为符合您的观察结果，即可确保引擎拥有有关数据分布的更多信息，以便高效地检索数据。

抱歉，这篇文章太长了，但这非常重要。我在这里只向您提供最少的信息，但会有很大帮助。这些要点所使用的策略涉及一些直觉和观察，需要您的时间和测试。

无需转到企业版。我这样做是为了获得前面提到的分区功能。但我特别是为了拥有更好的多线程功能，包括搜索、在线碎片整理和维护……在企业版中，它对 VLDB 来说更好、更友好。标准版也不处理对在线数据库执行 DBCC INDEXDEFRAG。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sqlserver

sqlserver2005

SQL Server 中非常大的表的相关文章

尝试删除时 SQL 异常错误 #547 和外键约束违规

我正在查看一些代码我没有编写它来测试我们的代码在尝试删除存在依赖项的表行时是否捕获两个错误条件该代码最初查找消息中的特定文本而不是使用错误号为了提供多语言支持最好根据错误号而不是错误消息来捕获异常在测试中代码正在查找两组文本
视图和表在性能上的差异

对于包含大量数据的表来说什么是最好的我有一个存储过程可以根据一些过滤器创建报告在我的 SP 中我读取表格并放入所有内部联接和公式然后在放置过滤器的 where 条件中谈论性能什么更好创建一个包含所有联接的视图或读取表就像我正
在php调用上获取MS存储过程的输出

我正在使用 php 的 sqlsrv ms 驱动程序它工作正常使用正常查询进行测试我还通过运行存储过程来更新表数据来测试它这也有效现在我想用它来运行存储过程并且我想检索响应如何才能做到这一点 server the server
使用左连接在单个更新语句中更新多个表

我意识到我所要求的可能是不可能的我想基于 LEFT JOIN 和 WHERE 子句对两个单独的表执行 UPDATE 这是我的尝试 UPDATE PERIODDATES as pd periods2 as p2 SET pd PERIODC
SQL 英文查询发生了什么？

SQL Server 2000 与 English Query 一起部署当时我还年轻对 SQL 还很陌生所以我跳过了那一章多年后的现在又出现了制作一个可以理解简单用户问题的逻辑程序的想法还有其他选择吗英语查询现在在哪里英文查
SQL Server：如何从递归函数内执行更新？

我有一个递归标量函数需要根据它返回的值更新另一个表中的记录但是函数中不允许使用 UPDATE 语句如何从函数内更新表不允许使用 UPDATE 语句功能这就是规则函数不允许有任何数据更改的副作用您必须使用存储过程来UPDATE
如果运行战争，oracle 和 sybase 数据库连接会出现 ClassNotFoundError，但在 eclipse 中工作正常

我在应用程序中构建了一个功能来测试数据库连接在本地我能够测试所有三个数据库 sqlserver sybase 和 oracle 但如果创建 war 文件并在 Windows Linux 服务器中运行 war 则 Oracle 和 syb
SQL Server 2016升级到13.0.15700.28版本后频繁出现System.OutOfMemoryException

我在具有多个显示器 16 GB DDR4 RAM 4 Ghz I7 GTX 970 的开发盒上运行 Windows 10 Pro 64 位我使用 SQL Server 2016 Developer Edition 和 VS 2015 En
SQL Server 之间的日期 LIKE

请帮我如何插入LIKE 之间的日期例子是 SELECT FROM table WHERE Date BETWEEN startDate AND endDate 所以在这段代码中我应该把LIKE这样数据就会出现例如如果我这样设置 SEL
更改 SQL Server 中的身份种子（永久！）

有没有办法永久更改身份列的身份种子使用 DBCC CHECKIDENT 似乎只是设置了最后一个值如果表被截断所有值都会重置 dbcc checkident Test SeedIdent reseed 1000 select name
更新语句错误：子查询返回超过 1 个值

我正在尝试更新列中的所有记录以便它们以 CD 开头例如DCE206 将成为 CDE206 UPDATE table SET column REPLACE column1 DC CD WHERE column1 LIKE DC 我正在使用
对不同记录进行 PIVOT 查询

我有下表 Id Code percentage name name1 activity 1 Prashant 43 43 James James Running 1 Prashant 70 43 Sam Sam Cooking 1 Pras
从sql server 2005中的列中获取查询的xml节点

我有一个包含 2 列的表第一个是带有主键的整数列第二个是带有数据的 xml 列数据列包含xml如下
SQL Server：数据迁移的最佳方法是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我想将数据从 Microsoft SQL Server 2005 中的一个数据库迁移到另一个数据库在将检索到的行插入到目标数据库的表之前我需
GRANT EXECUTE 所需的权限

我正在为需要能够创建和删除过程但也向其他用户授予执行权限的用户创建一个组 GRANT CREATE PROCEDURE TO xxx xxx GRANT ALTER ON SCHEMA dbo TO xxx xxx 但是我需要向组授予什么
SSDT 单元测试：从配置文件读取 SQL Server 单元测试设置时发生错误

我在 Visual Studio 2013 professional 中创建了一个数据库项目然后通过右键单击存储过程之一并选择来添加单元测试创建单元测试选择创建一个新的VB测试项目然后右键单击新创建的测试项目并选择SQL Server
mssql 的 UUID 疯狂

我的数据库条目有一个 UUID 及其值使用 Microsoft SQL Server Management Studio 提取 CDF86F27 AFF4 2E47 BABB 2F46B079E98B 将其加载到我的 Scala 应用程序
开发和生产 SQL Server 之间使用不同的排序规则会出现哪些问题？

盘问无法更新 sys columns 还有其他方法吗 https stackoverflow com questions 4018347 unable to update sys columns any other approach含糊地
即使在不活动状态下，Hangfire 也会继续运行 SQL 查询

我正在开发一个 ASP net MVC 5 网站并使用 Hangfire 来安排一些任务在本例中每 3 分钟一次我知道一个事实是运行这样的任务以及与之相关的数据库查询只需要几秒钟我面临的问题是 Hangfire 似乎让我的 S
SQL Server 数据归档解决方案

我正在寻找一种解决方案来存档数据库中存在的数据我的数据库是 SQL Server 2008 大约有 250 个表我搜索网络并找到以下链接 http www dbazine com sql sql articles charran13 h

随机推荐

C# 4.0 中的方法重载与可选参数[重复]

这个问题在这里已经有答案了哪一个更好乍一看可选参数似乎更好更少的代码更少的 XML 文档等但为什么大多数 MSDN 库类使用重载而不是可选参数当您选择使用可选参数或重载时有什么特别需要注意的事情吗 C 4 0 中可选参
在 Javascript 中以 50 个小块执行 100K Promise

我有一个函数可以对服务进行 REST 调用并返回一个承诺让我们调用该函数 Execute 该函数采用 ID 并将 ID 作为 GET 参数发送到 REST 端点该端点将 ID 与一些附加信息一起保存在 mongoDB 数据库中在客户端
ggplot 图例不适用于scale_colour_manual

我知道之前已经有人问过同样的问题 ggplot 图例 scale colour manual 不起作用但问题涉及的数据集比我这里的数据集稍微复杂答案建议重组数据然后使用重组数据但即使使用下面的简单数据问题仍然存在我无法解决它因
将图像从 FileReader 传递到 Angular 6 中的表单输入

我尝试创建一个用户界面其中有一个带有几个文本字段的表单一个input type file and a div您可以将图像与表单的其余部分一起上传我的目标逻辑使用相同的div放置图像或单击它并打开文件夹资源管理器例如input t
EF Code First，将两个导航属性映射到同一对象类型

如果我有一个User具有以下属性的类 public Guid UserPreferenceId get set public virtual DefaultUserPreference UserPreference get set publ
Android 静态 Application.getInstance()

你能帮我解决这个情况吗我们正在使用一个类的静态实例该类扩展了 android 中的 Application public class MyClass extends Application public static MyClass g
成员名称和构造函数参数名称之间的冲突[重复]

这个问题在这里已经有答案了可能的重复 C 中的成员与方法参数访问我有一个班级有一些成员比如x y width and height 在它的构造函数中我不会这样做 A A int x int y int width int heig
如何在单独的文件夹中添加资源？

当我尝试通过单击添加现有项目在资源设计器中添加资源时该项目被放置在资源文件夹中问题是如果我在资源目录中创建一个新目录并将资源放在那里我会收到编译器错误无法找到文件我无法将所有资源放在一个文件夹中因为我必须添加 2500
C# 中的 Struct.Pack 等效吗？

我正在构建一个连接到渲染应用程序的 C 客户端但失败了我通过剖析一个适用于这一行的Python客户端来缩小问题范围 def Startclient Click self sender e try s socket socket sock
Linux 中的 Java - root 和非 root 的不同外观类

我注意到 Java 为 root 和非 root 用户提供了不同的外观类我试图了解如何使 LAF 保持一致此外即使在用户 root 内也是不一致的取决于用户 root 的登录方式示例代码编译并打包在laf jar import
使用decimal.ToString("C") 和 CultureInfo 自定义货币符号和小数位

我有一个问题decimal ToString C 覆盖基本上我想做的是如下 CultureInfo usCulture new CultureInfo en US Thread CurrentThread CurrentCulture u
远程远程端点 RDFLib / Redland 上的 SPARQL 查询

我正在尝试查询远程端点并获取 owl sameAs 映射我尝试了 RDFLib 和 Redland 但都不适合我可能我没有正确处理名称空间这是我在 RDFLib 中的尝试 import rdflib rdflib plugin reg
静态方法中的 findViewById

我有这个静态方法 public static void displayLevelUp int level Context context LayoutInflater inflater LayoutInflater context getS
非阻塞文件读取

如何以非阻塞模式读取二进制或文本文件的内容对于二进制文件当我open filename mode rb 我得到一个实例io BufferedReader 文档堡垒io BufferedReader read says 读取并返回 siz
理解“finally”块

我编写了七个测试用例来理解finally堵塞背后的逻辑是什么finally works package core public class Test public static void main String args new Test
Zend 框架：元属性集成

我正在尝试根据页面内容将一些元采用以下格式添加到页面的头部使用headMeta gt appendName像这样 this gt view gt headMeta gt appendName og title some content
Huggingface 转换器模型返回字符串而不是 logits

我正在尝试从 Huggingface 网站运行这个示例 https huggingface co transformers task summary html 模型似乎返回两个字符串而不是 logits 这会导致 torch argmax
如何更新cosmos db中的子文档

我是 Cosmos Db 的新手想了解如何删除更新插入文档集合中的子文档如果我有一个文件 Id 1234 Name foo Items Id abcd Age 35 Claims Name email Value email prot
使用 ftplib 连接到 FTP TLS 1.2 服务器

我尝试连接到仅支持 TLS 1 2 的 FTP 服务器使用Python 3 4 1 My Code import ftplib import ssl ftps ftplib FTP TLS ftps ssl version ssl PRO
SQL Server 中非常大的表

我们有一个非常大的表 gt 77M 记录并且还在不断增长在 SQL Server 2005 64 位标准版上运行并且我们发现了一些性能问题每天添加多达十万条记录有谁知道SQL Server标准版可以处理的记录数量是否有限制应该考虑

SQL Server 中非常大的表

SQL Server 中非常大的表 的相关文章

随机推荐

热门标签

SQL Server 中非常大的表的相关文章