分层数据结构设计（嵌套集）

2023-12-28

我正在研究分层数据库结构的设计，该结构对包含产品的目录进行建模（这类似于这个问题 https://stackoverflow.com/questions/112866/database-schema-for-a-hierarchial-groups）。数据库平台是 SQL Server 2005，目录相当大（750,000 个产品，4 个级别的 8,500 个目录部分），但相对静态（每天重新加载一次），因此我们只关心 READ 性能。

目录层次结构的一般结构是：-

Level 1 Section
- Level 2 Section
  - Level 3 Section
    - 4 级部分（产品链接至此处）

我们使用嵌套集模式来存储层次结构级别并将该级别存在的产品存储在单独的链接表中。所以简化的数据库结构是

CREATE TABLE CatalogueSection
(
    SectionID INTEGER,
    ParentID INTEGER,
    LeftExtent INTEGER,
    RightExtent INTEGER
)

CREATE TABLE CatalogueProduct
(
    ProductID INTEGER,
    SectionID INTEGER
)

我们确实有一个额外的复杂性，因为我们有大约 1000 个独立的客户群体，他们可能会也可能不会看到目录中的所有产品。因此，我们需要为每个客户组维护目录层次结构的单独“副本”，以便当他们浏览目录时，他们只能看到自己的产品，也看不到任何空白部分。

为了促进这一点，我们维护一个从以下部分“汇总”的层次结构每个级别的产品数量表。因此，即使产品仅直接链接到层次结构的最低级别，它们也会一直计数到树上。该表的结构是

CREATE TABLE CatalogueSectionCount
(
    SectionID INTEGER,
    CustomerGroupID INTEGER,
    SubSectionCount INTEGER,
    ProductCount INTEGER
)

那么，说到问题层次结构顶层的性能非常差。显示所选目录部分（以及所有子部分）中“前 10 名”产品的一般查询大约需要 1 分钟才能完成。在层次结构的较低部分，速度更快，但仍然不够好。

我已经在所有关键表上放置了索引（包括适用的覆盖索引），通过查询分析器、索引调整向导等运行它，但仍然无法让它执行得足够快。

我想知道这个设计是否存在根本缺陷，或者是否是因为我们拥有如此大的数据集？我们有一个合理的开发服务器（3.8GHZ Xeon，4GB RAM），但它无法正常工作:)

谢谢你的帮助

James

使用闭合表。如果您的基本结构是具有 ID 和 ParentID 字段的父子结构，则闭包表的结构是 ID 和 DescendantID。换句话说，闭包表是一个祖先-后代表，其中每个可能的祖先都与所有后代相关联。如果需要，您可以包含 LevelsBetween 字段。闭包表实现通常包括自引用记录，即 ID 1 是后代 ID 1 的祖先，其 LevelsBetween 为零。

例子：家长/孩子
家长 ID - ID
1 - 2
1 - 3
3 - 4
3 - 5
4 - 6

祖先/后代
ID - 后代 ID - LevelsBetween
1 - 1 - 0
1 - 2 - 1
1 - 3 - 1
1 - 4 - 2
1 - 6 - 3
2 - 2 - 0
3 - 3 - 0
3 - 4 - 1
3 - 5 - 1
3 - 6 - 2
4 - 4 - 0
4 - 6 - 1
5 - 5 - 0

该表旨在消除递归连接。您可以将递归连接的负载推入 ETL 循环中，每天加载一次数据时都会执行该循环。这将它从查询中移开。

此外，它还允许可变级别的层次结构。你不会被困在4点。

最后，它允许您将产品放入非叶节点中。许多目录在层次结构的较高级别创建“杂项”存储桶，以创建用于附加产品的叶节点。您不需要这样做，因为中间节点包含在闭包中。

就索引而言，我会在 ID/DescendantID 上创建聚集索引。

现在来看看您的查询性能。这会减少一部分，但不是全部。您提到了“前十名”。这意味着对您未提及的一组事实进行排名。我们需要细节来帮助调整这些。另外，这仅获取叶级部分，而不是产品。至少，您应该在 CatalogueProduct 上有一个按 SectionID/ProductID 排序的索引。我会根据您提供的基数强制部分到产品的连接成为循环连接。关于目录部分的报告将转到闭包表以获取后代（使用聚集索引查找）。然后，该后代列表将用于使用循环索引查找的索引从 CatalogueProduct 获取产品。然后，通过这些产品，您将获得进行排名所需的事实。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

分层数据结构设计（嵌套集）的相关文章

在 C# 中执行基于存储过程的查询后，如何重新使用 CommandText 的 SqlCommand 对象？

我有一个示例代码 aCommand CommandType CommandType StoredProcedure aCommand Parameters AddWithValue book id bookID aCommand Param
获取在任何日期创建的表的列表？

我遇到了这样的情况我想查找我在 2012 年 9 月 14 日 2012 年 9 月 14 日在 sql server 上创建的表是否有任何查询会列出在此日期创建的这些表 SELECT FROM sys tables WHERE cr
Entity Framework 6（代码优先）实体版本控制和审计

我正在考虑将 Entity Framework 6 1 1 与 SQL Server 2008 R2 一起使用目前我正在使用代码优先的 EF 功能创建模型和数据库我的基本用例是创建一个特定实体的所有更改的日志 ID是关键栏以帮助审核
在数据库中搜索时忽略空文本框

此代码能够搜索数据并将其加载到DataGridView基于搜索表单文本框中提供的值如果我将任何文本框留空则不会有搜索结果因为 SQL 查询是用 AND 组合的如何在搜索从 SQL 查询或 C 代码时忽略空文本框 private
使用存储过程中的 Select 查询将单个变量分配给多行

我的查询是使用 Select 将单个变量分配给多行存储过程中的查询例如我从 Employee 表中获取 10 个比如 1 到 10 个员工 ID 声明 id int select id EmpId from Employee sel
表与多个表具有一对一的关系

1 一个表可以和多个表建立一对一的关系吗为了更清楚地说明如果我想做插入第一个表将受到影响并且只有一张其他表会受到影响 2 如果是这样主键将如何 3 另外如果我想检索多条记录查询会是什么样子从这些表中谢谢一个表可以和多个表
SQL Server 错误“隐式转换，因为值的排序规则由于排序规则冲突而无法解析。”

我在开发存储过程时遇到此错误无法执行 varchar 值到 varchar 的隐式转换因为由于排序规则冲突而无法解析该值的排序规则声明是这样的 Select City COLLATE DATABASE DEFAULT AS Place
在 SQL Server 2005 中，len() 和 datalength() 有什么区别？

SQL Server 2005 中的 len 和 datalength 有什么区别 DATALEN 将返回用于存储值的字节数 http msdn microsoft com en us library ms173486 SQL 90 asp
如何使用一个命令删除 SQL 数据库中的所有索引？

那么如何通过一条命令删除 SQL 数据库中的所有索引呢我有这个命令可以获取所有 20 个左右的 drop 语句但是如何从这个结果集运行所有这些 drop 语句呢 select from vw drop idnex 给我相同列表的另
计算2个日期之间每个日期的记录数

我必须创建一个查询来返回多轴图表的结果我需要计算为 2 个日期之间的每个日期创建的 ID 数量我试过这个 DECLARE StartDate datetime2 7 11 1 2020 EndDate datetime2 7 2 22
使用 Flyway 和 Hibernate 的 hbm2ddl 在应用程序的生命周期中管理数据库模式

我正在开发 Spring Hibernate MySql 应用程序该应用程序尚未投入生产我目前使用 Hibernatehbm2ddl该功能对于管理域上的更改非常方便我也打算用Flyway用于数据库迁移在未来的某个时候该应用程序将首
将 SQL Server 2008 DB 迁移到 Postgres [重复]

这个问题在这里已经有答案了我想将 SQL Server 2008 数据库迁移到 Postgres 有没有一种无痛的方法来做到这一点是否有任何工具可以扫描架构和存储过程以标记兼容性问题无痛http dbconvert com conve
消息 203，级别 16，状态 2，不是有效标识符

我收到以下错误消息 203 级别 16 状态 2 过程 getQuestion 第 18 行名称 select top 1 from tlb Question inner join tlb options on tlb options q
MySQL InnoDB 约束不起作用

我偶然发现 innoDB 约束的奇怪行为但找不到原因我有包含数据的表格下面列出了它们的结构 CREATE TABLE contents id int 10 unsigned NOT NULL AUTO INCREMENT title
无法将数据加载到 mvc 4 中的 jTable 中

好的我第一次尝试 jTable 我可以加载表但这对我没有什么好处因为它不会加载我的任何数据当我调试程序时我想要的表中的所有行都存储在我的列表中因此我很困惑为什么当我运行应用程序时会弹出一个对话框显示与服务器通信时发生错误 H
跳过行：将数据从 SSIS 导出到 Excel 文件

我正在尝试使用 SSIS 将数据从 SQL Server 数据库导出到 Excel 文件中我希望从第 6 行插入数据第 5 行有标题我可以映射标题名称Excel 目标编辑器通过编写 SQL 命令到 SQL 表头 SELECT FRO
TransactionScope 是否需要开启 DTC 服务？

根据我的阅读为了在 NET 中使用 TransactionScope 您需要运行 Windows 中的分布式事务协调器服务我有那个服务关掉并且我的应用程序似乎运行相同并且回滚事务没有问题我错过了什么吗它如何能够发挥作用呢我正在运
如何在 phalcon 框架中同时连接多个数据库在模型类中同时使用两个而不仅仅是一个

在我的代码中我有两个数据库ABC and XYZ 我想在同一模型中使用两个数据库而不是 phalcon 中的解决方案是什么如何为此实现多个数据库连接 one
重用 t-sql 游标的起始位置？

我正在开发一个在临时表上使用游标的存储过程我已经阅读了一些关于为什么不需要游标的内容但在这种情况下我相信我仍然需要使用游标在我的过程中我需要遍历表的行两次声明游标后已经单步执行临时表并关闭游标重新打开时游标的位置是否仍保留在表
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

如何在react中使用信号协议

如何在 React 中使用信号协议 I used npm libsignal但即使这样我在node modules 中也遇到了错误我尝试使用libsignal protocol js文件来自 https github com signal
您可以使用 Cloud Formation 创建使用计划吗？

就像标题中一样我可以仅使用 Cloud Formation 在 AWS 上部署内容现在我尝试使用 API 密钥来保护我的 API 网关看起来我需要一个使用计划这里的文档似乎没有涵盖它 http docs aws amazon co
如何创建属性包含点（句点）的 json 字符串？

我正在尝试发送HttpRequest它需要一个像这样的 JSON 对象 some setting withperiods myvalue 我一直在为其他请求创建匿名对象但我无法对这个请求执行此操作因为名称包含一个点我知道我可以创建一个
phpunit - 需要有关有风险的测试的帮助

我正在为一个网站实施一些测试在一次特定的测试中出现了这样的结果 event test suite Example V test test Example V test test 3 status error time 13 469105
如何从命令行编译 MSVC 项目中的单个源文件？

我即将开始对我们的构建进行一些基准测试测试并且我想从命令行驱动整个过程我知道DevEnv但我不相信它可以做我想做的事如果我可以在单个项目中构建单个文件我会很高兴这可以做到吗其神奇咒语如下请注意这仅在 VS 2010 上进行
Azure CloudBlockBlob.DeleteIfExists() - false 是否始终意味着 blob 不存在？

我知道如果 blob 存在 CloudBlockBlob DeleteIfExists 返回 true 如果不存在则返回 false 不过我很好奇如果 blob 确实存在但 Azure 中出现问题导致文件删除无法发生我找不到有关该
Angular 2 路由器中间的通配符选择器

我正在尝试使用 Angular js 2 开发一个项目我正在尝试使用路由器我正在尝试创建一条带有参数的路线来捕获如下内容 m SOMETHING1 c SOME THING2 p SOMETHING3 请注意 SOME THING2 是
Python 贝叶斯信念网络分类器

谁能推荐一个用 Python 实现的贝叶斯信念网络分类器它可以根据描述多个相互关联对象的一系列事实的稀疏网络的输入生成信念概率例如鉴于 FOL 中表述的事实 X 饿了是一只猴子正在吃东西如下所示 isHungry x isMonk
简单设置关闭显示：none / block with javascript

我有以下代码 table tr class odd td Entry 1 td tr tr class even clickable td gt Entry 2 td tr tr class even td ul li Informatio
Spring Rest 模板中的哑剧类型无效？

我只是想发出一个简单的 REST 请求如下所示 String url some url MultiValueMap
尝试通过 --experimental-loader 选项使用 mocha、ES6 模块和 ts-node

我正在尝试获取 ts node 选项 experimental loader与摩卡一起工作但运气不佳在我开始尝试编译 ES6 模块之前我曾经能够通过这种方式运行 mocha 测试 test nyc reporter html moch
如何动态添加和加载入口点？

我正在开发一个带有使用入口点的插件的 Slack 机器人我想在运行时动态添加插件我有一个具有以下结构的项目 my project dir my projects python code plugins plugin1 py plugin
@Consumes 不适用于 JSON

我有以下休息服务 Path add POST Consumes MediaType APPLICATION JSON public Response add SomeEntity entity entity someService addE
使用 System.Text.Json 修改 JSON 文件

我知道使用 Newtonsoft 可以轻松做到这一点然而当我使用 NET Core 3 0 时我尝试使用新方法与 JSON 文件交互即System Text Json 我拒绝相信我正在尝试做的事情有那么困难我的应用程序需要列出尚未
ColdFusion：创建一个不包含任何复杂类型的 wsdl

我必须使用 ColdFusion 创建一个 wsdl Web 服务以供外部工具使用我面临的问题是这个外部工具不接受使用复杂类型的Web服务 wsdl应该只获取和返回简单值作为字符串或整数而不是数组结构或对象似乎 Coldfus
在结构中存储 &str 时，“缺少生命周期说明符”意味着什么？

我正在尝试编写类似 Excel 的数据结构 use std collections HashMap struct Excel columns HashMap lt str Vec
`git rebase --fork-point master` 是什么意思？

我的用例是改变我的提交在发布之前在功能分支中例如重写提交消息压缩一些提交等我不想将提交移至新的基地为此我通常会这样做 git rebase i HEAD 4 其中数字 4 是手动计算我的功能分支中的提交的结果我想知道 Git
根据子 Firebase Android 的值在位置更改时更新标记

我需要 Firebase 数据库方面的帮助我想做的是显示所有用户可用工人例如 N2GCEIGYBaRiNrFPawklx1NymF3 RUN5PaZC0WNZYm6YJrRtbQVXOoH2 在我的地图上这是 Firebase 数据库
方法重载解决意外行为

我正在努力解决 net 的一个奇怪的方法重载解析至少对我来说是这样我写了一个小样本来重现该问题 class Program static void Main string args var test new OverloadTest t
分层数据结构设计（嵌套集）

我正在研究分层数据库结构的设计该结构对包含产品的目录进行建模这类似于这个问题 https stackoverflow com questions 112866 database schema for a hierarchial grou

分层数据结构设计（嵌套集）

分层数据结构设计（嵌套集） 的相关文章

随机推荐

热门标签

分层数据结构设计（嵌套集）的相关文章