Postgres 物化路径 - 使用 ltree 有什么好处？

2024-04-23

物化路径是一种在 SQL 中表示层次结构的方法。每个节点包含路径本身及其所有祖先（grandparent/parent/self).

The django-treebeard实施MP（docs https://django-treebeard.readthedocs.io/en/latest/mp_tree.html):

路径的每个步骤都是固定长度，以实现一致的性能。
每个节点包含depth and numchild字段（以最小的写入成本快速读取）。
路径字段已建立索引（使用标准 B 树索引）：

物化路径方法在数据库中大量使用 LIKE，以及 WHERE path LIKE '002003%' 等子句。如果您认为 LIKE 太慢，那么您是对的，但在这种情况下，路径字段在数据库中建立了索引，并且所有不以 % 字符开头的 LIKE 子句都将使用该索引。这就是物化路径如此快速逼近的原因。

实施get_ancestors (link https://github.com/django-treebeard/django-treebeard/blob/8042ee939cb45394909237da447f8925e3cc6aa3/treebeard/mp_tree.py#L1052):

将节点与包含当前路径子集的路径（steplen是步长的固定长度）。

paths = [
    self.path[0:pos]
    for pos in range(0, len(self.path), self.steplen)[1:]
]
return get_result_class(self.__class__).objects.filter(
    path__in=paths).order_by('depth')

实施get_descendants (link https://github.com/django-treebeard/django-treebeard/blob/8042ee939cb45394909237da447f8925e3cc6aa3/treebeard/mp_tree.py#L958):

匹配深度大于自身的节点和以当前路径开头的路径。

return cls.objects.filter(
    path__startswith=parent.path,
    depth__gte=parent.depth
).order_by(
    'path'
)

这种方法的潜在缺点：

深度嵌套的层次结构会导致路径过长，从而损害读取性能。
移动节点需要更新所有后代的路径。

Postgres 包括ltree提供自定义扩展GiST https://en.wikipedia.org/wiki/GiST index (docs https://www.postgresql.org/docs/current/ltree.html).

不太清楚有什么好处ltree提供超过django-treebeard的实施。这article http://patshaughnessy.net/2017/12/15/looking-inside-postgres-at-a-gist-index认为只有ltree可以回答get_ancestors问题，但如前所述，找出节点的祖先（或后代）是微不足道的。

[顺便说一句，我发现了这个 Djangoltree库 - https://github.com/mariocesar/django-ltree]。

两种方法都使用索引（django-treebeard使用b树，ltree使用自定义 GiST）。我有兴趣了解该协议的实施ltree对于这个特定的用例（物化路径），GiST 以及为什么它可能是比标准 B 树更有效的索引。

附加链接

在关系数据库中存储分层数据有哪些选项？ https://stackoverflow.com/questions/4048151/what-are-the-options-for-storing-hierarchical-data-in-a-relational-database

https://news.ycombinator.com/item?id=709970 https://news.ycombinator.com/item?id=709970

TL;DR使用物化路径索引无法完成可重用标签、复杂搜索模式以及针对多个后代节点（或尚未检索路径的单个节点）的祖先搜索。

对于那些对血腥细节感兴趣的人......

首先，只有当您没有在节点描述中重用任何标签时，您的问题才有意义。如果是的话，l 树确实是两者中唯一的选择。但物化路径实现通常不需要这个，所以让我们把它放在一边。

一个明显的区别在于 l-tree 为您提供的搜索类型的灵活性。考虑这些例子（来自ltree您的问题中链接的文档）：

foo         Match the exact label path foo
*.foo.*     Match any label path containing the label foo
*.foo       Match any label path whose last label is foo

第一个查询显然可以通过物化路径来实现。最后一个也是可以实现的，您可以将查询调整为同级查找。然而，中间的情况不能通过单个索引查找直接实现。您要么必须将其分解为两个查询（所有后代+所有祖先），要么诉诸表扫描。

然后还有像这样的非常复杂的查询（也来自文档）：

Top.*{0,2}.sport*@.!football|tennis.Russ*|Spain

物化路径索引在这里毫无用处，需要全表扫描来处理这个问题。如果您想将其作为 SARGable 查询来执行，l-tree 是唯一的选择。

但对于标准的分层操作，找到以下任意一个：

parent
children
后人
根节点
叶节点

物化路径与 l 树一样有效。与此相反上面链接的文章 http://patshaughnessy.net/2017/12/15/looking-inside-postgres-at-a-gist-index，使用 B 树搜索共同祖先的所有后代是非常可行的。查询格式WHERE path LIKE 'A.%'如果您的索引已正确准备，则可SARGable（我必须使用以下命令显式标记我的路径索引）varchar_pattern_ops使其发挥作用）。

该列表中缺少的是找到所有祖先对于一个后代。查询格式WHERE 'A.B.C.D' LIKE path || '.%'不幸的是不会使用索引。一些库实现的一种解决方法是从路径中解析出祖先节点，并直接查询它们：WHERE id IN ('A', 'B', 'C')。但是，只有当您的目标是已检索到其路径的特定节点的祖先时，这才有效。 l-tree 将在这一点上获胜。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Postgres 物化路径 - 使用 ltree 有什么好处？的相关文章

具有 createSQLQuery 的 ResultTransformer 强制实体字段中不使用驼峰式命名法

我有一个sql查询如下 List
psql：致命：角色“postgres”不存在（使用 -h localhost 选项）

我在本地计算机上安装了 Postgres 当我执行时 psql U postgres d buzzsumo 它正确地向用户 postgres 询问我的密码然而当我跑步时 psql U postgres d buzzsumo h loca
为什么在尝试使用 Java 连接到 RDS PostgreSQL 数据库时会收到 SocketTimeoutException？

我有一个 Spring 应用程序我试图在 AWS 上托管几天来我一直在努力配置我有一个 EC2 实例并且能够通过 SSH 连接到它我还在 AWS 中设置了 Postgres RDS 数据库但我无法使用 IDE 中的代码连接到它
sqlalchemy 的 row_to_json 语法

我想弄清楚如何将 Postgres 9 2 row to json 与 SqlAlchemy 一起使用但是我无法想出任何有效的语法 details foo row q select Foo where Foo bar id Bar id
是否可以从数据库转储生成 knex 种子文件？

就我而言我使用的是 mysql 但是我正在寻找一种通用解决方案用于从当前运行的数据库或数据库转储生成 knex 种子文件我可以就像是 https github com tgriesser knex issues 944 issuec
具有 JPA、PostgreSQL 和 NULL 值的 JodaTime

我试图将 JPA 的 JodaTime DateTime 字段保留到 PostgreSQL 但遇到了指向数据库 NULL 值的空指针的问题我正在使用 NetBeans 7 beta 2 IDE 持久性实现是 EclipseLink 2 2
Docker-compose v3 不持久保存 postgres 数据库

在 docker compose v3 容器关闭并重新启动后我很难保留 postgres 数据这似乎是一个常见问题但经过大量搜索后我无法找到有效的解决方案我的问题与这里类似如何使用卷将数据保存在 dockerized postgr
Postgres where 子句比较时间戳

我有一个表其中列的数据类型timestamp 其中包含一天的多条记录我想选择与日期对应的所有行我该怎么做 Assuming you actually mean timestamp because there is no datetim
Laravel 5.3 Eloquent 事务和外键限制

我正在从事一个更大的项目我们在一个 Postgres 数据库中有多个模式我们在模式之间创建了外键这是一个例子 gt 我们有公司模式和用户模式公司模式有company users表该表对user users表有外键限制 CREATE
PostgreSQL 如何创建数据库或模式的副本？

有没有一种简单的方法可以在 PostgreSQL 8 1 中创建数据库或模式的副本我正在测试一些软件它对数据库中的特定模式进行大量更新我想复制它以便我可以与原始版本进行一些比较如果它位于同一服务器上则只需使用带有 TEMPLAT
查找 postgres 提供的列表中不存在的值

我试图找到一个查询来告诉我数据库中没有的值例如 select seqID segment from flu where seqID IN 1 2 3 4 5 6 7 8 9 现在如果我的数据库没有 seqID 3 8 9 我将如何查找
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
postgresql中数组的区别

我有两个数组 1 2 3 4 7 6 and 2 3 7 在 PostgreSQL 中可能有共同的元素我想做的是从第一个数组中排除第二个数组中存在的所有元素到目前为止我已经取得了以下成果 SELECT array SELECT unne
postgresql 中的锁定表

我有一个名为 games 其中包含一个名为 title 该列是唯一的数据库中使用PostgreSQL 我有一个用户输入表单允许他插入新的 game in games 桌子插入新游戏的功能会检查之前输入的游戏是否存在 game 与相同的
提高 PostgreSQL 1 亿数据左连接查询性能

我在用Postgresql 9 2 version Windows 7 64 bit RAM 6GB 这是一个Java企业项目我必须在我的页面中显示订单相关信息有三个表通过左连接连接在一起 Tables TV HD 389772 行 T
PostgreSQL 仅当列存在时才重命名该列

我在中找不到PostgreSQL 文档 https www postgresql org docs 12 sql altertable html如果有办法运行 ALTER TABLE tablename RENAME COLUMN IF E
JPA 和 PostqreSQL：长字符串持久化

谁能告诉我如何使用 JPA 保存长文本我使用 PostgreSQL 这是我在类中定义很长字符串的方法 Lob private String body 然而这会产生一个类型的字段字符变化 255 在数据库中此外我尝试使用 Column
唯一约束与唯一索引？

之间有区别吗 CREATE TABLE p product no integer name text UNIQUE price numeric and CREATE TABLE p product no integer name text
PostgreSQL - 根据另一个单元格值设置默认单元格值

如果我有一个专栏说column a任何给定值我想要另一列column b有一个default value根据的值column a 换句话说 if column a peter then column b default value do
Postgres：显示继承的字段

我应该实现什么查询来获取继承的列读过this http www alberton info postgresql meta info html综合帖子没有找到解决办法如果我理解正确的话您想知道作为表之间继承的一部分的列的名称 SELE

随机推荐

在 Python 中将视频源从 Javascript 传递到 OpenCV

我正在尝试创建一个网络应用程序来检测实时视频源中的面孔我已经用 Javascript 编写了网络摄像头源代码因为我想稍后托管该应用程序使用 Javascript 获取 feed 的代码 var video document query
选择公平的团队——并用数学来证明这一点

应用类似于选择操场团队我必须将 n 个按顺序排列的元素的集合分成 n 2 的两队团队必须尽可能均匀如上所述从游乐场团队的角度考虑偶数排名表明相对技能或价值水平元素 1 值 1 个点元素 2 值 2 个点等等没
模块元数据版本不匹配错误

我在尝试构建我的角度项目时遇到此错误模块元数据版本不匹配错误 C Users Admin ifish web node modules angular2 cool storage index d ts 找到版本 4 预期版本 3 解析符号
从 WebView 从我自己的网页获取 html 元素？

我有一个网络视图显示来自我自己的服务器的页面是否可以添加一个 javascript 方法允许我的 Android 应用程序从 web 视图中读出页面元素就像是 mypage html p some data p my android
Windows 上的 Jenkins 与 Docker - 无法运行程序“nohup”

我正在使用Jenkins Azure VM 代理插件 https plugins jenkins io azure vm agents与 Linux Master 一起在 Windows 代理上启动作业我已经完成了所有配置步骤一切正常
java.lang.IllegalArgumentException：由于密钥无效而无法初始化

我遇到加密异常我在跑操作系统 X 10 11 爪哇1 8 Groovy 版本 2 4 4 摇篮2 3 20141027185330 0000 JAVA HOME Library Java JavaVirtualMachines jdk1
无法在 debian 上安装 node-libcurl

请告诉我为什么我无法安装 node libcurl 以下是安装 npm install node libcurl 时显示的错误 gt email protected cdn cgi l email protection install va
Django-filter 1.1.0 中的多个模型

我想为网站的最终用户实现一个过滤器以便他们可以按价格评级性别和位置进行过滤这里的问题是价格和评级存储在模型类评论中位置和性别存储在模型类冒险中在 comment 类中 adventure 由外键引用如何在filters
在 Win 10 中调试卸载 DLL 时发生崩溃，但在 Win 7 中则不然

不完全确定我已经解决了这个问题但这就是我所看到的和我所看到的think正在进行我有一个主要用 C 编写的 Win32 程序用于加载 C DLL 该 DLL 通过 COM 对象可能由 DLL 本身实例化的对象将数据从 C 程序传递到
Symfony2，Doctrine Extensions Tree：生成“树”状下拉选择列表

我有一个类别表用树结构构建使用 Doctrine Tree Extension 它看起来像这样 id parent id title lft lvl rgt root 864 NULL Movies 1 0 18 864 865 864
我安装了 nvm n，现在我不断收到“dyld：错误的外部重定位长度”

我使用 sudo 安装了 nvm n 并决定通过在我的系统上下载多个版本的节点来测试它当我尝试在节点版本之间切换时我不断收到权限被拒绝的消息所以我决定也使用 sudo 命令来切换版本就在那时一切都崩溃了我不断得到 dyld
转换运算符的移动语义

可移动转换运算符的语法是什么我有一个可以包裹的包装纸obj 其中有一个obj转换运算符 class wrap public operator obj private obj data 我怎样才能知道是否data 应该复制还是移动其语法如
AWS IAM——使用条件

我是 AWS 中的 IAM 新手而且我希望将各种用户的查询限制为仅主键与 cognito id 匹配的表条目为了实现这一目标我制定了政策 Version 2012 10 17 Statement Sid AllowAccessToO
“流不包含有效的 UTF-8”是什么意思？

我正在创建一个简单的 HTTP 服务器我需要读取请求的图像并将其发送到浏览器我正在使用这段代码 fn read file mut file name String gt String file name file name replac
这个使用的简单 C++ 程序正确吗？

这段代码似乎在 gcc 和 clang 的 ubuntu 可信版本中工作正常并且通过 mingw 在 VM 上的 Win 7 中工作正常最近我升级到 Wily 并使用 clang 构建的版本始终崩溃 include
使用 bootstrap 更改表标题颜色

我有一个使用引导程序的 MVC5 应用程序表列名称为黑色在白色背景上我想将其更改为蓝色背景和列名字将是白色的我该怎么做我尝试使用 CSS 类但没有成功
安装 rpy2 时 Visual Studio cl.exe 错误

我在 Django 中安装 rpy2 并收到以下错误 C Program Files x86 Microsoft Visual Studio 2017 Enterprise VC Tools MSVC 14 15 26726 bin Hos
Django 是否有立即 http 响应的异常？

Django Tastypie 有ImmediateHttpResponse允许立即向客户端返回响应的异常 raise ImmediateHttpResponse response a message 姜戈有Http404 https do
如何读取长度未知的输入字符串？

如果我不知道这个词有多长我就无法写char m 6 这个词的长度可能有十到二十长我该如何使用scanf从键盘获取输入 include
Postgres 物化路径 - 使用 ltree 有什么好处？

物化路径是一种在 SQL 中表示层次结构的方法每个节点包含路径本身及其所有祖先 grandparent parent self The django treebeard实施MP docs https django treebeard re

Postgres 物化路径 - 使用 ltree 有什么好处？

Postgres 物化路径 - 使用 ltree 有什么好处？ 的相关文章

随机推荐

热门标签

Postgres 物化路径 - 使用 ltree 有什么好处？的相关文章