Oracle SQL 中的有向图使用递归查询仅访问每个节点一次

2024-03-26

描述

在我们的问题域中，我们正在研究一组连接在一起形成图的边。从给定的节点（或多个节点）开始，我们必须列出整个图中连接到给定节点（或多个节点）的所有链接。我们必须从左到右、从上到下显示这些链接。

对于循环数量有限的图，我们有一个针对此问题的有效查询。循环次数越多，执行时间就会呈指数增长。

我们需要在递归期间限制对同一节点的访问以获得有效的解决方案。

下面的示例仅包含一个循环，但该单个循环已导致 86 个额外的过时行。

在类似的帖子中，使用 ROW 和 ANY 运算符为 postgresql 提供了解决方案，但我找不到 Oracle 解决方案。

我们正在寻找解决方案的替代方案或限制对相同边缘的访问次数的方法。

任何帮助是极大的赞赏！

Similar

使用递归查询像访问无向图一样访问有向图 https://stackoverflow.com/questions/8764701/visiting-a-directed-graph-as-if-it-were-an-undirected-one-using-a-recursive-quepostgresql中提供了解决方案。我们需要使用Oracle11g。

Example

Edges

A-B, B-D, C-A, C-E, C-F, H-F, E-B, G-D, G-I

图形化

    A
  /   \
C - E - B - D
  \       /
H - F   G - I

DDL 和 DML

CREATE TABLE EDGE (
  FROM_ID VARCHAR(10),
  TO_ID   VARCHAR(10)
);

INSERT INTO EDGE VALUES ('A', 'B');
INSERT INTO EDGE VALUES ('E', 'B');
INSERT INTO EDGE VALUES ('C', 'E');
INSERT INTO EDGE VALUES ('C', 'A');
INSERT INTO EDGE VALUES ('C', 'F');
INSERT INTO EDGE VALUES ('B', 'D');
INSERT INTO EDGE VALUES ('G', 'D');
INSERT INTO EDGE VALUES ('H', 'F');
INSERT INTO EDGE VALUES ('G', 'I');

Input

nodes: 'A'

所需输出

C   A
C   E
C   F
H   F
A   B
E   B
B   D
G   D
G   I

目前的解决方案

我们当前的解决方案返回的正是我们所需要的，但如上所述，每个额外的循环都会以指数方式增加执行时间。

SELECT
  c.LVL,
  c.FROM_ID,
  c.TO_ID,
  CASE
  WHEN lag(C.TO_ID)
       OVER (
         PARTITION BY C.LVL
         ORDER BY C.LVL, C.TO_ID ) = C.TO_ID
    THEN C.LVL || '-' || C.TO_ID
  WHEN lead(C.TO_ID)
       OVER (
         PARTITION BY C.LVL
         ORDER BY C.LVL, C.TO_ID ) = C.TO_ID
    THEN C.LVL || '-' || C.TO_ID
  ELSE C.LVL || '-' || C.FROM_ID
  END GROUP_ID
FROM (
       WITH chain(LVL, FROM_ID, TO_ID ) AS (
         SELECT
           1            LVL,
           root.FROM_ID FROM_ID,
           root.TO_ID   TO_ID
         FROM EDGE root
         WHERE root.TO_ID IN (:nodes)
               OR (root.FROM_ID IN (:nodes) AND NOT EXISTS(
             SELECT *
             FROM EDGE
             WHERE TO_ID IN (:nodes)
         ))
         UNION ALL
         SELECT
           LVL +
           CASE
           WHEN previous.TO_ID = the_next.FROM_ID
             THEN 1
           WHEN previous.TO_ID = the_next.TO_ID
             THEN 0
           WHEN previous.FROM_ID = the_next.FROM_ID
             THEN 0
           ELSE -1
           END              LVL,
           the_next.FROM_ID FROM_ID,
           the_next.TO_ID   TO_ID
         FROM EDGE the_next
           JOIN chain previous ON previous.TO_ID = the_next.FROM_ID
                                  OR the_next.TO_ID = previous.FROM_ID
                                  OR (previous.TO_ID = the_next.TO_ID AND previous.FROM_ID <> the_next.FROM_ID)
                                  OR (previous.TO_ID <> the_next.TO_ID AND previous.FROM_ID = the_next.FROM_ID)
       )
         SEARCH BREADTH FIRST BY FROM_ID SET ORDER_ID
         CYCLE FROM_ID, TO_ID SET CYCLE TO 1 DEFAULT 0
       SELECT
         C.*,
         row_number()
         OVER (
           PARTITION BY LVL, FROM_ID, TO_ID
           ORDER BY ORDER_ID ) rank
       FROM chain C
       ORDER BY LVL, FROM_ID, TO_ID
     ) C
WHERE C.rank = 1;

为了防止遍历算法返回到已经访问过的边缘，确实可以将访问过的边缘保留在某处。正如您已经发现的，字符串连接不会取得太大成功。然而，还有其他可用的“值串联”技术......

您必须有一个方便的模式级标量集合可供您使用：

create or replace type arr_strings is table of varchar2(64);

然后您可以在每次迭代中将访问过的边收集到该集合中：

with nondirected$ as (
    select from_id, to_id, from_id||'-'||to_id as edge_desc
    from edge
    where from_id != to_id
    union all
    select to_id, from_id, from_id||'-'||to_id as edge_desc
    from edge
    where (to_id, from_id) not in (
            select from_id, to_id
            from edge
        )
),
graph$(lvl, from_id, to_id, edge_desc, visited_edges) as (
    select 1, from_id, to_id, edge_desc,
        arr_strings(edge_desc)
    from nondirected$ R
    where from_id in (&nodes)
    --
    union all
    --
    select
        lvl+1,
        Y.from_id, Y.to_id, Y.edge_desc,
        X.visited_edges multiset union arr_strings(Y.edge_desc)
    from graph$ X
        join nondirected$ Y
            on Y.from_id = X.to_id
    where not exists (
            select 1
            from table(X.visited_edges) Z
            where Y.edge_desc = Z.column_value
        )
)
search breadth first by edge_desc set order_id
    cycle edge_desc set is_cycle to 1 default 0,
ranked_graph$ as (
    select C.*,
        row_number() over (partition by edge_desc order by lvl, order_id) as rank$
    from graph$ C
--    where is_cycle = 0
)
select *
from ranked_graph$
--where rank$ <= 1
order by lvl, order_id
;

Notes

我将有向图预处理为无向图union- 将一组反向边沿输入。这应该会使递归遍历谓词更容易阅读。仅仅是为了更轻松地读取和编写 SQL。当然，你不必这样做。
我记得几年前在 Oracle 11.2 上尝试过类似的事情。我记得它失败了，尽管我不记得为什么。在12.2上，运行正常。也可以在 11g 上尝试一下；我没有可用的。
由于每次迭代除了遍历内连接之外，还进行反连接，因此我真诚地怀疑这是否会提高性能。不过，它确实解决了减少递归嵌套数量的问题。
您必须自己解决所需的顺序，正如您可能从我的评论中了解到的那样。 :-)

将重新访问的边缘限制为零

在 SQL 中，你不能。您提到的 PostgreSQL 解决方案确实可以做到这一点。但在 Oracle 中，您不能这样做。对于每个遍历连接，您必须测试所有其他遍历连接的行。这意味着某种聚合或分析......Oracle 禁止并抛出 ORA 异常。

PLSQL 来救援？

不过，您可以在 PL/SQL 中完成此操作。它应该有多少性能，取决于您想要花费多少内存从数据库预取边，以及您愿意从“当前”节点遍历图形的 SQL 往返次数，或者您是否愿意使用与常规的反连接相比，需要更多的内存来将访问的节点保留在奇特的按边索引集合中arr_output收藏l_visited_nodes。你有多种选择，明智地选择。

无论如何，对于大量使用 SQL 引擎的最简单场景，这可能是您正在寻找的代码......

create or replace
package pkg_so_recursive_traversal
is


type rec_output                     is record (
    from_id                             edge.from_id%type,
    to_id                               edge.to_id%type,
    lvl                                 integer
);
type arr_output                     is table of rec_output;


function traverse_a_graph
    ( i_from                        in arr_strings
    , i_is_directed                 in varchar2 default 'NO' )
    return arr_output
    pipelined;


end pkg_so_recursive_traversal;
/
create or replace
package body pkg_so_recursive_traversal
is


function traverse_a_graph
    ( i_from                        in arr_strings
    , i_is_directed                 in varchar2 )
    return arr_output
    pipelined
is
    l_next_edges                    arr_output;
    l_current_edges                 arr_output;
    l_visited_edges                 arr_output := arr_output();
    l_out                           rec_output;
    i                               pls_integer;
    l_is_directed                   varchar2(32) := case when i_is_directed = 'YES' then 'YES' else 'NO' end;
begin
    select E.from_id, E.to_id, 0
    bulk collect into l_next_edges
    from table(i_from) F
        join edge E
            on F.column_value in (E.from_id, case when l_is_directed = 'YES' then null else E.to_id end)
    where E.from_id != E.to_id;

    l_out.lvl := 0;

    loop
        dbms_output.put_line(l_next_edges.count());
        exit when l_next_edges.count() <= 0;
        l_out.lvl := l_out.lvl + 1;

        -- spool the edges to output
        i := l_next_edges.first();
        while i is not null loop
            l_out.from_id := l_next_edges(i).from_id;
            l_out.to_id := l_next_edges(i).to_id;
            pipe row(l_out);
            i := l_next_edges.next(i);
        end loop;

        l_current_edges := l_next_edges;
        l_visited_edges := l_visited_edges multiset union l_current_edges;

        -- find next edges
        select unique E.from_id, E.to_id, 0
        bulk collect into l_next_edges
        from table(l_current_edges) CE
            join edge E
                on CE.to_id in (E.from_id, case when l_is_directed = 'YES' then null else E.to_id end)
                or l_is_directed = 'NO' and CE.from_id in (E.from_id, E.to_id)
        where E.from_id != E.to_id
            and not exists (
                select 1
                from table(l_visited_edges) VE
                where VE.from_id = E.from_id
                    and VE.to_id = E.to_id
            );
    end loop;

    return;
end;


end pkg_so_recursive_traversal;

/

当调用起始节点时A并考虑该图是无向的......

select *
from table(pkg_so_recursive_traversal.traverse_a_graph(
        i_from => arr_strings('A'),
        i_is_directed => 'NO'
    ));

...它产生...

FROM_ID    TO_ID             LVL
---------- ---------- ----------
A          B                   1
C          A                   1
C          E                   2
B          D                   2
C          F                   2
E          B                   2
G          D                   3
H          F                   3
G          I                   4

Notes

再说一次，我没有付出任何努力来保留您所要求的顺序，正如您所说的那样，这并不重要。
这是执行多次（对于示例输入来说正好是 5 次）SQL 往返edge桌子。与具有冗余边缘访问的纯 SQL 解决方案相比，这可能会对性能产生更大的影响，也可能不会。正确测试更多解决方案，看看哪一种最适合您。
这段特定的代码可以在 12c 及更高版本上运行。对于 11g 及以下，您必须声明rec_output and arr_output模式级别上的类型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Oracle SQL 中的有向图使用递归查询仅访问每个节点一次的相关文章

连接2个表区分大小写

我有 2 个表需要获取品牌代码的结果例如在数据库中我有两个不同的品牌但它们的代码是相同的只有小写和大写不同例如代码名称关于耐克和阿迪达斯如何在代码上内连接 2 个表以分别获取这 2 个表现在在内连接之后我得到了这
从多行中选择数据并对其进行排序[重复]

这个问题在这里已经有答案了 id title content class 1 t1 p1 1 2 t2 p6 1 3 t3 p5 2 4 t4 p8 3 对于这个表我如何使用 1 个查询来SELECT所有课程DISTINCTLY变成这个
如何在PostgreSQL事务中使用变量

如何在 Postgresql 事务内部将值获取到变量中如果 SELECT 没有返回任何内容则抛出错误如果 SELECT 返回数据则在事务中使用它们像这样 BEGIN activeRounds SELECT FROM rounds
从大表中检索所有记录时如何避免 OOM（内存不足）错误？

我的任务是将一个巨大的表转换为自定义 XML 文件我将使用 Java 来完成这项工作如果我只是发出 SELECT FROM customer 它可能会返回大量数据最终导致 OOM 我想知道有没有一种方法可以在记录可用后立即处理该记录
MYSQL插入GB大小的巨大SQL文件

我正在尝试创建 Wikipedia DB 副本大约 50GB 但在处理最大的 SQL 文件时遇到问题我使用 linux split 实用程序将 GB 大小的文件拆分为 300 MB 的块例如 split d l 50 enwiki 2
WCF 模拟和 SQL 可信连接？

我们有一个托管在 IIS7 下的服务 SQL 服务器的连接字符串设置为受信任为了进行身份验证我需要在服务上设置模拟并让客户端启动模拟连接有没有办法不设置模拟并仍然允许服务通过可信连接登录到 SQL Server 我们希望避免让客户端
SQL Server 2000 - 将查询分成 15 分钟的块

我有一个连续时间数据集我想使用 sql 将其分成 15 分钟的块如果我能帮忙的话我不想必须创建一个新表才能做到这一点 i e 时间计数09 15 109 30 309 45 010 00 210 15 3 有谁知道我该怎么做我认为
访问：根据记录中的最新日期进行分组（嵌套查询）

下表中的此查询 SELECT ID Value As of FROM Table a INNER JOIN SELECT ID MAX As of AS As of FROM Table GROUP BY ID b ON a ID b ID
从同一个表复制行并更新 ID 列

我有下表我已将产品 B 插入其中它给我的 ID 为 15 然后我有定义表如下所示我想选择 ProdID 14 的 ProductDefinition 行并复制相同的行并将其插入到 ProdID 15 中如下所示如何使用 SQL
如何将 OLE 自动化日期值转换为 SQL Server 中的日期

我的应用程序存储日期作为 OLE 自动化与DateTime ToOADate 命令我需要创建一个 SQL 视图来显示存储的日期如何快速将双精度数转换为日期 Does SELECT CAST CASE WHEN OLEFLOAT gt 0
PL/SQL 触发器问题

我正在尝试编写一个触发器来填充包含员工更新工资信息的表我现在遇到一个无法解决的问题这是要填充的表 drop table SalUpdates cascade constraints create table SalUpdates Sal
如果h2表不存在则插入

我正在使用H2 我想将一个值插入到表中如果它不存在我使用以下命令创建表 CREATE TABLE IF NOT EXISTS types type VARCHAR 15 NOT NULL UNIQUE 我想做一些类似的事情 REPLAC
如何查询最近7天的总计？

我正在使用 SQL Server 2008 我想编写一个查询来提供给定天数的总活动量具体来说我想统计过去 7 天每天的总票数我的桌子看起来像这样 VoteID VoteDate Vote BikeID 1 2012 01 01 08
难道 Linq to SQL 没有抓住要点吗？ ORM 映射器（SubSonic 等）不是次优解决方案吗？

我希望社区能够了解我对 Linq to Sql 和其他 ORM 映射器的一些想法我喜欢 Linq to Sql 以及用本机开发语言表达数据访问逻辑或一般的 CRUD 操作的想法而不必处理 C 和 SQL 之间的阻抗不匹配例如要
将行连接成 CLOB

关于这个主题有很多类似的问题但我找不到任何解决方案来考虑最终结果对于 varchar2 来说太大的任何问题所以我想做的就是改变这一点 Column1 Column2 1 Hello 1 world 1 please help 2 Tha
打印 sqlalchemy 行

我想做的就是打印 sqlalchemy 表行的一行假设我有 from sqlalchemy import Column Integer String from sqlalchemy ext declarative import decla
INET6_ATON 的替代 MySQL 代码

将旧的 INET ATON 值转换为新的二进制 INET6 ATON 值无需 INET6 ATON INET6 NTOA 我们在表中已有数据字段类型为UNSIGNED INT其中保存了使用以下命令创建的 IPv4 数据INET ATON
MySQL：主键的所有部分都必须为 NOT NULL；如果您需要在键中使用 NULL，请使用 UNIQUE 代替

我的 MySQL 有问题我创建了名为 BucketList 的数据库然后尝试创建名为 tbl user 的表它看起来像这样 CREATE TABLE BucketList tbl user user id BIGINT NULL AU
数据库函数 VS Case 语句

昨天我们遇到了一个场景必须获取 a 的类型db field在此基础上我们必须编写该字段的描述喜欢 Select Case DB Type When I Then Intermediate When P Then Pending Else
如何从 SQL Server 的表中获取列名？

我想查询一个表的所有列的名称我发现如何做到这一点 Oracle https stackoverflow com q 452464 419956 MySQL https stackoverflow com q 193780 419956 P

随机推荐

Visual Studio 2008 SP1 使用什么 ClearCase 插件

在工作中我必须将 ClearCase v7 0 1 2 和 ClearQuest v7 0 1 0 与 Visual Studio 2008 SP1 一起使用我在 Windows XP SP2 机器上运行我已经进行了一些搜索但尚未找
如何在 Delphi 10.2 中将警告视为错误，同时将某些警告设置为 False

在 Delphi 10 2 中有一个选项可以将警告视为错误项目选项 gt Delphi 编译器 gt 提示和警告 gt 输出警告选项是True False and as errors 当设置为as errors编译器会将每个警告视为错
报表查看器 11 (2012) Visual Studio 2010

我正在使用 Visual Studio 2010 并且安装了 Microsoft Report Viewer 2012 Runtime 希望能够测试 SQL 2012 中的新报告系统之后我从 Web config 中清除了对 Micro
如何从 shell 脚本启动编辑器？

我希望我的 tcsh 脚本启动一个编辑器例如 vi emacs bin tcsh vi my file 这将使用 my file 启动 vi 但首先显示警告 Vim 警告输出不是到终端并且我的击键不会出现在屏幕上在我杀死 vi 后
如何使用 QCustomPlot 高效地绘制大型时间序列？

我目前正在 Qt 中绘制数字信号QCustomPlot但似乎当样本数大于10000000时操作变得非常慢我有一个time向量和一个data矢量我设置数据如下 QCustomPlot plot QCPGraph graph graph
PHP SoapClient 格式错误的 xml

我正在使用 SOAP 与 php 中的 Web 服务进行通信这是我的代码 data array name gt test age gt 20 WDSL http xxx xxxxx xxx wdsl ibs wsdl SOAP new S
SFINAE 用于测试另一个命名空间中的自由函数

我试图想出一个 hack 来测试是否std isnan在预处理器中没有特殊大小写编译器的情况下定义并提出了以下内容我希望它能正常工作 include
SQL - 如何选择具有最大值列的行（+分组依据）

我正在建立这里引用的问题 SQL 如何选择具有最大值的列的行 https stackoverflow com questions 2854257 sql how to select a row having a column with ma
找不到主要出口来加载“LocalizationListComponent”

我正在创建一个 Angular 2 RC5 应用程序每个模块都是延迟加载的当应用程序启动时它会显示来自的列表LocalizationListComponent 按预期但控制台中有一条消息说Cannot find primary ou
如何设置正确的 json 标头？

htaccess 有没有办法确保我的 json 标头正确更新有人发现这些 json 标头有什么问题吗 Date Mon 26 Jul 2010 08 31 11 GMT Server Apache 2 2 15 Unix mod ssl
如何使用 watir 在弹出窗口中输入密码？

我正在编写一些 watir 测试用例 browser goto http egauge2592 egaug es browser link href settings html click browser text field index
Scala 中反射的奇怪行为

我试图遵循另一个问题的例子但我发现了一些我无法解释的事情 scala gt import scala reflect runtime currentMirror gt m import scala reflect runtime curr
从 html 链接中提取标题

我有以下 HTML 字符串 a href tothepage title the page The Link a 如何轻松从 HTML 片段中提取标题首选正则表达式或其他 VB NET 解决方案但 C 也可以我想要页面而不是链接文
自定义键盘 InputAccessoryView 在 iOS 11 中不可见

我已经实现了自定义输入附件视图直到 iOS 10 3 1 为止它都工作正常但在 iOS 11 beta 中是看不到的有人遇到过这个问题吗你问的问题没有太多细节但是当我为文本字段使用 inputAccessoryView 和自定义
java中获取某些进程的cpu使用率的正确命令行是什么

给定进程 ID 在 Java 中从进程获取当前 cpu 使用情况的正确命令是什么命令 typeperf Memory Available bytes processor total process time 不适用于特定进程并且任何第
在具有子类型的类上创建 Scalaz 相等实例

我有以下简单的 ADT 如何实现相等类型类的实例而不求助于显式模式匹配所有可能的组合 import scalaz import Scalaz sealed trait Billinginfo case class CreditCard n
如何在反应中将商品添加到购物车页面

当用户单击添加到购物车按钮时我尝试将商品添加到购物车页面 import React from react import bootstrap import useParams from react router dom function
-fprofile-use 和 -fauto-profile 之间有什么区别？

有什么区别 fprofile use and fauto profile 这是文档所说的 https gcc gnu org onlinedocs gcc Optimize Options html Optimize Options htt
流数据和 Hadoop？（不是 Hadoop 流）

我想使用 MapReduce 方法分析连续的数据流通过 HTTP 访问因此我一直在研究 Apache Hadoop 不幸的是 Hadoop 似乎希望以固定大小的输入文件开始作业而不是在新数据到达时将其传递给消费者事实确实如此还是我
Oracle SQL 中的有向图使用递归查询仅访问每个节点一次

描述在我们的问题域中我们正在研究一组连接在一起形成图的边从给定的节点或多个节点开始我们必须列出整个图中连接到给定节点或多个节点的所有链接我们必须从左到右从上到下显示这些链接对于循环数量有限的图我们有一个针对此问题的有

Oracle SQL 中的有向图使用递归查询仅访问每个节点一次

Oracle SQL 中的有向图使用递归查询仅访问每个节点一次 的相关文章

随机推荐

热门标签

Oracle SQL 中的有向图使用递归查询仅访问每个节点一次的相关文章