我想计算一个节点到根的距离dtr
。我拥有的只是一个向量,其中包含每个节点的父节点 idrel
(在这个例子中id == 7
是根):
library(tidyverse)
tmp <- tibble(
id = 1:12,
rel = c(2,7,4,2,4,5,7,7,10,8,7,7)
)
最后我正在寻找这个结果:
tmp$dtr
[1] 2 1 3 2 3 4 0 1 3 2 1 1
到目前为止,我能够编写以下算法,直到在尝试引用代码中的不同行时陷入困境。
该算法应该像这样工作(伪代码):
- 如果不是根,则增加
dtr
: if(!equals(tid,trel)): dtr = dtr+1
- Change
tid
to trel
: tid = trel
- Change
trel
到 到rel
值在哪里id == trel
- If any
!equals(tid,trel)
转到 1.,否则结束
首先,我添加了 2 个辅助列来存储临时信息:
tmp <- tmp %>%
mutate(
tid = id,
trel = rel,
dtr = 0
)
该算法的前两步工作原理如下:
tmp <- tmp %>%
mutate(
dtr = if_else(
!equals(tid,trel),
dtr + 1,
dtr
),
tid = trel
)
第三步我不确定......我尝试使用以下代码来实现它,但这不起作用:
tmp <- tmp %>%
mutate(trel = rel[id == .$tid])
结果(当然)是错误的:
tmp$rel
[1] 7 7 7 7 7 7 7 7 7 7 7 7
但为什么不是这个呢? (第一次运行3.时应该是正确的解决方案):
[1] 2 7 2 7 2 4 7 7 10 8 7 7
第四步是通过检查 trel 中是否有多个唯一值来完成:
while(length(unique(tmp$trel)) > 1){
...
}
因此完整的算法应该看起来像这样:
get_dtr <- function(tib){
tmp <- tib %>%
mutate(
tid = id,
trel = rel,
dtr = 0
)
while(length(unique(tmp$trel)) > 1){
tmp <- tmp %>%
mutate(
dtr = if_else(
!equals(tid,trel),
dtr + 1,
dtr
),
tid = trel
)
### Step 3
}
tmp
}
知道如何解决这个问题或更简单的解决方案吗?提前致谢!