比较具有不同顶点数的图中的社区

2024-05-03

我正在根据通信数据图计算鲁汶社区，其中顶点代表大型项目的执行者。这些图表代表不同的通信方式（例如电子邮件、电话）。

我们想尝试从通信数据中识别表演者团队。由于表演者对不同的通信方法有不同的偏好，因此图的大小不同，并且可能有一些独特的顶点，而这些顶点可能不会同时出现。当我尝试比较各个图中的社区对象时，igraph::compare() 抛出异常。请参阅下面的玩具代表。

在构造图和社区对象以使它们具有相同大小之前，我考虑了顶点列表的 dplyr::full_join() 或 inner_join() ，但担心这样做会对生成的 cluster_louvain() 解决方案产生影响。

关于如何通过这些不同的通信方法将社区对象相互进行比较，有什么想法吗？提前致谢！

library(tidyverse, warn.conflicts = FALSE)
library(igraph, warn.conflicts = FALSE)

nodes <- as_tibble(list(id = c("sample1", "sample2", "sample3")))
edge <- as_tibble(list(from = "sample1",
                       to = "sample2"))
net <- graph_from_data_frame(d = edge, vertices = nodes, directed = FALSE)
com <- cluster_louvain(net)

nodes2 <- as_tibble(list(id = c("sample1","sample21", "sample22","sample23"
                                )))
edge2 <- as_tibble(list(from = c("sample1", "sample21"),
                       to = c("sample21", "sample22")))
net2 <- graph_from_data_frame(d = edge2, vertices = nodes2, directed = FALSE)
com2 <- cluster_louvain(net2)

# # uncomment to see graph plots
# plot.igraph(net, mark.groups = com)
# plot.igraph(net2, mark.groups = com2)

compare(com, com2)
#> Error in i_compare(comm1, comm2, method): At community.c:3106 : community membership vectors have different lengths, Invalid value

^{Created on 2019-02-22 by the reprex package https://reprex.tidyverse.org (v0.2.1)}

You will not (I don't believe) be able to compare clustering algorithms from two different graphs that contain two different sets of nodes. Practically you can't do it in igraph and conceptually its hard because the way clustering algorithms are compared is by considering all pairs of nodes in a graph and checking whether they are placed in the same cluster or a different cluster in each of the two clustering approaches. If both clustering approaches typically put the same nodes together and the same nodes apart then they are considered more similar.¹

我认为解决该问题的另一种有效方法是评估纯粹作为两个图的交集的节点集的聚类方案的相似程度。您必须决定什么对您的环境更有意义。我将展示如何使用节点的并集而不是交集来完成此操作。

因此，您需要两个图中的所有相同节点才能进行比较。事实上，我认为更简单的方法是将所有相同的节点放在一个图中并具有不同的边类型。然后，您可以分别计算每种边缘类型的聚类，然后进行比较。希望下面的表述是清楚的：

# repeat your set-up
library(tidyverse, warn.conflicts = FALSE)
library(igraph, warn.conflicts = FALSE)

nodes <- as_tibble(list(id = c("sample1", "sample2", "sample3")))
edge <- as_tibble(list(from = "sample1",
                       to = "sample2"))

nodes2 <- as_tibble(list(id = c("sample1","sample21", "sample22","sample23")))
edge2 <- as_tibble(list(from = c("sample1", "sample21"),
                        to = c("sample21", "sample22")))

# approach from a single graph
# concatenate edges
edges <- rbind(edge, edge2)
# create an edge attribute indicating network type
edges$type <- c("phone", "email", "email")
# the set of nodes (across both graphs)
nodes <- unique(rbind(nodes, nodes2))

g <- graph_from_data_frame(d = edges, vertices = nodes, directed = F)

# We cluster over the graph without the email edges
com_phone <- cluster_louvain(g %>% delete_edges(E(g)[E(g)$type=="email"]))
plot(g, mark.groups = com_phone)

# Now we can cluster over the graph without the phone edges
com_email <- cluster_louvain(g %>% delete_edges(E(g)[E(g)$type=="phone"]))
plot(g, mark.groups = com_email)

# Now we can compare
compare(com_phone, com_email)
#> [1] 0.7803552

正如您从图中看到的，我们挑选出与您在单独的图中找到的相同的初始聚类结构，并添加了额外的孤立节点。

1：显然这是一个相当模糊的解释。使用的默认算法compare来自这张纸 https://link.springer.com/chapter/10.1007/978-3-540-45167-9_14，这有一个很好的讨论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

比较具有不同顶点数的图中的社区的相关文章

一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
在 R 传单中添加不透明度滑块

如何在 R leaflet 应用程序中添加滑块来控制特定图层的不透明度对于这个应用程序我不想使用闪亮这里建议在 R 传单应用程序中添加滑块 https stackoverflow com questions 37682619 add
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
多个动态滤镜更新闪亮

我希望能够让 UI 输入闪亮并根据用户之前的选择进行自我更新因此在下面的示例中预期的行为是用户选择cyl vsor carb那么这将过滤数据集mtcars用于创建绘图即用户根据过滤条件调整绘图并更新其他过滤器中的剩余输入选择
sapply - 保留列名称

我试图总结数据集中许多不同列变量的平均值标准差等我已经编写了自己的汇总函数以准确返回我需要和正在使用的内容sapply立即将此函数应用于所有变量它工作正常但是返回的数据帧没有列名我似乎甚至无法使用列号引用重命名它们也就是说
在r中的某个阈值处破坏 cumsum() 函数

例如我有以下代码 cumsum 1 100 我想打破它如果一个元素 i 1 大于3000 我怎样才能做到这一点因此而不是这个结果 1 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 15
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
为什么这个 R ggplot2 代码会显示一个空白的显示设备？

虽然 SO 通常不用于帮助解决错误但这个显示了特别简单且特别烦人的行为如果你是一个ggplot2用户您可以在 10 秒或更短的时间内重现它正如这个 GitHub 问题 ggplot gtable 创建空白显示 https githu
R中IF函数的使用

我正在短跑ifR 中的函数但收到以下警告消息 In if runif 50 0 1 lt 0 69 the condition has length gt 1 and only the first element will be used
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

将毫秒时间戳解析为 R 中的时间

我以前曾问过这个问题但我找不到确切的答案如果我有一个代表自午夜以来的毫秒数的数字例如 34200577 我如何将其转换为 R 时间在午夜构造一个基线时间添加给定的毫秒一旦转换为秒并解释为时间 R gt as POSIXct as
data.table 逐行求和、平均值、最小值、最大值，如 dplyr？

还有其他关于数据表上的行式运算符的帖子他们要么是太简单 https stackoverflow com questions 7885147 efficient row wise operations on a data table或解决一
找到具有公共键的哈希数组的最大值？

我有两个数组每个数组包含任意数量的具有相同键但不同值的哈希值 ArrayA value abcd value length 4 type 0 value abcdefgh value length 8 type 1 ArrayB valu
在 Kotlin 中将 Dp 转换为 Px - 这种转换永远不会成功

我在使用 Kotlin 编码时遇到了问题我复制粘贴了一个java代码示例 https stackoverflow com a 9685690 6818446将 DP 转换为像素以便将其作为以编程方式设置填充的参数我原本期望 IDE 能
在 VIM 中缩进文件夹中的所有文件

我有一个包含数百个 TTL TeraTermLanguage 文件的文件夹现在我想缩进所有这些文件我已经创建了用于缩进的 teraterm vim 并使用 VIM 打开一个文件并执行 gg G 整个文件得到了正确的缩进但是有什么方法可
如何判断一个点是否属于某条线？

如何判断一个点是否属于某条线如果可能的话示例值得赞赏在最简单的形式中只需将坐标代入直线方程并检查是否相等 Given Point p X 4 Y 5 Line l Slope 1 YIntersect 1 代入 X 和 Y Y Sl
Rails 3.2.6 中的延迟加载

我在网上找到了一些资源而不是在做类似的事情时 cars Car where colour gt black 查询不会执行直到您执行以下操作 cars each c puts c name 但是在我的 Rails 3 2 6 项目中当
找不到文件“obj\Debug\OldProjectName.csproj.FileListAbsolute.txt”

我正在尝试发布项目工具 vs2010 但无法始终收到以下错误我从另一个项目粘贴到我的项目文件然后将命名空间 OldProjectName 更改为父项目 NewProjectName 但它仍然从某个地方获取有关旧项目的信息我清理了解决
在 iOS 框架中嵌入框架

我有一个包含另一个目标框架的项目它是主项目的依赖项该框架需要它自己的框架因此我使用 carthage 添加了它们该项目在模拟器上编译并运行良好但是在物理设备上运行时出现以下错误 dyld Library not loaded
Errno::EIO：输入/输出错误 -

class FaxFetchWorker include Sidekiq Worker sidekiq options retry gt false def perform job id 0 logger warn perform is i
djangonic 处理 rdf 的方法？

我正在寻找 django 的 RDF 项目但找不到任何活动的项目这似乎是一个不错的http code google com p django rdf http code google com p django rdf 但最后一次提交是在
如何比较具有复合主键的 2 个表中的行？

这是场景我有两张数据表一张是2009年版本一张是2010年版本每个表的主键都是复合键我知道每一行都有不同的行数我需要找出差异通常在正常主键设置中我只会查找不在其他表的主键列表中的主键值但我不知道如何使用复合主键来做到
从 Facebook 页面提取 RSS 源

我需要帮助从 Facebook 页面提取 RSS 提要我正在使用以下代码但它一直给我一个错误 string url https www facebook com feeds page php id 40796308305 format r
当转义引号存在时，在外部引号或外部方括号中分割逗号

是否可以按照以下条件拆分字符串用即逗号分隔在每个元素上忽略第一个和最后一个内的逗号检查在每个元素上忽略第一个和最后一个内的逗号检查 e g String source to char DATE YYYY MM DD I
AVX512 掩码寄存器（k1...k7）的 GNU C 内联 asm 输入约束？

AVX512 为其算术命令引入了 opmask 功能一个简单的例子上帝螺栓 org https godbolt org z P7xWD8 include
TaskSchedulerImpl：初始作业尚未接受任何资源；

这就是我正在尝试做的事情我创建了DataStax企业集群的两个节点在其上创建了一个java程序来获取一张表 Cassandra数据库表的计数该程序是在 eclipse 中构建的实际上是来自 windows 盒子从 Windows
JavaScript 调用函数

我最近一直在测试一些代码试图更好地理解 javascript 然后我遇到了call 我无法很好地理解的功能我有以下代码 function hi console log hi var bye function param param2 c
编写值包装类的最佳方法

假设我需要编写一个类来充当值的包装器 template
将模块定义为 Manipulate 表达式的一部分与在初始化部分中定义有任何性能问题吗？

我想问是否有人知道任何问题性能或其他如果要定义放置 Manipulate 表达式使用的模块就在 Manipulate 表达式本身内部而不是在初始化部分通常是在哪里完成的两种方法都有效但是当涉及到从模块直接访问 Manipul
比较具有不同顶点数的图中的社区

我正在根据通信数据图计算鲁汶社区其中顶点代表大型项目的执行者这些图表代表不同的通信方式例如电子邮件电话我们想尝试从通信数据中识别表演者团队由于表演者对不同的通信方法有不同的偏好因此图的大小不同并且可能有一些独特的顶点而这些

比较具有不同顶点数的图中的社区

比较具有不同顶点数的图中的社区 的相关文章

随机推荐

热门标签

比较具有不同顶点数的图中的社区的相关文章