使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配

2024-03-11

我一直在使用 igraph 在 R 中运行 Louvain 社区检测，感谢我之前查询的这个答案。 https://stackoverflow.com/questions/49834827/louvain-community-detection-in-r-using-igraph-format-of-edges-and-vertices/49842663#49842663然而，我发现cluster_louvain方法似乎在分配组成员身份方面做了一些奇怪的事情，我认为这是由于我导入数据的方式出现错误。虽然我认为我解决了这个问题，但我想了解问题是什么。

我在 400x400 相关矩阵（即 400 个人的相关得分）上运行了 Louvain 聚类。当我最初导入数据时，我的相关矩阵的行标题和列标题具有相同的个人 ID 号（即顶点号），如下所示：

    1     2     3     4   ... 400 
1   0     0.8   0.7   0.1 
2   0.8   0     0.6   0.3
3   0.7   0.6   0     0.9
4   0.1   0.3   0.9   0                    
...
400

该相关矩阵保存在“Correlations.csv”文件中，我使用该文件导入read.csv。然后，我使用下面的代码将其转换为距离矩阵，删除低于特定阈值的相关性，将其转换为 igraph 的邻接矩阵，然后运行 cluster_louvain：（答案中也提供了此代码here https://stackoverflow.com/questions/49834827/louvain-community-detection-in-r-using-igraph-format-of-edges-and-vertices/49842663#49842663).

correlationmatrix <- read.csv("Correlations.csv", header = TRUE, 
row.name = 1, check.names = FALSE)

distancematrix <- cor2dist(correlationmatrix)
DM2<- as.matrix(distancematrix)
DM2[correlationmatrix < 0.33] = 0

G2 <- graph.adjacency(DM2, mode = "undirected", weighted = TRUE, diag = TRUE)
clusterlouvain <- cluster_louvain(G2)

sizes(clusterlouvain)
Community sizes
1  2
200 200

然后我想获取每个 ID 号旁边的簇号，以了解哪个个体属于每个社区。在顶点 ID 列表中，它们旁边的成员资格被列为“1 2 1 2 1 2 1 2”，这显然是不正确的（因为我们不希望数据集中的每个替代个体都被分配到不同的社区）：

IDs_cluster <- cbind(V(G2)$name, clusterlouvain$membership)
IDs_cluster

ID  Membership
1   1
2   2 
3   1
4   2
5   1
6   2
…
400 2

通过查看其他数据集，我意识到问题可能是因为相关矩阵中的行标题是数字。所以我更改了相关矩阵，使行标题仍然是 ID 号，但列标题是“V1-V400”：

    V1    V2    V3    V4   ... V400 
1   0     0.8   0.7   0.1 
2   0.8   0     0.6   0.3
3   0.7   0.6   0     0.9
4   0.1   0.3   0.9   0                    
...
40

我将其导入为 .csv 文件并重新运行“cluster_louvain”，如下所示：

correlationmatrix_V <- read.csv("Correlations_withV.csv", header = TRUE,
row.name = 1, check.names = FALSE)

distancematrix_V <- cor2dist(correlationmatrix_V)
DM2_V <- as.matrix(distancematrix_V)
DM2_V[correlationmatrix_V < 0.33] = 0

G2_V <- graph.adjacency(DM2_V, mode = "undirected", weighted = TRUE, diag = TRUE)
clusterlouvain_V <- cluster_louvain(G2_V)

现在当我重新运行时cluster_louvain，它生成了三个集群的更合理的结果，每个集群的组成员资格看起来更像我们所期望的：

sizes(clusterlouvain_V)
Community sizes
1     2    3
168 52 180

IDs_cluster <- cbind(V(G2_V)$name, clusterlouvain_V$membership)
View(IDs_cluster)
ID  Membership
1   1
2   1 
3   3
4   2
5   2
6   2
…
400 1

我的问题是：是否可以澄清使用相同的行和列标题时发生的情况，这意味着组成员资格被分配给备用个人（即 ID 列表中的“1 2 1 2”，如第一个示例中所示），但在以下情况下得到解决：将列标题更改为非数字格式（如第二个示例中所示）？

这可能是一个简单的错误，因为当使用“read.csv”导入相关矩阵的 .csv 时，我没有使用正确的设置，因为我的列标题也是数字。

但是，我想了解为什么这意味着“cluster_louvain”以这种方式分配组成员资格。我发布这篇文章是为了如果有人犯了我上面犯的同样的错误，它可能会有用。欢迎任何见解，感谢您的建议！

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配的相关文章

R 中的“右”滚动平均值和“左”滚动平均值是什么？

如果我想计算之前的n意味着年份滞后于当年我将如何实现这一点它像右滚动平均窗口一样简单吗或者它是一个左滚动平均窗口我不确定这里使用哪个窗口样本数据 set seed 1234 dat lt data frame year c
有没有一种简单的方法可以在 R 的 igraph 中按度数对网络节点进行着色？

使用igraphR 包我想按度数对网络节点进行着色颜色应代表渐变例如从蓝色到红色或从黄色到红色从网络中观察到的最低程度到最高程度我找到了一个可行的解决方案 https stackoverflow com questions 40
删除第一次出现某个值后的行

我有以下 df df lt data frame var1 c 1 2 2 3 4 5 5 6 7 8 9 var2 c a b c d e f g h i j k 我想在达到前 5 var1 后进行过滤所以结果应该是 var1 var2
事后如何使用保存的.rds h2o模型进行预测？

我使用 mlr 和 h2o 包创建了一个 R 模型如下所示 library h2o rfh20 lrn makeLearner classif h2o randomForest predict type prob 完成模型调整模型启动
使用 lapply、Reduce 和 union 折叠 data.table 中的行

我有一个 data table 示例 JACcar 它应该使用下面的代码根据 ID 折叠成一行但是我不明白为什么它不会折叠少于 2 行我还尝试通过将列限制为仅包含 NA 以外的值的列来验证我的输出因为原始数据中有 123 列有人可
在 R 中使用 apply() 时出现未使用参数错误

当我尝试对日期列使用 apply 条件以返回一组系数时收到错误消息我有一个数据集为简单起见此处进行了修改但可重现 ADataset lt data table Epoch c 2007 11 15 2007 11 16 2007
如何检查向量是否是单个 NA 值，没有长度警告且没有抑制

我有一个功能NA作为默认值但如果没有NA应该是一个不限于大小 1 的字符向量我有一个检查来验证这些但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
如何扩展 ggplot y 轴限制以包含最大值

通常在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
将 Excel 数字日期重新格式化为 R 日期

希望将从 Excel 中提取的列重新格式化为包含数字 Excel 格式例如 40182 的数据框 as date 40182 origin 1899 12 30 format b Y Returns 1 2070 年 1 月 5 日我正
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
为什么表达式“1”==1 的计算结果为 TRUE？ [复制]

这个问题在这里已经有答案了 1 是字符值其他1是数字甚至当我尝试在下面执行时它给了我 TRUE as character 0 as numeric 0 谁能帮助我理解为什么来自help 如果两个参数是不同类型的原子向量则其中一
挑战：优化取消列出[简单]

因为 SO 最近有点慢所以我发布了一个简单的问题如果大鱼们能在这场比赛中留在替补席上并给新秀们一个回应的机会我将不胜感激有时我们的对象具有大量的大列表元素向量您如何将这个对象取消列出到单个向量中证明你的方法比unlist
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
与heroku配合使用的统计引擎

我有一个 Heroku Rails 应用程序需要处理一些重要的数字并且我需要使用像 R 这样的统计库更糟糕的是 MatLab 我正在寻找以下任何问题的答案是否有不需要二进制文件的功能齐全的统计包 GEM 是否可以将 R 二进制文件作
Dplyr 过滤多个类似条件

我正在尝试在 dplyr 中做一个过滤器其中的列就像某些观察结果我可以使用 sqldf 作为 Test lt sqldf select from database Where SOURCE LIKE ALPHA OR SOURCE LI
省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色以便在我的 ggplot 条形图中使用然而我却做不到帮助下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
有没有一种明智的方法可以在 R 中执行诸如文档字符串之类的操作？

这不仅仅是一个编码风格问题如果您了解 python 我认为 Ruby 也有类似的东西您可以在函数中拥有文档字符串这样您就可以通过发出 help 命令轻松获取该字符串例如 def something t None Do somethi
包什么时候需要为它自己的对象使用 :::

考虑这个 R 包有两个函数一个是导出函数另一个是内部函数 hello R export hello lt function internalFunctions hello internal 你好内部 R hello internal
二部图匹配以匹配两个集合

我是新手igraphR 中的包我有两套A and B 每个都有N顶点 A1 A2 AN and B1 B2 BN 每个元素之间都有一个边缘A对每一个元素B 我有一个函数fWgt Ai Bj 返回之间的边的权重Ai and Bj 我一直在尝
如何在 R 中创建“堆叠瀑布”图表？

I was able to find several packages to create a waterfall chart in R which look like this But I could not find a way to

随机推荐

jquery地址怎么用呢？

我试图了解如何使用 jQuery 地址插件来处理 ajax 的深度链接但文档非常差我找不到任何好的教程来解释正在发生的事情我认为一个好的文档和好的例子对于每个插件都很重要有人可以解释或提供一些有用的解释链接吗 address cha
codeigniter $this->upload->do_upload() = false

我正在尝试上传文件我选择一个文件然后提交它但 this gt upload gt do upload 的结果始终为 false 这是我的表格
subprocess.Popen execve() arg 3 包含非字符串值

我正在尝试通过 shell 运行另一个脚本该脚本使用一组修改后的环境变量 def cgi call script environ pSCRIPT subprocess Popen script stdout subprocess PIPE
替换失败是否是依赖非类型模板参数的错误？

假设我有这些模板别名 enum class enabler template
“出于安全原因”pcntl 无法在 Ubuntu 上运行

我已经在 Ubuntu 32 位 12 10 上运行的 PHP 5 4 6 上安装了 pcntl 使用this http www crimulus com 2010 07 30 howto enable pcntl in ubuntu ph
包含声明

我不明白的重要性CONTAINSFortran 90 中的声明例如 PROGRAM BLABLA IMPLICIT NONE INTEGER i j k i 1 j 1 k 1 PRINT i j k CALL ABC i j k PRI
Gtk-CRITICAL **：IA__gtk_widget_style_get：断言“GTK_IS_WIDGET（小部件）”失败

在静态构建我的 qt 应用程序之后 configure static debug and release confirm license nomake demos nomake examples nomake tools 它工作正常但我收
如何使固定大小的主体（或div）始终保持在页面的中心（甚至垂直！）

我试图使 1024x768 的主体始终保持在页面的中心上下间距相同左右间距也相同但是我在执行此操作时遇到了麻烦我用的是trick距顶部的间距为 50 然后我将主体绝对定位在 384px 即 768 的一半然而这种方法给我带来了
Yii 单选按钮

我在 Yii 中使用单选按钮无论我做什么我都无法获取要发布的所选按钮的值我确信这只是简单的事情我没有使用 radioButtonList 因为我希望每个按钮都存在于其自己的 div 中并在其上方有一个图像这是我从视图中看到的代码
为什么 Scala 在按名称参数重载时的行为与按值参数重载时的行为不同？

鉴于以下 Scala 代码 object test def byval a Int println Int def byval a Long println Long def byname a gt Int println gt Int d
为什么 [regex] match() 和 -match 不同？

当我在 PowerShell 中使用正则表达式时我偶然发现了一个与 Powershell 不同的奇怪场景 regex 班级匹配 match 在我尝试从字符串中删除空行的情况下当使用 replace我的表情在与时都不起作用 regex r
如何散列 std::string？

我正在制作一个小实用程序来帮助我通过重复来记住密码我想每天只输入一次密码而不是在每次会话之前输入当然我不会存储密码本身但很乐意存储其哈希值那么获取哈希值的最简单方法是什么std string使用 C 标准库对于不涉及外部库的
多重继承和指针实现

给出以下代码 namespace Example1 class A public A virtual A private float data A class B public B virtual B protected float dat
viewpager和fragment中布局的幽灵

I use the viewpager and fragment the adapter is FragmentStatePagerAdapter fragment s layout i use is SwipeRefreshLayout
分配器类型参数的 C++ 设计模式

C 03 标准库在将类型传递给旨在作为分配器的类时使用简单的模板类型参数这是可能的因为模板在 C 中的工作方式但是它并不是很简单您可能不知道类型定义到底应该是什么样子特别是在非标准类型的情况下我认为使用适配器类可能是个好主意
vue动态mapGetters

我有一个 props 我想用它来制作动态 mapGetters 但是 mapGetters 将 props 视为未定义可能是因为计算值是在 props 之前加载的有人知道我怎样才能让它变得动态吗我的代码如下 export defaul
从 VSCode 中删除 git 集成

我下载了 Visual Studio Code 来在工作中试用我几乎爱上了它的一切但我不喜欢的一部分是 Git 集成我导入了整个工作文件夹约 14000 个源文件 git 项目 Visual Studio Code 中的布局和所有内
切换大小写奇怪的范围

在查看一些第 3 方 C 代码时我遇到了类似的情况 switch state case 0 if c A open brace code break brace not closed case 1 code break close bra
python 中的套接字问题

我有一个用 C 编写的服务器我想用 python 编写一个客户端当 python 客户端想要发送文件时它会发送一个字符串 send some file 后跟文件的内容和字符串 end some file 这是我的客户端代码 file
使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配

我一直在使用 igraph 在 R 中运行 Louvain 社区检测感谢我之前查询的这个答案 https stackoverflow com questions 49834827 louvain community detection i

使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配

使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配 的相关文章

随机推荐

热门标签

使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配的相关文章