Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks

2023-05-16

摘要
图神经网络在图结构数据中取得了很好的效果但是大多数的模型使用的还是叫浅层的结构，当模型层数加深时很容易过平滑。本文基于多视图来聚合更多的信息。我们首先设计两个互补的视图来描述全局结构和节点特征相似性，然后使用注意力策略融合节点表示。最后，通过在不同视图上使用对比学习来学习节点的表示。

引言
GCN是每层聚合一次一阶邻居的信息，通过增加层数迭代聚合邻居信息。但随着网络层数的增加，效果会严重下降。实验发现使用RELU作为激活函数的GCN随着层数的增加效果严重下降而使用其他激活函数图tanh有减缓过平滑的效果但是随着层数增加效果仍在下降。深层的GNN可以聚合高阶邻居的信息但这些信息可能包含噪声，会降低节点的可区分性。因此，现存GNN模型待处理两个问题：
1）如何聚合高阶邻居的特征？
2）如何区分不同邻居的贡献程度？
深度的GNN只处理了第一个问题，GAT等只处理了第二个问题。

为了解决上面两个问题，我们设计了两个新颖的GNN模型叫做MV-CGC和MV-GCN从多个视图中学习节点的表示。多视图表示学习就是为同一目标生成多个视图来学习。我们首先引入两个视图来表示全局关系和节点之间的特征关系作为邻接矩阵的补充。这三个视图可以分别从局部拓扑，全局拓扑和特征相似性的角度更加精确的描述了节点之间的关系。然后使用任何已有GNN模型在该三个视图上学习节点表示。模型可以从全局拓扑和特征相似视图中聚合高阶邻居的特征。然后使用注意力机制计算各个视图中节点表示的贡献度并聚合节点表示。进一步，我们引入了自监督技术通过在不同视图之间对比学习节点的表示。

模型

Multi-View Graph Convolutional Network(MV-GCN)
在这里插入图片描述

多视图学习是以一种基础的数据增强技术可以从不同角度描述数据。图建模的是关系，而这种关系是多样的，单一的视图很难精确描述，并且，网络中可能会有噪声。为丰富结点之间的关系，本文从高阶拓扑和特征相似性两个视角出发。基于原始邻接矩阵和原始特征生成两个视图并使用任何的GNN模型为每个视图生成对应的结点表示。之后，使用一个融合方法从三个视图中融合结点的表示，最终将学到的表示用于下游任务。

由于传统的GCN能捕获结点的阶数和模型的层数一致，当层数加深时会出现过拟合，因此，本文采用高阶的拓扑矩阵来表示全局关系。随机游走是一种获取高阶拓扑结构的方法。本文采用个性化PageRank获取扩散矩阵来表示全局的结构。为每个结点选择最相似的k个结点得到全局相似矩阵。然后使用余弦相似度评估结点的特征相似性，为每个结点选择top k个最相似的结点作为邻居。在得到三个视角后，为每个视图使用GNN经计算三组结点表示最后融合三组表示得到最终结点表示。其过程如下式：
在这里插入图片描述

其中，mix函数可以使用拼接，平均等操作，本文采用注意力机制学习结点表示在不同视图下的重要程度。比如，对于结点i，可以得到三个表示在这里插入图片描述
，s=1,2,3。注意力权重计算如下

最终结点的表示定义为

经过线性变换使用交叉熵分类

同一结点不同视图的表示应该是相似的，本文使用一致性正则loss降低不同视图结点表示之间的分布差异
在这里插入图片描述

为了降低熵，本文还在embedding分布上使用了一个尖锐的函数。
在这里插入图片描述
最终的loss为

Multi-View Contrastive Graph Convolutional Network(MV-CGC)
传统的监督学习要求大量的标记样本才能达到较好的效果但是现实场景中充斥着大量的无标签数据，而标记这些数据需要很高的代价。MVGRL通过对比图的结构化视图学习结点和图的表示，具体就是在邻接矩阵和扩散矩阵上使用GCN学习结点和图的表示。但是该方法只考虑了局部结构和全局结构并没有考虑到结点的属性相似性。基于此考虑，本文通过对比三个视图上同一实体来学习结点的表示。

值得注意的是，视角数量超过两个并不能提升MVGRL的效果，甚至还有负作用。但在我们的工作中却恰恰相反。主要原因是在MVGRL中使用了两个扩散矩阵来表示局部和全局邻接矩阵但是这两个矩阵不是互补的，对对比效果甚至会有影响。但是我们使用了三个互补的视图，特征相似性视图可以为那些结构上不连接但标签相同特征相似的结点建立紧密的关系。

类似于MVGRL，本文通过最大化不同视图之间子图级表示和节点级表示的互信息学习样本的表示。具体来说，首先计算全局结构矩阵和特征相似度矩阵，然后从原图中采样子图并使用三个独立的GCN从三个视角中学习结点和子图的表示。最后使用readout函数得到子图的表示。最终，通过最大化子图的表示和对应结点的表示之间的互信息来区分实体的表示。
在这里插入图片描述
本文通过随机扰动特征来生成正样本。在预测阶段，聚合三个视图上的结点表示并经过MLP+softmax预测最终的标签信息。

实验
semi-supervised classfication
在这里插入图片描述

unsupervised classification
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks 的相关文章

计算测试集每个类别的熵以测量 pytorch 上的不确定性

我正在尝试使用 MC Dropout 方法和此链接中提出的解决方案来计算图像分类任务的数据集的每一类的熵以测量 pytorch 上的不确定性在 pytorch 上使用 MC Dropout 测量不确定性 https stackoverf
这里怎么能借用自我的多个部分呢？这里的自借不是可变的和不变的吗？

我有这个结构 struct PhysicsState nodes Vec
如何使用 R 中 e1071 包的“svm”执行多类分类

我想使用执行多类分类svm的函数e1071包裹但据我从文档中了解到svm 只能进行二元分类插图文档讲述了多类分类的情况为了允许多类分类 libsvm通过拟合所有二元子分类器并通过投票机制找到正确的类使用一对一技术我仍然不明白的是我
为 Twitter 情绪分析项目寻找 C# 中的开源朴素贝叶斯分类器 [已关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
解析 HTML：成人分类系统

我正在研究网络上使用的不同且有时已过时的评级分类标准 IE PICS http www w3 org PICS POWDER http www w3 org 2007 powder ICRA http www fosi org icr
如何像instance_eval方法一样在块中更改self？

instance eval 方法在其块中更改 self 例如 class D end d D new d instance eval do puts self print something like
如何在java中使用StringToWordVector（weka）？

这是我的arff文件 relation hamspam attribute text string attribute class ham spam data good ham very good ham bad spam very bad
文本分类方法？支持向量机和决策树

我有一个训练集我想使用分类方法根据我的训练集对其他文档进行分类我的文档类型是新闻类别是体育政治经济等我完全理解朴素贝叶斯和KNN 但是SVM和决策树很模糊我不知道我是否可以自己实现这个方法或者有使用这种方法的应用程序吗我可
我如何知道训练数据足以用于机器学习

例如如果我想训练一个分类器也许是SVM 我需要收集多少样本有没有一个测量方法呢知道需要收集多少样本并不容易不过您可以按照以下步骤操作解决典型的机器学习问题构建一个包含几个样本的数据集 a 有多少个这取决于您遇到的问题类型
朴素贝叶斯：训练的每个特征的类内方差必须为正

当尝试拟合朴素贝叶斯时 training data sample target class K8 train model nb NaiveBayes fit training data target class prediction y n
R中使用GBM函数进行分类的问题

我试图用R中的gum函数来做分类问题 library gbm set seed 1 boost goodwine gbm goodwine quality data traindata shrinkage 0 01 cv folds 5 d
将朴素贝叶斯训练分类器保存在 NLTK 中

我对如何保存经过训练的分类器有点困惑例如每次我想使用分类器时重新训练它显然非常糟糕且缓慢我如何保存它并在需要时再次加载它代码如下提前感谢您的帮助我正在使用 Python 和 NLTK 朴素贝叶斯分类器 classifier nl
R 中使用插入符号进行分类的预测（模型）和预测（模型$ FinalModel）之间的区别

有什么区别 predict rf newdata testSet and predict rf finalModel newdata testSet 我训练模型preProcess c center scale tc lt trainCon
“self”关键字在类方法中是必需的吗？

我是 python 初学者我了解到该方法中的第一个参数应该包含一些 self 关键字但我发现以下程序在没有 self 关键字的情况下运行你能解释一下吗下面是我的代码 class Student object def init sel
逻辑回归中的成本函数给出 NaN 结果

我正在使用批量梯度下降来实现逻辑回归输入样本要分为两类类别为 1 和 0 在训练数据时我使用以下 sigmoid 函数 t 1 1 exp z where z x theta 我正在使用以下成本函数来计算成本以确定何时停止训练 fu
swift 函数调用：self 关键字与不使用 self 关键字

我想知道类中的这两个函数调用之间是否有任何区别 self myFuction VS myFunction 它以两种方式发挥作用有没有必要使用self关键字的情况大多数情况下绝对没有区别但如果省略 self 则更加迅速但有一种情况
在 R 中对非常大的数据集（180 万行 x 270 列）进行建模

我正在研究一个视窗8操作系统带有8 GB 内存我有一个数据框180 万行 x 270 列我必须对其执行glm logit 任何其他分类我尝试使用 ff 和 bigglm 包来处理数据但我仍然面临错误的问题 Error cannot a
令人困惑的类型错误

我有一个小型 Python 程序它应该通过运行适当的方法来对按下向上按钮做出反应但它没有这样做而是给了我一个令人困惑的错误 from tkinter import class App def init self master self
仅正样本和未标记数据集的二元半监督分类

我的数据由评论组成保存在文件中其中很少被标记为正面我想使用半监督和PU http www cs uic edu liub publications ICDM 03 pdf分类将这些评论分为正面和负面类别我想知道 python sci
使用 train_test_split 分割数据时的精度与随后加载 csv 文件的精度不同

我建立了一个模型来预测客户是企业客户还是私人客户训练模型后我预测了 1000 个数据集的类别但我没有将其用于训练此预测将保存在 csv 文件中现在我有两种不同的行为在程序中分割样本数据当我创建示例时train sample t

随机推荐

sqlsever中text字段类型是否会影响查询性能

先上结论会影响查询性能我在库里找了一张表T Sys Log 然后做2个副本备份表 SELECT INTO T Sys Log back FROM T Sys Log SELECT INTO T Sys Log back2 FROM T
【无标题】

起因 2010 年 xff0c 谷歌宣布退出地内市场的时候 xff0c 一直保留着谷歌地图和谷歌翻译这两个公共服务有兴趣自行百度下谷歌和百度恩怨在 2020 年 xff0c 谷歌停止了谷歌地图在内地的服务现在 xff0c
vmware ESXI 裸金属架构本地服务器开启Intel VT-x(虚拟化技术)

我想使用vmware ESXI 安装的WIN10虚拟机中装vmware软件再装win10 即虚拟机中套虚拟机基于工作要求某个XXX项目需要开启VPN远程到客户内网进行维护客户对网络审计比较严安装VPN的那台机子识别码要上传服务器基本
对一个或多个实体的验证失败。有关详细信息，请参见“EntityValidationErrors”属性。

因为是转载文章在此标明出处 xff0c 以前有文章是转的没标明的请谅解 xff0c 因为有些已经无法找到出处 xff0c 或者与其它原因如有冒犯请联系本人 xff0c 或删除 xff0c 或标明出处因为好的文章 xff0c 以前只想收
一元正态分布

d import numpy as np import matplotlib pyplot as plt from scipy stats import norm 生成100个正态分布数据 xff0c 均值为1 xff0c 标准差为2 da
CaptureLayer的另外一个调用例子TaskSnapshot

在前一篇讨论中 xff0c 我们查找了系统中调用captureLayers的地方 1323 public static GraphicBuffer captureLayers IBinder layerHandleToken Rect so
visualsvn server 无法访问url

IIS 发布网站本机能访问其它人访问不了看一下服务端 VisualSVN Server 的服务有没有启动 x A 34 H g6 L N s 管理服务 VisualSVN Server 备注做为开发机子手动优化自己的电脑吧否则
JS日期加减,日期运算

因为是转载文章在此标明出处 xff0c 以前有文章是转的没标明的请谅解 xff0c 因为有些已经无法找到出处 xff0c 或者与其它原因如有冒犯请联系本人 xff0c 或删除 xff0c 或标明出处因为好的文章 xff0c 以前只想收
jQuery easyui 选中特定的tab

获取选中的 Tab 1 获取选中的 tab panel 和它的 tab 对象 2 var pp 61 39 tt 39 tabs 39 getSelected 39 3 var tab 61 pp panel 39 options 39 t
Server Error in '/' Application. 解决办法

Server Error in 39 39 Application Access to the path 39 E NetWeb2 Content upFile BClientExcel 大客户部通讯录导入 xlsx 39 is denie
easyui-datagrid 数据出不来（样式引起的bug）

今天任务是需要从另一个项目中将某几个功能页面移植到现有的项目中这是比较繁琐的功能理解要移植功能的逻辑 xff08 业务逻辑 xff0c 涉及到的表和存储过程 xff09 页面样式这么是我遇到的一个问题之一 xff1b 我需要展现一个e
c#切割字符串几种方法

1 xff0c 按单一字符切割 string s 61 34 abcdeabcdeabcde 34 string sArray 61 s Split 34 c 34 oreach string i in sArray Console Wri
动态链接库与静态链接库的区别

静态链接库与动态链接库都是共享代码的方式 xff0c 如果采用静态链接库 xff0c 则无论你愿不愿意 xff0c lib 中的指令都全部被直接包含在最终生成的 EXE 文件中了但是若使用 DLL xff0c 该 DLL 不必被包含在最终
ssm——小学期实训总结

实训总结经过这两个星期短暂的学习 xff0c 我学习了ssm的框架搭建与web前端设计基础在第一个星期 xff0c 老师着重为我们讲了框架的原理搭建与运用 xff1b 而在第二个星期 xff0c 重点则转移到了小组对项目的开发与研究上
节点中心性

文章目录度中心性 Degree Centrality 特征向量中心性 Eigenvector Centrality Katz中心性 Katz Centrality Katz index PageRank中心性PageRank算法接近中心
机器学习面试知识点总结

文章目录计算学习理论过拟合与欠拟合过拟合欠拟合偏差与方差最大似然估计与贝叶斯估计极大似然估计贝叶斯决策论贝叶斯估计特征工程与特征选择特征工程逐层归一化特征选择模型融合融合策略评估方法与评价指标评估方法评价指标优化算法正则化深度模
Multi-view graph convolutional networks with attention mechanism

摘要传统的图卷积网络关注于如何高效的探索不同阶跳数 hops 的邻居节点的信息但是目前的基于GCN的图网络模型都是构建在固定邻接矩阵上的即实际图的一个拓扑视角当数据包含噪声或者图不完备时 xff0c 这种方式会限制模型的表达能力由于
An Empirical Study of Graph Contrastive Learning

摘要图对比学习在图表示学习领域树立了新的范式 xff0c 不需要人工标注信息但对GCL的分析却寥寥无几本文通过分析一般化的GCL范式的各个部分包括增强函数 xff0c 对比模式 xff0c 对比目标和负采样技术 xff0c 然后分析各
Data Augmentation

自监督深度学习模型的精确性严重依赖于训练时数据的多样性和数据量模型要想在更复杂任务上有较好的效果一般会有大量的隐藏单元一般在训练过程中训练隐藏单元越多需要的数据越多 xff0c 即任务复杂度与参数量与需要的数据量成正比由于训练复杂任务
Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks

摘要图神经网络在图结构数据中取得了很好的效果但是大多数的模型使用的还是叫浅层的结构 xff0c 当模型层数加深时很容易过平滑本文基于多视图来聚合更多的信息我们首先设计两个互补的视图来描述全局结构和节点特征相似性 xff0c 然后使用注

Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks

Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks 的相关文章

随机推荐

热门标签