Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks

2023-05-16

摘要
图神经网络在图结构数据中取得了很好的效果但是大多数的模型使用的还是叫浅层的结构,当模型层数加深时很容易过平滑。本文基于多视图来聚合更多的信息。我们首先设计两个互补的视图来描述全局结构和节点特征相似性,然后使用注意力策略融合节点表示。最后,通过在不同视图上使用对比学习来学习节点的表示。

引言
GCN是每层聚合一次一阶邻居的信息,通过增加层数迭代聚合邻居信息。但随着网络层数的增加,效果会严重下降。实验发现使用RELU作为激活函数的GCN随着层数的增加效果严重下降而使用其他激活函数图tanh有减缓过平滑的效果但是随着层数增加效果仍在下降。深层的GNN可以聚合高阶邻居的信息但这些信息可能包含噪声,会降低节点的可区分性。因此,现存GNN模型待处理两个问题:
1)如何聚合高阶邻居的特征?
2)如何区分不同邻居的贡献程度?
深度的GNN只处理了第一个问题,GAT等只处理了第二个问题。

为了解决上面两个问题,我们设计了两个新颖的GNN模型叫做MV-CGC和MV-GCN从多个视图中学习节点的表示。多视图表示学习就是为同一目标生成多个视图来学习。我们首先引入两个视图来表示全局关系和节点之间的特征关系作为邻接矩阵的补充。这三个视图可以分别从局部拓扑,全局拓扑和特征相似性的角度更加精确的描述了节点之间的关系。然后使用任何已有GNN模型在该三个视图上学习节点表示。模型可以从全局拓扑和特征相似视图中聚合高阶邻居的特征。然后使用注意力机制计算各个视图中节点表示的贡献度并聚合节点表示。进一步,我们引入了自监督技术通过在不同视图之间对比学习节点的表示。

模型

Multi-View Graph Convolutional Network(MV-GCN)
在这里插入图片描述

多视图学习是以一种基础的数据增强技术可以从不同角度描述数据。图建模的是关系,而这种关系是多样的,单一的视图很难精确描述,并且,网络中可能会有噪声。为丰富结点之间的关系,本文从高阶拓扑和特征相似性两个视角出发。基于原始邻接矩阵和原始特征生成两个视图并使用任何的GNN模型为每个视图生成对应的结点表示。之后,使用一个融合方法从三个视图中融合结点的表示,最终将学到的表示用于下游任务。

由于传统的GCN能捕获结点的阶数和模型的层数一致,当层数加深时会出现过拟合,因此,本文采用高阶的拓扑矩阵来表示全局关系。随机游走是一种获取高阶拓扑结构的方法。本文采用个性化PageRank获取扩散矩阵来表示全局的结构。为每个结点选择最相似的k个结点得到全局相似矩阵。然后使用余弦相似度评估结点的特征相似性,为每个结点选择top k个最相似的结点作为邻居。在得到三个视角后,为每个视图使用GNN经计算三组结点表示最后融合三组表示得到最终结点表示。其过程如下式:
在这里插入图片描述
在这里插入图片描述

其中,mix函数可以使用拼接,平均等操作,本文采用注意力机制学习结点表示在不同视图下的重要程度。比如,对于结点i,可以得到三个表示在这里插入图片描述
,s=1,2,3。注意力权重计算如下
在这里插入图片描述
最终结点的表示定义为
在这里插入图片描述
经过线性变换使用交叉熵分类
在这里插入图片描述
在这里插入图片描述

同一结点不同视图的表示应该是相似的,本文使用一致性正则loss降低不同视图结点表示之间的分布差异
在这里插入图片描述
在这里插入图片描述

为了降低熵,本文还在embedding分布上使用了一个尖锐的函数。
在这里插入图片描述
最终的loss为
在这里插入图片描述

Multi-View Contrastive Graph Convolutional Network(MV-CGC)
传统的监督学习要求大量的标记样本才能达到较好的效果但是现实场景中充斥着大量的无标签数据,而标记这些数据需要很高的代价。MVGRL通过对比图的结构化视图学习结点和图的表示,具体就是在邻接矩阵和扩散矩阵上使用GCN学习结点和图的表示。但是该方法只考虑了局部结构和全局结构并没有考虑到结点的属性相似性 。基于此考虑,本文通过对比三个视图上同一实体来学习结点的表示 。

值得注意的是,视角数量超过两个并不能提升MVGRL的效果,甚至还有负作用。但在我们的工作中却恰恰相反。主要原因是在MVGRL中使用了两个扩散矩阵来表示局部和全局邻接矩阵但是这两个矩阵不是互补的,对对比效果甚至会有影响。但是我们使用了三个互补的视图,特征相似性视图可以为那些结构上不连接但标签相同特征相似的结点建立紧密的关系。

类似于MVGRL,本文通过最大化不同视图之间子图级表示和节点级表示的互信息学习样本的表示。具体来说,首先计算全局结构矩阵和特征相似度矩阵,然后从原图中采样子图并使用三个独立的GCN从三个视角中学习结点和子图的表示。最后使用readout函数得到子图的表示。最终,通过最大化子图的表示和对应结点的表示之间的互信息来区分实体的表示。
在这里插入图片描述
本文通过随机扰动特征来生成正样本。在预测阶段,聚合三个视图上的结点表示并经过MLP+softmax预测最终的标签信息。

实验
semi-supervised classfication

在这里插入图片描述

unsupervised classification
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks 的相关文章

随机推荐

  • sqlsever中text字段类型是否会影响查询性能

    先上结论 会影响查询性能 我在库里找了一张表T Sys Log 然后做2个副本 备份表 SELECT INTO T Sys Log back FROM T Sys Log SELECT INTO T Sys Log back2 FROM T
  • 【无标题】

    起因 2010 年 xff0c 谷歌宣布退出地内市场的时候 xff0c 一直保留着 谷歌地图 和 谷歌翻译 这两个公共服务 有兴趣自行百度下谷歌和百度恩怨 在 2020 年 xff0c 谷歌停止了 谷歌地图 在内地的服务 现在 xff0c
  • vmware ESXI 裸金属架构 本地服务器 开启Intel VT-x(虚拟化技术)

    我想使用vmware ESXI 安装的WIN10虚拟机中装vmware软件再装win10 即虚拟机中套虚拟机 基于工作要求某个XXX项目需要开启VPN远程到客户内网进行维护 客户对网络审计比较严 安装VPN的那台机子识别码要上传服务器 基本
  • 对一个或多个实体的验证失败。有关详细信息,请参见“EntityValidationErrors”属性。

    因为是转载文章 在此标明出处 xff0c 以前有文章是转的没标明的请谅解 xff0c 因为有些已经无法找到出处 xff0c 或者与其它原因 如有冒犯请联系本人 xff0c 或删除 xff0c 或标明出处 因为好的文章 xff0c 以前只想收
  • 一元正态分布

    d import numpy as np import matplotlib pyplot as plt from scipy stats import norm 生成100个正态分布数据 xff0c 均值为1 xff0c 标准差为2 da
  • CaptureLayer的另外一个调用例子TaskSnapshot

    在前一篇讨论中 xff0c 我们查找了系统中调用captureLayers的地方 1323 public static GraphicBuffer captureLayers IBinder layerHandleToken Rect so
  • visualsvn server 无法访问url

    IIS 发布网站 本机能访问 其它人访问不了 看一下服务端 VisualSVN Server 的服务有没有启动 x A 34 H g6 L N s 管理 服务 VisualSVN Server 备注 做为开发机子 手动优化自己的电脑吧 否则
  • JS日期加减,日期运算

    因为是转载文章 在此标明出处 xff0c 以前有文章是转的没标明的请谅解 xff0c 因为有些已经无法找到出处 xff0c 或者与其它原因 如有冒犯请联系本人 xff0c 或删除 xff0c 或标明出处 因为好的文章 xff0c 以前只想收
  • jQuery easyui 选中特定的tab

    获取选中的 Tab 1 获取选中的 tab panel 和它的 tab 对象 2 var pp 61 39 tt 39 tabs 39 getSelected 39 3 var tab 61 pp panel 39 options 39 t
  • Server Error in '/' Application. 解决办法

    Server Error in 39 39 Application Access to the path 39 E NetWeb2 Content upFile BClientExcel 大客户部通讯录导入 xlsx 39 is denie
  • easyui-datagrid 数据出不来(样式引起的bug)

    今天任务是需要从另一个项目中将某几个功能页面移植到现有的项目中 这是比较繁琐的功能 理解要移植功能的逻辑 xff08 业务逻辑 xff0c 涉及到的表和存储过程 xff09 页面样式 这么是我遇到的一个问题之一 xff1b 我需要展现一个e
  • c#切割字符串几种方法

    1 xff0c 按单一字符切割 string s 61 34 abcdeabcdeabcde 34 string sArray 61 s Split 34 c 34 oreach string i in sArray Console Wri
  • 动态链接库与静态链接库的区别

    静态链接库与动态链接库都是共享代码的方式 xff0c 如果采用静态链接库 xff0c 则无论你愿不愿意 xff0c lib 中的指令都全部被直接包含在最终生成的 EXE 文件中了 但是若使用 DLL xff0c 该 DLL 不必被包含在最终
  • ssm——小学期实训总结

    实训总结 经过这两个星期短暂的学习 xff0c 我学习了ssm的框架搭建与web前端设计基础 在第一个星期 xff0c 老师着重为我们讲了框架的原理 搭建与运用 xff1b 而在第二个星期 xff0c 重点则转移到了小组对项目的开发与研究上
  • 节点中心性

    文章目录 度中心性 Degree Centrality 特征向量中心性 Eigenvector Centrality Katz中心性 Katz Centrality Katz index PageRank中心性PageRank算法 接近中心
  • 机器学习面试知识点总结

    文章目录 计算学习理论过拟合与欠拟合过拟合欠拟合 偏差与方差最大似然估计与贝叶斯估计极大似然估计贝叶斯决策论贝叶斯估计 特征工程与特征选择特征工程逐层归一化特征选择 模型融合融合策略 评估方法与评价指标评估方法评价指标 优化算法正则化深度模
  • Multi-view graph convolutional networks with attention mechanism

    摘要 传统的图卷积网络关注于如何高效的探索不同阶跳数 hops 的邻居节点的信息 但是目前的基于GCN的图网络模型都是构建在固定邻接矩阵上的即实际图的一个拓扑视角 当数据包含噪声或者图不完备时 xff0c 这种方式会限制模型的表达能力 由于
  • An Empirical Study of Graph Contrastive Learning

    摘要 图对比学习在图表示学习领域树立了新的范式 xff0c 不需要人工标注信息 但对GCL的分析却寥寥无几 本文通过分析一般化的GCL范式的各个部分包括增强函数 xff0c 对比模式 xff0c 对比目标和负采样技术 xff0c 然后分析各
  • Data Augmentation

    自监督深度学习模型的精确性严重依赖于训练时数据的多样性和数据量 模型要想在更复杂任务上有较好的效果一般会有大量的隐藏单元 一般在训练过程中训练隐藏单元越多需要的数据越多 xff0c 即任务复杂度与参数量与需要的数据量成正比 由于训练复杂任务
  • Semi-Supervised and Self-Supervised Classification with Multi-View Graph Neural Networks

    摘要 图神经网络在图结构数据中取得了很好的效果但是大多数的模型使用的还是叫浅层的结构 xff0c 当模型层数加深时很容易过平滑 本文基于多视图来聚合更多的信息 我们首先设计两个互补的视图来描述全局结构和节点特征相似性 xff0c 然后使用注