【论文阅读】BGRL:Bootstrapped Representation Learning on Graphs

2023-11-12

摘要

目前最先进的GNN的自监督学习方法是基于对比学习的,它们严重依赖于图增强和负例。例如,在标准的PPI基准上,增加负对的数量可以提高性能,因此需要的计算和内存成本是节点数量的二次方,这样才能实现最高性能。受BYOL(一种最近引入的不需要负对的自监督学习方法)的启发,我们提出了BGRL,一种自监督图表示方法,可以消除这种潜在的二次瓶颈。BGRL在几个已建立的基准数据集上优于或匹配之前的无监督的最先进的结果。此外,它能够有效地使用图注意力(GAT)编码器,使我们能够进一步提高该技术的技术水平。特别是在PPI数据集上,使用GAT作为编码器,我们使用线性评估协议实现了最先进的70.49%的Micro-F1。在所有考虑的其他数据集上,我们的模型与等价监督GNN结果相比,经常超过它们。

1 引言

BGRL通过使用两个不同的图编码器,一个在线编码器和一个目标编码器,来编码图的两个增强版本,以学习节点表示。在线编码器通过目标编码器的表示的预测来进行训练,而目标编码器被更新为在线网络的指数移动平均值。

主要贡献:

  • 时间和空间复杂度最多是线性的边的数量。
  • 图的对比方法需要大量的负值才能很好地工作。为了减少时间和存储的复杂性,减少负例数量也会降低一些性能。这意味着对比方法可能需要二次方节点数的时间和空间来达到峰值性能。BGRL通过完全消除负例的需要来避免这些问题。
  • 更长的训练时间和归一化层显著提高了自监督学习性能,并提供了许多图数据集的整体性能提高。特别是,我们是第一个在ogbn-arXiv数据集中报告自监督GNN表示结果的人。

2 Bootstrapped Graph Latents (BGRL)

为了在不使用对比目标的情况下实现自监督图表示学习,我们将BYOL适应于图域,并提出了Bootstrapped Graph Latents(BGRL)。就像在BYOL中一样,BGRL通过引导它自己的编码器的延迟版本的输出来学习表示,而不需要定义任何负例。与BYOL处理独立数据点的数据集不同,我们遵循过去的图表示学习方法,并利用图中固有的拓扑结构

2.1 BGRL组件

形式上,BGRL维持两个图编码器,一个在线编码器 E θ \mathcal{E}_θ Eθ和一个目标编码器 E ϕ \mathcal{E}_\phi Eϕ,其中 θ θ θ ϕ \phi ϕ表示两组不同的参数。

我们考虑了一个图 G = ( X , A ) \pmb{G}=(\pmb{X},\pmb{A}) GGG=(XXX,AAA),其节点特征为 X ∈ R N × F \pmb{X}∈\mathbb{R}^{N×F} XXXRN×F,邻接矩阵为 A ∈ R N × N A∈\mathbb{R}^{N×N} ARN×N。这里 N N N表示图中的节点数, F F F表示特征数。

BGRL首先通过分别应用随机图增强函数 A 1 \mathcal{A}_1 A1 A 2 \mathcal{A}_2 A2,生成 G \pmb{G} GGG的两个备选视图: G 1 = ( X ~ 1 , A ~ 1 ) \pmb{G}_1=(\tilde{\pmb{X}}_1,\tilde{\pmb{A}}_1) GGG1=(XXX~1,AAA~1) G 2 = ( X ~ 2 , A ~ 2 ) \pmb{G}_2=(\tilde{\pmb{X}}_2,\tilde{\pmb{A}}_2) GGG2=(XXX~2,AAA~2)在线编码器从第一个增广图生成一个在线表示, H ~ 1 : = E θ ( X ~ 1 , A ~ 1 ) \tilde{\pmb{H}}_1:=\mathcal{E}_θ(\tilde{\pmb{X}}_1,\tilde{\pmb{A}}_1) HHH~1:=Eθ(XXX~1,AAA~1);同样,目标编码器生成第二个增广图的目标表示, H ~ 2 : = E ϕ ( X ~ 2 , A ~ 2 ) \tilde{\pmb{H}}_2:=\mathcal{E}_\phi(\tilde{\pmb{X}}_2,\tilde{\pmb{A}}_2) HHH~2:=Eϕ(XXX~2,AAA~2)

在线表示被输入一个预测器 p θ p_θ pθ,该 p θ p_θ pθ输出目标表示的预测 Z ~ 1 : = p θ ( H ~ 1 , A ~ 1 ) \tilde{\pmb{Z}}_1:=p_θ(\tilde{\pmb{H}}_1,\tilde{\pmb{A}}_1) ZZZ~1:=pθ(HHH~1,AAA~1)。除非另有说明,预测器在节点级别工作,而不考虑图信息(即尽在 H ~ 1 \tilde{\pmb{H}}_1 HHH~1上操作,而不是 A ~ 1 \tilde{\pmb{A}}_1 AAA~1)。

BGRL与BYOL(和其他方法)的不同之处在于,在预测之前,它不使用投影网络将表示投影到更小的空间。BYOL依赖这一点来简化预测器 p θ p_θ pθ的任务,因为直接预测非常高维的嵌入具有挑战性。然而,我们根据经验发现,在常用的图数据集的规模上,这是不需要的,在大多数情况下,由于提供了更间接的学习信号,实际上使学习减慢。

2.2 BGRL更新步骤

2.2.1 更新 θ θ θ

在线参数 θ θ θ(而非 ϕ \phi ϕ)通过遵循余弦相似性的梯度进行更新,以使预测的目标表示 Z ~ 1 \tilde{\pmb{Z}}_1 ZZZ~1更接近每个节点的真实目标表示 H ~ 2 \tilde{\pmb{H}}_2 HHH~2
在这里插入图片描述
关于 θ θ θ,即
在这里插入图片描述
其中, η η η是学习速率,最终的更新是根据目标对 θ θ θ的梯度计算出来的,使用SGD或Adam等优化方法。在实践中,我们也通过使用第二个视图的在线表示来预测第一个视图的目标表示来对称化训练

2.2.2 更新 ϕ \phi ϕ

目标参数 ϕ \phi ϕ被更新为在线参数 θ θ θ的指数移动平均数,即:
在这里插入图片描述
其中 τ τ τ是控制 ϕ \phi ϕ θ θ θ保持的距离的衰减速率。

图1直观地总结了BGRL的架构。
在这里插入图片描述

2.3 完全非对比的目标

对比方法鼓励不同节点对 ( i , j ) (i,j) (i,j) Z ~ ( 1 , i ) \tilde{\pmb{Z}}_{(1,i)} ZZZ~(1,i) H ~ ( 2 , j ) \tilde{\pmb{H}}_{(2,j)} HHH~(2,j)相距很远。然而,选择这种不同的节点对需要领域知识,而且可能不容易定义。在缺乏选择负例的原则方法时,简单地对比所有对 { ( i , j ) ∣ i ≠ j } \{(i,j)|i≠j\} {(i,j)i=j}(如GRACE和GCA所做的),很快会在实际大小的图上遇到内存问题,并且随机采样负例会恶化性能。

由于BGRL完全是非对比性的,它不需要任何负例。表示可以通过预测图中每个节点的表示来直接学习,使用另一个视图中同一节点的表示。BGRL的计算和内存复杂度与边的数量呈线性,而不是像对比方法那样与节点的数量成二次方。此外,与硬挖掘的对比方法相反,BGRL不需要选择哪个节点作为每个节点的负例。

2.4 图增强函数

我们使用术语“增强”,而不是“腐败”,因为我们的目的是产生两个语义上相似的视图。这不同于,例如DGI,它构建了语义上不同的视图,并用来与原始的视图进行对比。

我们考虑了两个简单的图增强函数——节点特征掩蔽边缘掩蔽。这些增强是图方面的:它们不在每个节点上独立操作,并通过边缘掩蔽利用图的拓扑信息。这与BYOL中使用的转换形成了对比,后者对每个图像独立操作。

首先,我们生成一个大小为 F F F的随机二进制掩码,其中每个元素遵循一个伯努利分布 B ( 1 − p f ) \mathcal{B}(1-p_f) B(1pf),并使用它来掩蔽图中所有节点的特征(也就是说,所有节点都是相同的特征维度被掩蔽)。

除了这种节点级属性转换之外,我们还计算了一个大小为 E E E的二进制掩码( E E E是原始图中的边数),其中每个元素遵循一个伯努利分布 B ( 1 − p e ) \mathcal{B}(1-p_e) B(1pe),并使用它来掩蔽增广图中的边

计算最终的增广图时,每个图的两个增强函数具有不同的超参数,即 p f 1 p_{f_1} pf1 p e 1 p_{e_1} pe1为第一个视图, p f 2 p_{f_2} pf2 p e 2 p_{e_2} pe2为第二个视图。

之前的一些工作也研究了自适应增强,使用节点中心性或PageRank中心性等方法来以不同概率掩盖不同边缘。这通过帮助这些转换保持语义相似性,从而提高了增强图的质量。我们只考虑简单的、标准的增强,以便隔离和研究BGRL作为表示学习方法的效果,因为已知更强的增强可以对所学表示的质量产生很大的影响。然而,实验部分显示,我们的方法与使用自适应增强的基线具有竞争力。

3 实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【论文阅读】BGRL:Bootstrapped Representation Learning on Graphs 的相关文章

随机推荐

  • Vivado下PLL实验

    文章目录 前言 一 CMT 时钟管理单元 1 CMT 简介 2 FPGA CMT 框图 3 MMCM 框图 4 PLL 框图 二 创建工程 1 创建工程 2 PLL IP 核配置 3 进行例化 三 进行仿真 1 创建仿真文件 2 进行仿真设
  • 二、C++笔记之面向对象特性---继承

    继承 继承是面向对象三大特性之一 有些类与类之间存在特殊的关系 例如下图中 我们发现 定义这些类时 下级别的成员除了拥有上一级的共性 还有自己的特性 这个时候我们就可以考虑利用继承的技术 减少重复代码 继承的基本语法 例如我们看到很多网站中
  • 学习[30天自制操作系统]day02遇到的makefile的问题(未解决)

    学习 30天自制操作系统 遇到的问题 场景还原 尝试过的解决办法 问题描述 光盘代码day 02 helloos 4 helloos 5 在使用makefile 运行qemu 模拟器过程出错 场景还原 makefile ipl bin ip
  • 如何更改node.js的控制台字体颜色?

    本文翻译自 How to change node js s console font color I had to change the console background color to white because of eye pr
  • ASP.NET 的特点

    asp net 相比传统的动态页面技术 使程序设计相对简化 结构更为清晰 但大大加重 了页面设计的难度 其界面处理与传统的 asp php cgi 相比 极为死板 几乎全部需要由程 序员来处理其界面 很难使用第三方工具进行可视化设计 asp
  • Springboot 获取接口多个实现类bean 并调用的方式

    前文中提到通过策略模式代替switch case的方式 在实际使用中将接口通过bean获得 然后去调用即可 实际操作中发现 springboot在通过 Autowired 或者 Resource 方式注入时会出现部分问题 针对以上替代swi
  • [hive] 经典sql题及答案(一)

    推荐 经典sql题及答案 二 经典sql题及答案 三 题目部分 第1题 我们有如下的用户访问数据 userId visitDate visitCount u01 2017 1 21 5 u02 2017 1 23 6 u03 2017 1
  • vscode的前端插件,加快编程速度

    vscode的前端插件 加快编程速度 1 auto close tag 自动闭合html标签 外链图片转存失败 源站可能有防盗链机制 建议将图片保存下来直接上传 img aAm0WeuK 1598933801894 C Users Admi
  • 在dos下使用debug被提示incorrect ms dos version的解决办法

    原创 在dos下使用debug被提示incorrect ms dos version的解决办法 首先可以确定一点 直接使用debug时它是直接在当前目录下寻找的 一旦当前目录下没有debug或debug版本不合适 则会出错 直接在 开始 中
  • Unity normalized的坑

    注意 向量太小会返回0 所以要考虑等于000的情况 我们的项目恰恰会用到 normalized返回的值传给 Quaternion LookRotation 结果造成000错误 切记要考虑到 normalized 为0 的情况
  • 嵌入式(TCP、IP协议原理)

    TCP IP协议网络封包格式 以太网头 IP头 TCP头 TCP是一种面向连接的 可靠的数据传输 一 TCP的可靠传输 通过确认和重发机制 1 TCP把所有要发送的数据进行编号 每一个字节用一个号 2 发送时从当前数据位置 发送window
  • 【图片标注】推荐一款特别好用的图片分割标注工具EIseg

    前言 最近在百度飞浆的公众号看到一个特别有趣的图片标注工具EIseg 它labelme等标记工具不同的是 它是一个通过深度学习来标注的工具 使用鼠标点一下就能完成标注任务 下面是工具的演示 本文章仅供学习 操作演示 标注效果 绿色的点为正样
  • java jps监控_java性能监控工具jps-windows

    jps Lists the instrumented Java Virtual Machines JVMs on the target system This command is experimental and unsupported
  • mybatis jdbcType: DATE ,TIMESTAMP 区别:

    1 mybatis中 jdbcType 时间类型 当jdbcType DATE 时 只传入了 年月日 jdbcType TIMESTAMP 年月日 时分秒 2 jdbcType 是否必须 使用时 没有加jdbcType 正常 加上jdbcT
  • 【零知ESP8266教程】AP模式下WIFI UDP协议通信示例

    本帖主要讲解ESP8266 WIFI功能关于UDP协议网络传输的应用 这里演示了ESP8266在AP模式下UDP通信的示例 1 硬件 零知ESP8266开发板 2 软件 1 代码如下 文件 udp server ino by 零知实验室 u
  • 为什么 DeFi 需要探索以太坊外的世界?

    由于DeFi生态系统的总锁仓价值超过130亿美元 DeFi创造了最近几周的最高纪录 可以说 DeFi是当前加密货币行业发展最快的一个领域 在短短几个月内吸引了大量资本和市场参与者 在这一强劲势头下 以太坊仍是DeFi市场的主宰 占据了96
  • 联想网络同传系统_皮层网络结构的联想学习“理论”

    本文来自公众号 吴思Lab计算神经科学及类脑计算 AI科技评论 获授权转载 如需转载 请联系吴思Lab 编者按 张单可博士是我们课题组已毕业的博士生 最近刚从美国东北大学做完博士后回来 在中国科学院深圳先进技术研究院工作 这是他在博士后期间
  • 平台使用篇

    本课程提供的实验平台总体可以分成两个部分 硬件平台和软件平台 本讲简要介绍各个部分的基本组成及实验开发流程 平台使用篇 RflySim飞控底层实验平台配置介绍 01 电脑配置 1 1推荐配置 系统 Windows 10 x64系统 版本大于
  • MySQL如何查询表中重复的数据

    文章目录 一 查询重复记录 二 总结 一 查询重复记录 例 查询员工表里出现重复姓名的记录 思路 1 查看重复记录 首先要使用分组函数 group by 再用聚合函数中的计数函数count name 给姓名列计数 且使用group by 后
  • 【论文阅读】BGRL:Bootstrapped Representation Learning on Graphs

    目录 摘要 1 引言 2 Bootstrapped Graph Latents BGRL 2 1 BGRL组件 2 2 BGRL更新步骤 2 2 1 更新 2 2 2 更新