KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架

2023-05-16

d445a5bc13c604c05f3defa8ec6263b7.gif

©作者 | 社媒派SMP

来源 | 社媒派SMP

本文是SIGKDD 2022入选论文“GPPT: Graph Pre-training and Prompt Tuning to Generalize Graph Neural Networks”的解读。该论文由吉林大学计算机科学与技术学院王英教授课题组完成。

本文首次提出“Pre-training、Prompt、Fine-tuning”的概念将下游任务进行重构,使其具有与 Pretext 相似的任务目标,弥补 GNN 之间的任务差距,解决由传统 GNN 预训练中 Pretext 任务与下游任务之间内在训练目标差距导致的难以引出预训练的图知识、负迁移的问题。实验表明,该训练策略优于其它所有训练策略,包括监督学习、联合训练和传统的迁移学习。

ccea3c3a9b1473ddba92d6316910c2ef.png

论文标题:

GPPT: Graph Pre-training and Prompt Tuning to Generalize Graph Neural Networks

c84c2e6710b65a2cf5089edee3d1199c.png

研究背景

图神经网络 (GNNs) 已经成为许多现实世界系统中分析图结构数据的技术,包括社交网络、推荐系统和知识图铺谱。GNN 的一般方法将输入视为一个底层的计算图,通过跨边缘传递消息学习节点表示。生成的节点表示可用于不同的下游任务,如链路预测、节点分类和节点属性拟合等。

最近在迁移学习领域中通过让 GNN 捕获可迁移的图模式以推广到不同的下游任务中。具体来说,大多数遵循“预先训练、微调”学习策略:使用容易获取的信息作为 Pretext 任务(如边缘预测)对 GNN 进行预训练,以预先训练的模型作为初始化对下游任务进行微调。

25c6f47ad2ed2c61b06f57773665465b.png

问题和挑战

论文注意到传统 GNN 预训练中 Pretext 任务与下游任务之间内在训练目标差距,不仅可能无法引出预训练的图知识,甚至会导致负迁移现象。此外,Pretext 任务既需要专业知识,也需要繁琐的手工试验。因此,论文首次提出“Pre-training、Prompt、Fine-tuning”的概念将下游任务进行重构,使其成为与 Pretext 任务相似的目标任务,以弥补预训练目标与微调目标之间的任务差距。

为了克服传统“Pre-training、Fine-tuning”的局限性,借鉴了自然语言处理中的“Prompt”技术。由于提示调优是NLP领域中特有的技术,因此很难设计适合 GNN 的 Prompt 模板。论文克服了两个主要的挑战:1)如何应用语义提示函数重构图数据中各种图机器学习任务;2)如何设计 Prompt 模板以更好地重新制定下游应用程序,提出图预训练和提示调优 (GPPT) 框架。


69f62bc436d34797dd7e89328319c921.png

方法

97effcce7c8377c5b812fa01b91c8f82.png

首先,采用 Masked Edge Prediction 任务对 GNN 进行预训练,将下游节点分类任务重构为链接预测任务。然后,为了缩小预训练目标和下游任务目标之间的的差距,利用成对的令牌模板中 Graph Prompt 函数将独立节点修改为标记对,其中每一个标记对包含代表下游问题的任务令牌(task token)和包含节点信息的结构令牌(structure token)。

任务令牌(表示节点标签)和结构令牌(描述节点)可以直接用于微调预训练模型且无需改变分类层。然后,利用节点链接预测得分重新制定节点分类方法,得分最高的任务标记被确定为节点标签。最后,通过实验验证了论文所提出的 GPPT 在监督学习、联合训练和传统迁移学习中的有效性,以及在小样本设置下这种学习模式的优越性。

041fa1724502c32e2a8a7b3efd2e338f.png

实验

我们在 8 个流行的基准数据集上评估了提出的框架 GPPT,包括引文网络 (Cora、Citeseer、Pubmed)、Reddit、CoraFull、Amazon-CoBuy(Computer 和 Photo)、Ogbn-arxiv。

9c17d6bb75383bd020cc8faa5cf08a30.png

基于提示的学习方法通常在基准测试上获得最好的性能,其中利用图聚类和邻域结构信息是 Prompt 令牌设计的关键。

f59dd283d770495e3b6aa4240e77f4cd.png

总结

我们创新性地提出了 GPPT,首个针对 GNN 进行“预训练、提示、微调”的迁移学习范式。首次设计了适用于图数据的图提示函数,以重新制定与 Pretext 任务相似的下游任务,从而减少二者训练目标差距。与此同时,我们还设计了任务和结构令牌生成方法,用于生成节点分类任务中的节点提示。此外,我们提出了平均提示初始化和正交正则化方法来提高提示调优性能。大量的实验表明,GPPT 在基准图数据集上优于传统的训练范式,同时提高了调优效率和对下游任务的更好的适应性。在未来的工作中,我们将在更具挑战性的知识图中探索图的提示功能,并尝试通过元学习来改进提示调优。

更多阅读

0db7f20ff8cec17aaac591cfe0ce576e.png

5a653e9859b7d59267e32686a33ae299.png

c7361d43030489e7eee9d13b88f994d7.png

06a073d3c582e6cfdba4de780731a7be.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

3eb1aedf9419671a239bd91729dd0ce6.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

a31b02b6f84ce47df37fae5fb56bacd1.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架 的相关文章

  • xindi-2022-08-23数据分析记录

    将RNA seq原始数据存放在raw data文件夹 xff0c 经过去除接头的数据存放在clean data中 1 使用Trim Galore软件对两次数据进行质控 xff0c 去掉20bp以下的reads vim新建RNA seq sc
  • AHU 2022 CTF新生赛web_writeup

    第一次当出题人 xff0c 给新生做的 xff0c 简简单单啦 按不了的F12 启动靶机 xff1a 根据题目名称可知 xff0c 这题与f12按键有关 xff0c 即查看网页源代码 按下f12发现f12按键被禁用 xff1a 尝试另一种方
  • 2022最新JSON解析计费系统扶风视频解析计费系统V1.8详解

    我个人认为扶风的计费会比云海的比较相对操作好上手 xff0c 且 bug 也少 xff0c 而且之前的之前的版本加载速度实在慢 xff0c 真心感人 扶风计费程序介绍 后台可对接多个专用 json 接口解析 xff0c 可以 m3u8 资源
  • vscode go 2022-3-20最新测试的插件安装失败的解决办法

    前期准备工作 可以直接看最下面 xff0c 我有把bin中的exe文件放到网盘 tools文件也放网盘了 伸手党请帮忙点个赞 环境变量的配置 xff0c 直接上图吧 xff0c 今天配置这玩意太心累了 高级系统设置 环境变量的配置 还有一个
  • 2022.04.04树莓派最新镜像问题,树莓派如何设置初始化的账户和密码

    树莓派最新的arm64位系统 xff0c 更新时间是2022年4月4日 xff0c 这个版本的树莓派取消了默认的账户密码 xff0c 也就是原来一直使用的pi和对应的默认密码raspberry被取消了 xff0c 现在如果想要使用的话必须自
  • centos8安装python2.7(2022-6-21亲测有效)

    Centos8自带是的python3 xff0c py脚本是python2的 xff0c 故需要安装python2 7 下载python2 7 18 下载地址 xff1a Python Release Python 2 7 18 Pytho
  • 使用Visual Studio 2022运行C++代码

    使用Visual Studio 2022运行C 43 43 代码 1 打开VS 2022 xff0c 创建新项目 2 安装多个工具和功能 3 选中 使用C 43 43 的桌面开发 和 通用Windows平台开发 xff0c 点击修改 xff
  • 树莓派OS:2022-04-04版的Headless设置方法

    Raspberry Pi OS 2022 04 04版增加了一个特性 xff1a 取消了祖传的默认用户 pi 当你刷完镜像首次使用的时候 xff0c 会先跳出来一个界面让你指定用户名和密码 xff0c 无论是桌面版还是Lite版 显然这是一
  • 2022-6-12:OpenCV入门(十一)feature2d组件——角点检测

    Harris角点检测 如果某一点在任意方向的一个微小变动都会引起灰度很大的变化 xff0c 那么我们就把它称之为角点 角点作为图像上的特征点 xff0c 包含有重要的信息 xff0c 在图像融合和目标跟踪及三维重建中有重要的应用价值 它们在
  • Visual Stdio 2022 C语言源文件调试教程

    下面是一个简单的C语言程序 xff0c 我将以它为例说明如何进行VS2022调试 include lt stdio h gt int main int a b sum a float x y sum b scanf s 34 d d 34
  • 2022年度GitHub最火的力扣算法刷题宝典,手把手教你如何刷力扣~

    前言 昨晚逛了逛GitHub xff0c 无意中看到一位P8大佬的算法刷题笔记 xff0c 感觉发现了宝藏 xff01 有些小伙伴可能已经发现了 xff0c 但咱这里还是忍不住安利一波 xff0c 怕有些小伙伴没有看到 关于算法刷题的困惑和
  • JS中函数与作用域的定义(日志-2022.3.28)

    1 函数中的两种命名方式 xff1a 1 利用函数关键字function自定义函数 xff08 命名函数 xff09 function fu xff08 xff09 fn 2 利用函数表达式 xff08 匿名函数 xff09 var 变量名
  • 2022最后一天盘点

    今天是今年最后的一天工作日 xff0c 对于我来说就是今年的最后一天 xff0c 因为放假了我就不需要思考了 xff08 当然公司后端程序员要保持24小时oncall xff09 1 阳完之后 还是有些 咳嗽 xff0c 公司此起彼伏的咳嗽
  • 推荐一款调试工具:深蓝串口网络调试工具2022春季版(2.17.4),一直使用这个,最近更新好快。

    深蓝串口网络调试工具2022春季版 xff08 2 17 4 xff09 此应用程序支持1M波特率 xff08 最高有效波特率受硬件设置的限制 xff09 串口数据采集 文本模式发送与接收 HEX模式发送与接收 报文模式 xff0c 数据模
  • 飞控学习常见典型问题集Q&A——无名创新(2022年4月15日)

    飞控学习常见典型问题集Q amp A 无名创新 xff08 2022年4月15日 xff09 1 第一次启动FS I6遥控器 xff0c 进入不了界面一直嘟嘟 xff0c 请问这是什么情况呢 xff1f 先把上面的英文翻译一下 xff0c
  • 再见2022,加油2023

    其实变化最大的一点就是 xff0c 这一年自己变成了一个北漂 没有很多的成熟的规划 xff0c 没有很多预算准备来到了北京 那会儿和之前的同事合租 xff0c 也给他添了不少麻烦 最开始到北京的时候 xff0c 因为口罩问题入职前生活状态比
  • Visual Studio 2022 C++ CLR 的艰难除 Bug

    请看下面一段代码 xff1a 运行结果 xff1a 这是一个Button xff0c 要用到这段代码是因为字符串出了问题 xff1a 肯定是我写的类出问题了 xff0c 便是我在控制台下测试是正常的 代码 xff1a 运行结果 xff1a
  • 2021总结. 2022展望

    2021 收获了许多 技能上 学习了多个技能 自由泳自由倒立复刻拳王梅威瑟的跳绳训练单板滑雪 总结 技能上尽量是身体力行的 自从看过 囚徒健身 后 被作者的自传所影响 希望成为想他那样的人 认知上 认知上也有了提升 读了许多书 今年比较喜欢
  • 2022电赛C题——跟随小车 总结

    目录 一 前言 二 电赛回顾 三 比赛原因总结 1 准备不充分 2 队友配合不好 3 总体进程安排有问题 四 小车题经验和教训 五 电赛总结与收获 一 前言 今年参加了省电子设计大赛 xff0c 做的是控制类的小车题目 xff0c 今天下午
  • 本地资源加载不了 file:// net::ERR_UNKNOWN_URL_SCHEME

    本地资源加载不了 file net ERR UNKNOWN URL SCHEME 解决 开发环境使用tsFile 生产环境使用file

随机推荐