SimGRACE: A Simple Framework for Graph Contrastive Learning with
这篇论文发表于WWW 2022
论文地址:https://arxiv.org/pdf/2202.03104.pdf
作者认为现在的图对比学习中的增广操作主要有3种方式:
通过试错对每个数据集手动选择增强方式
通过繁琐的搜索来选择增强
通过引入昂贵的特定领域知识作为指导来获得增强
以上3种方法都限制了现有GCL方法的效率和更普遍的适用性。为了避免这些关键问题,作者提出了一个简单的图对比学习框架,简称SimGRACE,它不需要数据扩充。具体来说,作者将原始图作为输入,将原始GNN和具有扰动版本的GNN模型作为两个编码器,以获得两个视图进行对比。SimGRACE的灵感来自于这样一个观察,即图数据可以在编码器扰动期间很好地保持其语义,而不需要手动试错、繁琐的搜索或昂贵的领域知识来进行扩充选择。而且解释了为什么SimGRACE能够成功。此外,作者设计对抗性训练计划,被称为AT-SimGRACE,以增强图对比学习的稳健性并从理论上解释了原因。尽管很简单,但证明了SimGRACE可以
与最先进的方法在可推广性、可转移性和鲁棒性方面相当或者更好,同时享有前所未有的灵活性和效率。
例如,GraphCL首先为GCL设计了四种类型的通用增强(节点丢弃、边缘扰动、属性屏蔽和子图)。然而,这些增强并不适用于所有场景,因为图的结构信息和语义在各个领域之间差异很大。例如,GraphCL发现边缘扰动有利于社交网络,但会损害GCL中的一些生物化学分子。更糟糕的是,即使扰动很弱,这些扩充也可能完全改变图的语义。例如,在苯环中丢弃一个碳原子将改变芳香系统并产生烯烃链,这将大大改变分子的性质。为了解决这些问题,最近提出了若干策略。通常,GraphCL通过繁琐的尝试和错误手动选择每个数据集的数据增强,这大大限制了他们提出的框架的通用性和实用性。为了摆脱GraphCL的繁琐的数据集特定手动调整,JOAO[53]提出在选择扩充对时自动化GraphCL。