分享自:

基于不变图表示的分布偏移下的泛化学习

期刊:36th conference on neural information processing systems (NeurIPS 2022).

这篇文档属于类型a,以下为针对该研究的学术报告:


作者及机构
该研究由清华大学Haoyang Li、Ziwei Zhang、Xin Wang(通讯作者)和Wenwu Zhu(通讯作者)合作完成,发表于第36届神经信息处理系统大会(NeurIPS 2022)。


学术背景

科学领域与动机
研究聚焦于图表示学习(graph representation learning)领域,旨在解决传统图神经网络(GNNs)在分布偏移(distribution shifts)条件下泛化能力不足的核心问题。现实场景中(如社交网络、生物分子图),图数据常因生成机制不可控存在分布差异,而现有方法基于独立同分布(i.i.d.)假设,无法在分布外(OOD)测试数据上保持性能。受因果推理中的不变性原理(invariance principle)启发,研究提出首个面向图数据的无监督不变性学习方法(Graph Invariant Learning, GIL),无需显式环境标签即可捕捉跨分布的稳定子图模式。

研究目标
1. 设计无需环境标注的图不变性学习框架;
2. 通过联合优化三个模块(不变子图识别、环境推断、不变学习)实现OOD泛化;
3. 提供理论证明与多场景实验验证。


研究流程与方法

1. 不变子图识别模块

  • 输入对象:图数据 $G={(G_i, yi)}{i=1}^n$,含节点数 $n$ 及邻接矩阵 $A$。
  • 关键技术
    • 设计基于GNN的共享子图生成器($\text{GNN}_m$),通过软掩码矩阵 $M=Z^{(m)}Z^{(m)\top}$($Z^{(m)}$ 为节点表征)动态识别重要边;
    • 使用阈值 $t$ 分割不变子图 $G^i=\text{top}_t(M \odot A)$ 与变体子图 $G^v=A-G^i$,避免离散优化难题。
  • 创新点:共享GNN参数实现归纳式学习,支持未知测试图的子图生成。

2. 环境推断模块

  • 输入对象:变体子图 ${G^v}$(假设其包含环境判别特征)。
  • 方法
    1. 通过另一GNN编码器($\text{GNN}_v$)提取变体子图表征 $h^v=\text{readout}(Z^v)$;
    2. 对 $h^v$ 聚类(如K-means)推断隐式环境标签 $E_{\text{infer}}$,无监督划分训练环境。
  • 理论依据:变体子图反映分布差异,其表征聚类结果与环境分布强相关。

3. 不变学习模块

  • 优化目标:最大化不变子图与标签的互信息,通过以下联合损失函数:
    $$\mathbb{E}{e\in E{\text{infer}}} \mathcal{R}^e(f(G),y) + \lambda \text{trace}(\text{Var}{E{\text{infer}}}(\nabla_\theta \mathcal{R}^e))$$
    其中第一项为分类损失,第二项为不变性正则项(invariance regularizer),强制不同环境下梯度方差最小化。
  • 组件实现
    • 不变子图表征由 $\text{GNN}_i$ 提取,分类器为多层感知机(MLP);
    • 理论证明该优化等价于寻找最大不变子图生成器(Theorem 3.2)。

主要实验结果

1. 合成数据集(sp-motif)

  • 设置:控制训练/测试集的虚假相关性强度($r{\text{train}} \in [0.3,0.9]$, $r{\text{test}}=0.20.33$)。
  • 结果
    • GIL在 $r{\text{test}}=0.2$ 时平均准确率超最优基线(DIR)3%~10%,尤其在 $r{\text{train}}=0.8$ 时仍保持46.36%精度(基线普遍<40%);
    • 可视化显示GIL精确识别真实不变子图(如Cycle结构),而基线(如GSAT)易受变体子图干扰。

2. 真实数据集

  • 任务与数据:图分类任务,涵盖MNIST-75sp(节点特征偏移)、Graph-SST2(节点度分布偏移)、OGB分子数据集(骨架差异)。
  • 性能优势
    • MNIST-75sp:准确率21.94%(基线最高20.12%);
    • OGB-molhiv:ROC-AUC 79.08%(DIR为77.05%);
    • 在Graph-SST2中,GIL捕捉情感关键词(如“best actors”)作为不变特征,忽略环境相关噪声。

3. 环境推断分析

  • 通过轮廓系数(silhouette score)验证聚类质量与模型训练同步提升;
  • t-SNE可视化显示变体子图表征能清晰分离潜在环境(如Tree/Ladder/Wheel)。

结论与价值

  1. 理论贡献:首篇将不变性学习引入图OOD泛化的工作,提出最大不变子图生成器准则,并证明其最优性(Theorem 4.1)。
  2. 应用价值:适用于高风险领域(如医疗诊断、分子预测),提升模型在分布变化下的可靠性。
  3. 方法普适性:兼容多种GNN骨干(如GIN、CIN),计算复杂度与标准GNN相当($O(|E|d + |V|d^2)$)。

研究亮点

  1. 无监督环境推断:首次实现无需标注环境的图不变性学习;
  2. 模块化设计:三阶段联合优化,相互促进(如环境推断提升子图识别精度);
  3. 全面验证:覆盖合成与真实数据,验证多种分布偏移场景。

其他重要内容

  • 理论证明:包括不变子图生成器的最优性(附录Theorem 3.2)和排列不变性(Permutation Invariance);
  • 代码开源:提供完整实现细节,支持复现实验。

此研究为图学习领域提供了首个端到端的OOD泛化框架,显著推动了对复杂分布偏移场景的建模能力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com