基于频谱共振的图重连与特征去噪

分享自：
基于频谱共振的图重连与特征去噪

期刊:iclr
关于图神经网络中联合图重连与特征去噪新方法的学术研究报告
本文档介绍了一项发表于国际机器学习顶级会议ICLR 2025的原创性研究。该研究由来自瑞士巴塞尔大学数学与计算机科学系的Jonas Linkerhägner、Cheng Shi和Ivan Dokmanić共同完成。论文标题为《通过谱共振进行联合图重连与特征去噪》（Joint Graph Rewiring and Feature Denoising via Spectral Resonance）。
一、 研究背景与目标
本研究隶属于图机器学习领域，特别是图神经网络（Graph Neural Networks, GNNs）的预处理与性能优化方向。GNNs在处理图结构数据（如社交网络、引用网络、蛋白质相互作用网络）方面取得了巨大成功，广泛应用于节点分类、链接预测等任务。然而，现实世界中的图数据通常包含噪声：图结构（邻接矩阵）可能存在虚假或缺失的边，而节点特征也可能不准确或不完全与节点标签相关。这种噪声会严重损害下游GNN模型的性能。此外，即使图结构正确反映了真实交互，其几何特性（如瓶颈结构）也可能阻碍GNN中的消息传递过程，导致“过挤压”（oversquashing）或“过平滑”（oversmoothing）问题。
现有的图重连（Graph Rewiring）方法主要分为两类：预处理方法和端到端方法。预处理方法（如基于曲率、谱间隙的方法）在训练前修改图结构以改善信息流动的几何特性，但大多忽略了节点特征信息。端到端方法在训练过程中动态调整图结构，虽然利用了特征，但通常不输出一个改进后的、可解释和可复用的图。另一方面，图结构学习（Graph Structure Learning）方法通常假设对干净图进行对抗性扰动，而非处理原始数据中固有的噪声。
本研究团队观察到，在图数据中，图结构和节点特征都提供了关于节点标签的、带有噪声的信息。他们提出了一个核心问题：能否通过一种简单、联合的特征和图去噪方法来提升下游GNN的性能？为此，他们从上下文随机块模型（Contextual Stochastic Block Model, CSBM）这一经典生成模型中获得启发。在CSBM中，理论和实践均表明，联合利用图结构和特征信息进行社区检测，其效果优于单独使用任何一种信息。然而，基于CSBM的推断算法（如信念传播）依赖于对模型分布的完美已知，难以应用于复杂的真实世界数据。
因此，本研究的目标是设计一种实用的、基于谱对齐思想的算法，能够联合进行图重连和特征去噪，从而提升任何下游GNN在真实世界节点分类任务上的性能。该方法的核心思想是：通过调整图和特征，最大化它们各自主导特征子空间之间的对齐程度，当对齐度高时，称图和特征处于“谱共振”（Spectral Resonance）状态。
二、 研究方法与流程
本研究提出了一种名为“联合去噪与重连”（Joint Denoising and Rewiring, JDR）的新算法。其核心工作流程是一个迭代优化过程，旨在近似求解一个非凸的谱对齐最大化问题。具体步骤如下：
问题形式化与对齐度量定义： 研究首先定义了图-特征对齐（Graph-Feature Alignment）的度量。给定图邻接矩阵 (A) 和节点特征矩阵 (X)，设其谱分解分别为 (A = V \Lambda V^T) 和 (X = U \Sigma W^T)。令 (V_l) 和 (U_l) 分别代表 (A) 和 (X) 的前 (l) 个特征向量/左奇异向量构成的矩阵。对齐度定义为这两个子空间之间夹角的余弦值：(\text{alignment}_l(A, X) = |V_l^T Ul|{sp})，其中 (|\cdot|_{sp}) 表示谱范数。对于具有 (k) 个类别的数据，通常取 (l = k)，因为标签信息主要蕴含在这些主导谱成分中。
JDR算法流程： 直接最大化上述对齐度量是计算困难的。JDR采用了一种启发式的交替优化算法，包含三个核心步骤，迭代执行 (k) 次：
步骤1：分解：计算当前图 (A) 和特征 (X) 的谱分解（特征值分解和奇异值分解），得到特征向量矩阵 (V)、(U) 及对应的特征值/奇异值。
步骤2：插值（对齐）：对于前 (l) 个主导成分，进行相互引导的插值更新。 更新图的第 (i) 个特征向量：(\tilde{v}_i = (1 - \eta_a) v_i + \eta_a \cdot \text{sign}(\langle v_i, u_j \rangle) u_j)。
更新特征的第 (i) 个左奇异向量：(\tilde{u}_i = (1 - \eta_x) u_i + \eta_x \cdot \text{sign}(\langle u_i, v_j \rangle) v_j)。 其中，(j) 被选为与当前向量最相似（内积绝对值最大）的对应矩阵中的向量索引。超参数 (\eta_a) 和 (\eta_x) 控制着从对方谱信息中汲取信息的强度，通过在验证集上优化下游GNN性能来确定。
步骤3：合成：使用更新后的特征向量和奇异向量，结合原始的特征值/奇异值，重新合成新的加权稠密图 (\tilde{A} = \tilde{V} \Lambda \tilde{V}^T) 和新的特征矩阵 (\tilde{X} = \tilde{U} \Sigma W^T)。
迭代与后处理：将新合成的 (\tilde{A}) 和 (\tilde{X}) 作为下一轮迭代的输入。迭代结束后，通常对 (\tilde{A}) 进行稀疏化处理（例如，保留每个节点权重最大的前几条边），以便高效应用于GNN。
理论验证： 为了给JDR提供理论依据，研究团队在一个简化的生成模型（用高斯正交系综噪声替代CSBM中的二进制噪声）下进行了分析。他们提出了一个命题并给出了证明（详见附录）：在一定的信噪比条件下，存在正的插值参数 (\eta_a, \eta_x)，使得经过JDR一步迭代后，图的主特征向量和特征的主左奇异向量与真实标签向量的对齐程度（以平方内衡量）几乎必然（almost surely）得到提升。这为JDR能够通过迭代改善与标签的对齐提供了理论支持。
实验设计与评估： 研究进行了广泛的实验来验证JDR的有效性、鲁棒性和可扩展性。
研究對象： 合成数据：基于CSBM生成的数据，可以精确控制图与特征的信号噪声比（SNR）以及同配性（homophily）/异配性（heterophily）水平（通过参数 (\phi) 调节）。
真实世界数据：包括5个同配性数据集（Cora, Citeseer, PubMed, Computers, Photo）和5个异配性数据集（Chameleon, Squirrel, Actor, Texas, Cornell），以及3个大型异配性图（Questions, Penn94, Twitch-Gamers）。
对比基线：与当前先进的预处理图重连方法进行比较，包括：基于扩散的DIGL（扩散改进图学习）、基于谱间隙的FOSR（一阶谱重连）、基于曲率的BORF（批量Ollivier-Ricci流）。在CSBM上，还与理论上最优的近似消息传递-信念传播（AMP-BP）算法进行了对比。
下游模型与评估指标：使用两种代表性的GNN作为下游模型：经典的图卷积网络（GCN）和更广义的PageRank GNN（GPRGNN）。采用节点分类准确率作为主要评估指标，并报告多次随机数据划分下的平均准确率和95%置信区间。
实验流程： 在CSBM数据上，系统地在不同 (\phi) 值下运行JDR及基线方法，观察对齐度量的变化以及下游分类准确率的变化，验证JDR的去噪和重连能力。
在真实数据集上，按照标准稀疏划分（2.5%/2.5%/95%用于训练/验证/测试）或稠密划分（60%/20%/20%），分别评估同配性和异配性图上的性能。
在大型图上测试JDR的可扩展性。
通过网格搜索和随机搜索在验证集上优化JDR的超参数（(\eta_a, \eta_x, l, k) 等）。
三、 主要研究结果
在CSBM上的验证：
对齐度提升：实验证实，运行JDR后，图与特征之间的对齐度量 (\text{alignment}_l(A, X)) 在所有 (\phi) 值下均得到显著提升（图3）。这表明算法有效实现了其设计目标。
性能提升：在广泛的 (\phi) 设置下（从强异配性到强同配性），JDR都能显著提升下游GCN和GPRGNN的分类准确率（图4）。特别是在“弱图区域”（(|\phi| \leq 0.25)，即图信号很弱时），JDR帮助GNN的性能大幅提升，几乎追平了需要知道数据生成分布的AMP-BP算法，并显著超越了仅使用特征的MLP基线。这表明JDR能有效利用特征信息来补强噪声图，反之亦然。
在真实世界数据集上的性能：
同配性图：如表2所示，JDR在Cora、Citeseer、PubMed、Photo四个数据集上取得了最佳平均准确率。在Computers数据集上，DIGL表现略优，但JDR仍具竞争力。总体而言，JDR相比原始GCN和GPRGNN以及FOSR、BORF等基线带来了稳定且显著的提升。
异配性图：如表3所示，JDR的优势更为明显。在Chameleon、Squirrel、Actor、Cornell数据集上，JDR（尤其是结合GPRGNN时）取得了最佳性能。在Texas数据集上，GPRGNN+JDR也达到了最优。值得注意的是，DIGL因其同配性假设在部分异配性数据集上表现不佳甚至有害，而BORF则因计算复杂度高在Squirrel数据集上内存溢出（OOM）。JDR则能有效处理异配性。
大规模图：如表4所示，在包含数万到数十万节点的大规模图上，JDR依然能够有效运行并带来性能提升，而BORF因复杂度问题无法运行，DIGL和FOSR的提升有限或为负。这证明了JDR具有良好的可扩展性。
与现有方法的比较： JDR在大多数数据集和设置下都优于或与其他最佳方法持平。研究指出，JDR是首个联合利用图结构和节点特征进行预处理重连和去噪的方法。与仅基于图几何性质的重连方法（FOSR, BORF）相比，JDR通过特征引导的重连直接针对数据噪声。与端到端方法相比，JDR能输出一个改进后的、可解释和可复用的图。与图结构学习方法相比，JDR专注于处理真实数据中固有的噪声，而非对抗性扰动。
四、 研究结论与意义
本研究得出结论：谱共振是构建图重连（和特征去噪）算法的一个强大原理。基于此原理提出的JDR算法，通过迭代地对齐图和特征的领先谱空间，能够有效地对两者进行联合去噪与重连。
科学价值：
提出了新的问题视角：将图重连问题从纯粹的“改善计算图几何”视角，部分地转向了“数据去噪”视角。实验结果暗示，对于现实世界图数据，噪声（缺失和虚假连接）可能是限制GNN性能的更重要因素。
建立了理论与实践的桥梁：从CSBM的理论分析出发，设计了具有理论动机（谱对齐最大化）的实用算法，并在简化模型下提供了理论保证。
引入了“谱共振”概念：为理解和优化图与特征的协同作用提供了一个新颖的、可量化的框架。
应用价值：
通用且有效的预处理工具：JDR可以作为一个即插即用的预处理模块，与任何下游GNN模型结合，在广泛的同配性和异配性图数据上稳定提升节点分类性能。
可解释性与可复用性：与端到端方法不同，JDR输出一个经过改进的图，可供进一步分析和不同模型使用。
良好的可扩展性：通过截断谱分解，JDR能够处理大规模图数据。
五、 研究亮点与创新点
核心创新：首次提出了联合进行图重连与特征去噪的预处理框架，并创新性地使用谱对齐（谱共振） 作为联合优化的目标。
算法设计：设计了一种简单而有效的交替插值-合成算法（JDR）来近似求解谱对齐最大化这一非凸问题，并引入了处理符号模糊性和子空间旋转的启发式策略。
理论支撑：在简化的生成模型下，为算法能够提升与真实标签的对齐性提供了理论证明，增强了方法的可信度。
实证全面性：在从合成到真实、从同配到异配、从小型到大规模的一系列数据集上进行了全面评估，证明了方法的有效性、鲁棒性和通用性。
启发性发现：实验结果表明，对于现实图数据，去噪可能是比改善几何特性更关键的环节，这为未来图重连研究提供了新的方向。
六、 局限性与未来工作
作者也指出了JDR的局限性及未来方向： 1. 依赖节点特征：JDR需要节点特征作为输入，无法应用于仅有图结构的数据。这是其与特征无关的重连方法相比的一个限制。 2. 任务局限性：目前JDR主要针对节点分类任务，如何将其扩展到图级别任务（如图分类）是一个开放问题。 3. 与几何重连的结合：作者尝试但未能成功地将JDR与基于几何的（如曲率）重连方法有效结合。探索一种能同时受益于“去噪”和“改善计算流”的混合方法是有趣的未来方向。 4. 超参数调优：JDR包含几个超参数（如 (\eta_a, \eta_x, l, k)），需要通过验证集进行调整，增加了使用成本。
这项研究为图神经网络的前处理提供了一种新颖、强大且理论基础扎实的工具，通过促进图与特征之间的谱共振，显著提升了模型在各种复杂图数据上的学习能力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问