分享自:

用于功能脑网络分类的超图注意力网络FC-HAT

期刊:information sciencesDOI:10.1016/j.ins.2022.07.041

针对功能脑网络分类的超图注意力网络(FC-HAT)的研究报告

本研究论文《FC–HAT: Hypergraph attention network for functional brain network classification》发表于2022年的《Information Sciences》期刊第608卷,于当年7月9日正式在线发布。论文的主要作者是来自北京工业大学多媒体与智能软件技术北京市重点实验室(Faculty of Information Technology)以及北京人工智能研究院的季俊中、任亚婷和雷明龙。

一、学术背景

本研究的核心科学领域是计算神经科学与医学信息学,具体聚焦于利用深度学习方法分析静息态功能磁共振成像(rs-fMRI)数据构建的功能性脑网络(Functional Brain Networks, FBNs),以实现对脑疾病(如自闭症谱系障碍和注意力缺陷多动障碍)的自动分类。功能脑网络将大脑不同区域视为节点,区域之间的功能连接强度(如皮尔逊相关系数)视为边,其拓扑结构蕴含着理解脑功能和识别疾病生物标志物的重要信息。

近年来,图神经网络(Graph Neural Networks, GNNs)因其能直接在非欧几里得结构的图上操作,在脑网络分析中取得了先进成果。然而,现有基于GNN的方法存在两大局限:首先,它们主要基于成对连接(边)构建的简单图来定义操作,但大脑区域间存在复杂的高阶(High-order)邻近关系,例如多个区域协同完成特定功能,这种多节点间的亲和关系无法被二元边充分刻画。其次,从rs-fMRI数据构建的功能连接矩阵包含噪声连接,而GNN中信息传递(message-passing)的有效性严重依赖于图结构的质量,现有方法缺乏有效策略来在利用图结构时消除噪声影响。

为此,本研究旨在解决上述问题,提出一种名为FC-HAT的新型模型。其核心目标是通过超图(Hypergraph)对功能脑网络中的高阶结构信息进行建模,并在此基础上设计新颖的卷积操作以提取更具判别力的特征,最终提升脑疾病分类的准确性与可解释性。

二、研究流程与方法细节

FC-HAT模型是一个端到端的深度学习框架,主要包含两个核心、且联合优化的阶段:动态超图生成(Dynamic Hypergraph Generation, DHG)阶段和超图注意力聚合(Hypergraph Attention Aggregation, HAA)阶段。研究流程遵循以下详细步骤:

  1. 数据准备与预处理

    • 研究对象:本研究在两个公开的静息态fMRI数据集上进行了验证:ABIDE-I(包含来自17个站点的1096名受试者,其中典型对照组569名,自闭症谱系障碍患者527名)和ADHD-200(包含来自8个站点的520名受试者,其中典型对照组329名,ADHD患者191名)。
    • 数据处理:采用预处理连接组项目(Preprocessed Connectomes Project, PCP)流程和DPARSF软件对原始rs-fMRI数据进行预处理。使用自动解剖标记(Automated Anatomical Labeling, AAL)模板将大脑皮层划分为90个感兴趣区域(ROIs)。提取每个区域的均值时间序列后,计算每对区域间的皮尔逊相关系数(PCC),为每个受试者生成一个90x90的加权功能连接矩阵,即一个功能脑网络图。数据按60%(训练)、20%(验证)、20%(测试)的比例随机划分。
  2. 动态超图生成(DHG)阶段

    • 目的:为每个功能脑网络动态构建一个能够捕获复杂结构信息并抵抗噪声的高质量超图,而不是使用固定的简单图。
    • 输入:原始功能脑网络的节点特征矩阵(X)和邻接矩阵(A)。
    • 流程: a. 初始嵌入:首先,使用一个基础的图卷积层(作为嵌入函数)处理原始图和节点属性,生成初始的节点嵌入矩阵(Z)。这一步旨在从原始数据中提取高级别、抗噪声的特征表示。 b. 基于嵌入构建超边:为了捕获不同层面的相似性,模型结合两种策略生成超边(一个超边可以连接任意数量的节点): * 成对相似性(Pair-wise):对每个节点,使用K最近邻(KNN)算法,基于节点嵌入的欧氏距离,找到其k1个最近邻节点。由此为每个节点生成一个超边,包含该节点及其k1个邻居。这捕获了直接的局部邻近关系。 * 社区相似性(Community-wise):对所有节点的嵌入应用K-means聚类算法,生成c个簇(候选社区)。然后,计算每个节点与这c个簇中心之间的距离,选择距离最近的k2个簇。为每个节点针对其所属的每个最近簇生成一个超边,包含该簇内的所有节点。这旨在捕获图内的子图和群体结构信息。 c. 动态更新:关键创新在于,上述超图构建过程并非一次性完成,而是集成在模型训练之中。在每个训练迭代(或每个网络层),模型都会基于当前更新后的节点嵌入重新计算KNN和K-means,从而动态地调整超图结构。这使得超图能够根据不同的分类任务进行优化,而不仅仅是预先定义的静态结构。
    • 理论分析:论文对构建的超图的拉普拉斯矩阵进行了谱分析(Theorem 1),证明与简单图相比,所构建超图的归一化拉普拉斯矩阵具有更优的谱特性(收缩了特征值范围),这意味着其作为低通滤波器与GNN结合时,在特征传播方面更具潜力。
  3. 超图注意力聚合(HAA)阶段

    • 目的:在动态生成的超图结构上,设计有效的图神经网络来聚合信息并生成大脑区域的最终表示。
    • 挑战:传统GNN的卷积操作(聚合邻居节点信息)无法直接应用于连接多个节点的超边。
    • 创新方法:FC-HAT将超图上的信息聚合分解为两个连续的、应用注意力机制的步骤: a. 节点注意力层(Node Attention Layer):该层的目标是生成每个超边的表示。对于一个给定的超边,它包含k个节点。首先,利用一个多层感知机(MLP)从这k个节点的嵌入中学习一个变换矩阵(T),该矩阵能自适应地进行特征置换和加权,促进节点间和通道间的信息流动。然后,使用一维卷积(1D-Conv)对变换后的特征进行压缩,最终得到该超边的嵌入表示。这个过程本质上是将超边内部多个节点的信息进行注意力加权后聚合。 b. 超边注意力层(Hyperedge Attention Layer):该层的目标是利用超边表示来更新每个节点的嵌入。对于一个目标节点,它可能同时属于多个超边。模型使用另一个MLP为每个关联的超边生成一个注意力权重分数,该权重反映了该超边对更新目标节点的重要性。最终,节点的更新嵌入是其所有关联超边嵌入的加权和。
    • 端到端优化:DHG和HAA两个阶段被联合训练。HAA阶段输出的更新后节点嵌入,会作为下一轮DHG阶段的输入,用于重新计算和更新超图。这种闭环设计使得超图结构和节点嵌入能够协同进化,共同优化分类目标。
  4. 分类与实验设计

    • 读出与分类:经过多轮DHG-HAA迭代后,对最后一层所有节点的嵌入进行求和(Readout)操作,得到整个功能脑网络的图级表示向量。将该向量输入一个全连接层(MLP)和Softmax层,进行疾病分类。
    • 对比实验:为了评估FC-HAT的有效性,论文将其与六类基线方法在ABIDE-I和ADHD-200数据集上进行了全面比较,包括:传统机器学习方法(SVM, LASSO)、全连接神经网络(DAE)、专门为脑网络设计的CNN(BrainNetCNN, CkEW)以及经典的图卷积网络(S-GCN)。
    • 消融实验:设计了两个消融模型以验证各模块贡献:only-HAA(仅使用原始功能连接图进行注意力聚合,无动态超图生成)和only-DHG(使用动态生成的超图,但用平均池化代替注意力聚合层)。
    • 参数分析:探究了超边度(k,即每个超边包含的节点数)和注意力聚合层数(l)等关键超参数对模型性能的影响。
    • 功能连接分析:使用特征重要性度量(IMF)来识别对分类贡献最大的功能连接模式和大脑区域,从而解释模型的决策依据并寻找潜在的疾病生物标志物。

三、主要研究结果

  1. 分类性能

    • 在ABIDE-I数据集上,FC-HAT在所有评价指标(准确率ACC、敏感性SEN、特异性SPE等)上均优于所有基线方法,取得了最佳性能(例如,准确率达到0.709)。
    • 在样本量较小、标签分布不均的ADHD-200数据集上,FC-HAT在准确率、敏感性等核心指标上仍保持领先。
    • 实验还表明,即使在不使用额外的降噪方法(如多尺度主成分分析MSPCA)的情况下,FC-HAT的性能也优于使用了MSPCA的多数基线方法,证明了其内置的动态超图生成模块本身具备一定的抗噪声能力。
  2. 消融与参数分析结果

    • 消融实验证实,完整的FC-HAT模型(同时包含DHG和HAA)性能始终优于两个消融模型。这证明了动态生成高阶超图结构和引入注意力机制进行信息聚合,对于提升模型性能都是必要且有效的。
    • 参数分析显示,超边度k存在一个最优值(实验中为4),过大或过小都会导致性能下降,说明需要适度挖掘节点间关系。此外,增加注意力聚合层数(l>1)会导致性能退化,这与深层GNN中常见的“过度平滑”问题一致。
  3. 功能连接与生物标志物发现结果

    • 通过对模型学到的特征进行反向分析,FC-HAT能够识别出在自闭症患者与典型对照组之间表现出异常(增强或减弱)的功能连接模式。
    • 可视化结果显示,一些连接在自闭症患者中显著减弱,例如默认模式网络(DMN)内部及与凸显网络(SN)、中央执行网络(ECN)之间的部分连接,这些发现与已有文献中关于自闭症患者存在重复刻板行为、外部目标导向行为及自我意识缺陷的神经机制研究结论相符。
    • 模型还识别出了一些在自闭症患者中增强的连接,作者认为这可能是一种代偿机制,而非功能更强的表现。
    • 研究进一步定位了前10个最重要的脑区,包括额下回、额上回、后扣带回、角回、楔前叶、丘脑、颞中回等,这些区域主要分布在DMN、SN和颞叶,与自闭症的社交、语言等功能障碍的神经基础密切相关。

四、研究结论与价值

本研究成功提出并验证了首个基于超图GNN的功能性脑网络分类模型FC-HAT。其主要结论与价值体现在:

  1. 方法论创新:该研究首次将超图学习与图神经网络结合应用于功能脑网络分析,为解决大脑区域间的高阶交互建模问题提供了新思路。动态超图生成和超图注意力聚合两大阶段的设计,不仅使模型能捕获超越成对连接的复杂结构,还赋予了模型抗噪声和自适应优化结构的能力。
  2. 科学价值:FC-HAT模型在ABIDE-I和ADHD-200两个标准数据集上取得了先进的分类性能,证明了利用高阶信息对于提升脑疾病诊断模型准确性的有效性。这为计算神经科学领域提供了一种更强大的脑网络分析工具。
  3. 应用与临床价值:模型不仅是一个分类器,其具备的可解释性使其能够识别出与疾病相关的异常连接模式和关键脑区。这些发现有望成为理解自闭症、ADHD等脑疾病病理生理机制的新线索,并为未来发现可靠的影像学生物标志物提供了数据驱动的途径。
  4. 理论贡献:对构建的超图进行的谱分析,从理论上论证了该方法在特征提取方面的优越性,为后续研究提供了理论基础。

五、研究亮点

  1. 核心创新:首创性地将动态超图生成与注意力机制相结合,构建了适用于功能脑网络的超图神经网络框架,有效建模了高阶功能连接。
  2. 动态与自适应:超图结构并非固定不变,而是随训练过程动态更新,使模型能学习针对特定任务最优的图表示,增强了模型的泛化能力和鲁棒性。
  3. 可解释性强:模型不仅能进行分类,还能通过特征重要性分析揭示对分类决策贡献最大的脑网络连接和区域,建立了从数据到临床解释的桥梁。
  4. 端到端联合优化:将图结构学习(超图生成)与特征学习(节点嵌入更新)置于一个统一的框架中联合优化,实现了两者相互促进。

六、其他有价值内容

论文在讨论部分展望了未来的研究方向,例如:将FC-HAT与图池化操作结合以提取脑网络的层次化信息;开发完全端到端的、参数化的超图生成策略,避免依赖KNN和K-means等手工设计过程;以及尝试直接基于体素数据而非图谱划分的区域来生成超图,以探索更细粒度的脑功能组织。这些设想为进一步提升模型的性能和适用性指明了可能路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com