分享自:

基于稀疏池化的多级图神经网络在帕金森病识别中的应用

期刊:ieee transactions on neural systems and rehabilitation engineeringDOI:10.1109/tnsre.2023.3330643

学术研究报告:基于稀疏池化的多层级图神经网络在帕金森病识别中的应用

第一作者及机构
本研究的核心作者包括Xiaobo Zhang(西南交通大学计算机与人工智能学院)、Yuxin Zhou、Zhijie Lu(西部战区总医院神经内科)、Donghai Zhai(通讯作者,西南交通大学)、Haonan Luo、Tianrui Li(IEEE高级会员)以及Yang Li(北京航空航天大学自动化科学与电气工程学院)。研究发表于2023年的《IEEE Transactions on Neural Systems and Rehabilitation Engineering》(第31卷)。


学术背景与研究目标
帕金森病(Parkinson’s Disease, PD)是一种与运动功能障碍相关的神经退行性疾病,65岁以上人群患病率达2%-3%。目前临床诊断主要依赖病史和体格检查,但非运动症状(如认知障碍)的客观评估仍存在挑战。磁共振成像(MRI)数据为PD诊断提供了重要依据,但传统机器学习方法(如支持向量机SVM和卷积神经网络CNN)在处理MRI数据时面临两大问题:
1. 图构建效率低:现有图神经网络(Graph Neural Networks, GNNs)依赖耗时8小时以上的MRI序列预处理(如FreeSurfer工具);
2. 小数据过拟合:医学数据样本量有限,GNN模型易过拟合。

为此,本研究提出SparsityAtopK模型,结合快速图构建方法和基于稀疏性的池化层(SparsityPool),旨在实现高效、精准的PD分类。


研究流程与方法
1. 数据预处理与图构建
- 数据集:采用帕金森病进展标记倡议(PPMI)的MPRAGE序列MRI数据,包含四类样本(前驱期、SWEED组、PD组、对照组),共1032例。
- 关键点检测:通过ORB、KAZE和AKAZE三种算法提取图像特征点(各300个节点),构建邻接矩阵(8近邻连接)。预处理时间缩短至1秒内,显著优于传统方法。
- 数据集划分:80%训练、10%验证、10%测试,10次独立交叉验证以平衡类别不均衡问题。

2. SparsityAtopK模型设计
- 多层级架构:包含传播层(Propagation Layers)和池化层(Pooling Layers),通过平均池化生成全局表征。
- 传播层:基于k-GNNs规则,扩展节点信息传播范围至k阶邻域(公式1)。
- 池化层(SparsityPool):引入结构稀疏性先验知识,优先保留邻域信息丰富的节点(公式8-9)。节点稀疏性得分η(nodeᵢ)通过邻域特征相似性计算,得分越高则信息越独特。
- 注意力机制:在池化层后加入注意力模块(attn),加权特征矩阵以增强关键节点表征。

3. 实验与对比
- 基线模型:对比SortPool、SAGPool、ASAP、GIN0和GlobalAttentionNet。
- 评估指标:平均精度(Precision)、F1分数和准确率(Accuracy)。
- 参数优化:通过随机搜索调整特征维度、池化比例、损失权重等,优化目标为三项指标的平方和根。


主要结果
1. 模型性能
- P-ORB数据集:SparsityAtopK的准确率最高(提升≥1%),但类别不均衡导致F1分数较低。
- P-KAZE/P-AKAZE数据集:KAZE和AKAZE构建的图数据综合表现更优,其中P-KAZE的Precision最高(89.7%),P-AKAZE的F1分数最高(88.3%)。
2. 消融实验
- 池化层必要性:移除池化层(S-GCN)或注意力模块(SparsityTopK)均导致性能下降,验证了多层级设计和稀疏性先验的有效性。
3. 参数敏感性
- 关键参数:批大小(Batch Size)和优化器(Adam/Adagrad)对性能影响最大。例如,P-ORB数据集的最佳批大小范围为100-250,P-AKAZE为0-100。


结论与价值
1. 科学价值
- 提出首个结合稀疏性先验的多层级GNN框架,解决了小数据过拟合问题。
- 开发了高效的MRI图构建方法(1秒/样本),为医学图像分析提供了新范式。
2. 应用价值
- 在PD早期筛查中,模型对前驱期和SWEED组的分类准确率显著提升,有望辅助临床诊断。
- 开源代码和详细参数设置(见表II)增强了研究的可重复性。


研究亮点
1. 创新方法:SparsityPool通过邻域稀疏性评分动态筛选节点,优于传统基于排序或注意力的池化方法。
2. 跨领域应用:模型在通用图分类任务(如MUTAG数据集)中表现稳定,验证了其泛化能力。
3. 技术细节透明化:公开参数敏感性分析(图7-10),为后续研究提供调参参考。

未来方向
作者计划扩展多模态数据(如脑电图和临床指标)融合,并探索更高效的图构建方法以进一步提升精度。


:本研究得到中国国家自然科学基金(61961038、61976247)等多项资助支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com