基于多频率多区域融合的可解释情感脑机接口模型研究
一、研究团队与发表信息
本研究由Tao Wang(天津大学医学工程与转化医学研究院)、Rui Mao(南洋理工大学计算机与数据科学学院)、Shuang Liu(天津大学)、Erik Cambria(南洋理工大学)及Dong Ming(天津大学)合作完成,发表于2025年《Information Fusion》第118卷,文章标题为《Explainable multi-frequency and multi-region fusion model for affective brain-computer interfaces》。
二、学术背景与研究目标
情感脑机接口(Affective Brain-Computer Interface, ABCI)是脑科学和人工智能交叉领域的前沿方向,旨在通过解码脑电信号(EEG)识别情绪状态,应用于精神疾病诊疗和情绪调控。然而,现有ABCI模型面临两大挑战:
1. 可解释性不足:深度学习模型常被视为“黑箱”,难以提供神经生物学依据;
2. 特征融合局限:传统方法未能有效整合EEG信号的多频率(如Delta、Theta、Alpha、Beta、Gamma频段)和多脑区(全脑、半球、局部区域)特征。
为此,研究团队提出多频率多区域融合网络(MFMR-FN),通过可解释的功能连接(Functional Connectivity, FC)矩阵建模和跨尺度特征融合,提升情绪识别的准确性与模型透明度。
三、研究方法与流程
1. 多频率编码网络
- 数据预处理:将原始EEG信号分解为5个频段,采用快速傅里叶变换(FFT)提取频域特征。
- 功能连接图卷积模块(FC-GCN):基于谱图理论,利用高斯核函数构建电极空间邻接矩阵,通过图卷积自适应生成具有神经生物学意义的FC矩阵。
- 双线性映射与校正模块(BIRE):在黎曼流形(Riemannian manifold)上对FC矩阵进行对称正定(SPD)矩阵学习,保留脑网络拓扑结构。
- 多频率融合算法:基于黎曼几何设计跨频段特征融合策略,通过迭代计算加权黎曼质心(Riemannian centroid)整合不同频段的FC矩阵。
2. 多区域解码网络
- 多区域选择机制:将FC矩阵按脑区划分为全脑、半球(左/右)和局部区域(额叶、顶叶等),提取不同尺度的功能连接特征。
- 多尺度黎曼网络:通过BIRE模块降维后,结合LogEig层(矩阵对数变换)和UpperTri层(上三角向量化)提取高阶特征,最终通过全连接层融合分类。
实验设计:
- 数据集:
- SEED:15名受试者的情绪识别任务(中性、积极、消极),62通道EEG。
- MODMA:53名受试者(24名抑郁症患者 vs. 29名健康对照),128通道EEG。
- 评估指标:准确率、召回率、F1分数、AUC(SEED);灵敏度、特异度(MODMA)。
四、主要研究结果
1. 性能优势:
- 在SEED数据集上,MFMR-FN情绪识别准确率达94.22%(±3.54%),较现有最优模型(如GDDN的92.54%)提升1.68%。
- 在MODMA数据集上,抑郁症检测准确率为93.96%,灵敏度94.95%,均显著高于对比方法(如SSPA-GCN的92.87%)。
可解释性验证:
跨频段融合效果:多频率融合FC的分类性能优于单一频段(如Gamma频段准确率90.56%,融合后提升至94.22%)。
五、研究结论与价值
1. 科学价值:
- 提出首个结合黎曼几何与图卷积的ABCI可解释框架,为脑网络分析提供了新工具。
- 揭示了情绪状态下多频段、多脑区的动态协同机制,深化了对情绪神经编码的理解。
六、研究亮点
1. 方法论创新:
- 首创基于黎曼流形的多频段FC融合算法,解决了传统欧氏空间融合的局限性。
- 多区域选择机制实现了从粗粒度(全脑)到细粒度(局部)的层次化特征解码。
跨数据集泛化性:模型在62通道(SEED)和128通道(MODMA)EEG设备上均表现优异,证实其鲁棒性。
开源与可复现性:实验代码与参数已公开,支持后续研究扩展(如动态功能连接分析)。
七、未来方向
作者指出当前模型未考虑频段/脑区的贡献权重,未来可引入注意力机制;此外,动态因果建模(DCM)或能进一步揭示脑区间的信息流向,增强可解释性。
(全文约2000字)