分享自:

一种新型变压器用于广义跨被试脑电图情绪识别

期刊:IEEE Transactions on Neural Networks and Learning SystemsDOI:10.1109/TNNLS.2025.3552603

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


EMT:一种面向跨被试EEG情绪识别的创新Transformer模型

一、作者与发表信息

本研究由Yi Ding(IEEE会员)、Chengxuan Tong(IEEE学生会员)、Shuailei ZhangMuyun JiangYong LiKevin Junliang LimCuntai Guan(IEEE会士)合作完成,作者单位包括新加坡南洋理工大学(Nanyang Technological University)、东南大学(Southeast University)及Wilmar International。研究成果发表于IEEE Transactions on Neural Networks and Learning Systems(2025年6月,第36卷第6期),代码开源地址:https://github.com/yi-ding-cs/emt。


二、学术背景

科学领域:本研究属于脑机接口(BCI)与情感计算交叉领域,聚焦于基于脑电图(EEG)的跨被试情绪识别
研究动机:现有EEG情绪解码方法多关注空间和短时程模式,但忽视了情绪认知过程中关键的长时程上下文信息。此外,传统方法依赖单一邻接矩阵或固定脑区连接,难以捕捉情绪涉及的复杂多脑区协同机制(如注意、记忆等基础认知过程)。
研究目标:提出新型Transformer模型Emotion Transformer(EMT),通过融合神经科学先验知识,实现跨被试情绪分类与回归任务的高性能泛化。


三、研究方法与流程

EMT模型包含四个核心模块,具体流程如下:

  1. 时域图构建(Temporal Graph Construction, TGC)

    • 输入处理:将EEG信号分割为长时窗(20秒)和短子窗(2-4秒),提取子窗的相对功率谱密度(rPSD)特征,覆盖Delta(1–4 Hz)至Gamma(30–45 Hz)七频段。
    • 图结构生成:每个EEG通道作为节点,rPSD特征作为节点属性,构建时序图序列(Temporal Graphs)。
  2. 残差多视角金字塔图卷积网络(Residual Multi-view Pyramid GCN, RMPG)

    • 动态空间关系建模
      • 使用多组可学习邻接矩阵(learnable adjacency matrices)并行训练不同层数的ChebyNet(一种基于切比雪夫多项式的图卷积网络),以捕捉不同认知过程对应的脑区连接模式。
      • 引入残差线性投影分支,与GCN输出形成特征金字塔,通过均值融合生成单一时序令牌(token)。
  3. 时域上下文Transformer(Temporal Contextual Transformer, TCT)

    • 任务特异性设计
      • 分类任务(TCT-clas):结合多头自注意力(MSA)与短时聚合层(STA),前者提取全局相关性,后者通过CNN核(如3邻域)平滑短时情绪波动。
      • 回归任务(TCT-regr):以双向GRU替代MSA,适应连续情绪标签的因果性预测需求。
  4. 任务特定输出模块(Task-Specific Output, TSO)

    • 分类任务对时序令牌均值池化后输出类别;回归任务直接映射各令牌为连续值。

实验设计
- 数据集:SEED(15被试,3类情绪)、THU-EP(80被试)、FACE(123被试)用于分类;MAHNOB-HCI(24被试)用于回归。
- 基线对比:包括DGCNN、RGN、TSception等9种方法,评估指标涵盖准确率(ACC)、F1分数(分类任务)及RMSE、PCC、CCC(回归任务)。


四、主要结果

  1. 分类性能

    • SEED数据集:EMT深度变体(EMT-d)取得最高ACC(80.2%)和F1(82.1%),较基线RGN(ACC 79.0%)提升显著。
    • THU-EP与FACE:EMT-b在类别不平衡场景下F1领先(THU-EP: 72.4%;FACE: 74.0%),表明其对多被试泛化的优势。
  2. 回归性能

    • MAHNOB-HCI:EMT-regr(GRU版)的PCC(0.490)和CCC(0.396)最优,RMSE(0.063)低于TCN(0.067),验证了RNN结构对连续情绪建模的有效性。
  3. 关键发现

    • 脑区连接可视化:RMPG学习到前额叶-顶叶(注意相关)与颞叶-枕叶(情绪-视觉协同)的多模式连接,符合神经科学理论。
    • 时域特征分析:TCT-clas通过STA平滑短时噪声,而TCT-regr保留时序动态性,适配任务需求差异。

五、结论与价值

  1. 科学价值

    • 首次将Transformer架构应用于跨被试EEG情绪分类与回归联合任务,提出动态多脑区连接建模时域上下文学习的创新框架。
    • 通过神经科学先验(如情绪短时稳定、长时变化)指导模型设计,推动BCI领域可解释性研究。
  2. 应用价值

    • 为精神障碍(如抑郁症)的神经反馈治疗提供高精度情绪解码工具,支持个性化干预。

六、研究亮点

  1. 方法论创新

    • RMPG模块:通过多视角GCN金字塔融合局部与全局脑区连接,超越传统单一邻接矩阵方法。
    • 任务自适应TCT:分类与回归任务分治,MSA与RNN的差异化设计体现认知机理差异。
  2. 性能突破:在4个公开数据集上全面超越基线,尤其在不平衡数据(FACE)和连续标签(MAHNOB-HCI)场景表现突出。

  3. 开源与可复现性:完整代码开源,参数与训练细节透明,助力后续研究。


七、其他补充

  • 局限性:模型计算复杂度较高,未来可优化轻量化设计;时域上下文特征的神经机制需进一步实验验证。
  • 未来方向:探索黎曼流形等几何方法建模脑连接,结合多模态数据(如面部表情)提升鲁棒性。

此研究为EEG情感识别提供了新范式,其融合神经科学与深度学习的思路对脑科学AI应用具有广泛启示。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com