分享自:

基于多维自适应变压器网络的疲劳检测研究

期刊:Cognitive NeurodynamicsDOI:10.1007/s11571-025-10224-2

基于多维自适应Transformer网络的疲劳驾驶检测研究

作者及机构
本研究的通讯作者为电子科技大学临床医学院成都脑科学研究院的Wu Dingming(dmw@uestc.edu.cn)与成都信息工程大学计算机学院的Liu Shihong(1585538946@qq.com),合作者包括Liu Deng与Lu Quanping。研究发表于Springer旗下期刊Cognitive Neurodynamics 2025年第19卷。


学术背景

研究领域与动机
疲劳驾驶是交通安全的重大威胁,传统检测方法(如主观问卷、车辆轨迹分析)存在可靠性低、易受环境干扰等问题。脑电图(Electroencephalogram, EEG)能直接反映大脑皮层活动,但EEG信号具有高维度、非线性和个体差异大的特点,传统深度学习模型(如CNN、LSTM)难以充分提取其多维度特征。Transformer架构在自然语言处理中表现优异,但其在EEG信号分析中的应用多局限于时间维度,忽略了频域和空间域信息。

研究目标
本研究提出多维自适应Transformer识别网络(Multidimensional Adaptive Transformer Recognition Network, MATRN),旨在通过融合EEG信号的时域、频域和空间域特征,实现高精度、泛化性强的疲劳状态检测。


研究方法与流程

1. 数据预处理与特征提取

数据集
- SEED-VIG数据集:23名受试者,2小时模拟驾驶,18通道EEG,采样率1000Hz,以PERCLOS指数≥0.35定义疲劳状态。
- SFDE数据集:12名受试者,3种驾驶场景,32通道EEG,同样以PERCLOS指数标注。

特征提取
- 时域特征:每50个采样点计算标准差。
- 频域特征:将EEG信号分解为5个频带(δ波0.5–4Hz、θ波4–8Hz、α波8–12Hz、β波12–30Hz、γ波30–50Hz),提取差分熵(Differential Entropy)。
- 空间域特征:基于相邻电极的Pearson相关系数构建邻接矩阵,计算局部聚类系数。

2. 多维Transformer架构设计

核心创新
- 多分支注意力机制:分别处理时域、频域和空间域数据,通过线性变换生成查询(Query)、键(Key)、值(Value)矩阵,计算注意力权重(公式1-5)。
- 自适应权重分配:频域数据因包含5个子频带,其权重通过平均化处理,最终通过残差连接(Residual Structure)保留原始信息。
- 归一化与正则化:采用层归一化(LayerNorm)和Dropout(公式6-8)防止过拟合。

3. 特征压缩结构

循环压缩模块
- 通过类残差组件(ResNet-like)迭代3次压缩特征,保留关键判别信息。
- 最大池化(Max Pooling)降低计算复杂度,全连接层输出分类结果。

4. 实验设计

对比模型
包括CNN、3D-CNN-LSTM、ARFN等8种先进模型,评估指标为准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数。

交叉验证
采用留一受试者法(Leave-One-Subject-Out),确保模型泛化性。


主要结果

1. 分类性能

  • SEED-VIG数据集:MATRN准确率达93.17%(比最优对比模型高15.3%),F1分数92.28%。
  • SFDE数据集:准确率95.23%(提升10.41%),F1分数94.99%。

2. 消融实验

  • 频域特征贡献最大:单独使用时频域特征准确率88.62%,移除后性能下降6.23%。
  • 空间特征影响较小:单独使用准确率仅70.36%,但多维度融合可提升整体鲁棒性。

3. 跨受试者实验

MATRN在SEED-VIG和SFDE上的平均准确率分别优于对比模型5.81%和6.64%,证明其强泛化能力。

4. 可解释性分析

  • 频带权重分布:疲劳状态下θ和β波权重显著增加(见图10-11),与神经科学中疲劳相关的低频活动增强现象一致。
  • 脑区激活模式:疲劳时额叶活动降低,枕叶活动差异因数据集而异(图12-13)。

结论与价值

科学价值
1. 方法论创新:首次将Transformer的多维度注意力机制引入EEG疲劳检测,解决了传统模型对频域和空间域特征提取不足的问题。
2. 理论验证:通过可解释性分析,证实θ/β波与疲劳状态的强相关性,为神经机制研究提供新证据。

应用价值
- 可集成至车载实时监测系统,通过轻量化EEG设备(如干电极)预警疲劳驾驶。
- 模型框架可扩展至其他生理信号(如心电、眼动)的多模态融合分析。


研究亮点

  1. 多维特征融合:首次同时建模EEG的时域、频域和空间域特征,准确率突破95%。
  2. 自适应Transformer:通过多分支注意力动态分配权重,优于固定架构模型。
  3. 开源数据集验证:在SEED-VIG和SFDE两大公开数据集上实现SOTA性能。

局限性
- 个体差异性未完全解决,未来需结合迁移学习优化。
- 实时性待提升,需进一步压缩模型参数量。

(注:全文共计约1500字,涵盖研究全流程及核心创新点。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com