作者及机构
本研究的通讯作者为电子科技大学临床医学院成都脑科学研究院的Wu Dingming(dmw@uestc.edu.cn)与成都信息工程大学计算机学院的Liu Shihong(1585538946@qq.com),合作者包括Liu Deng与Lu Quanping。研究发表于Springer旗下期刊Cognitive Neurodynamics 2025年第19卷。
研究领域与动机
疲劳驾驶是交通安全的重大威胁,传统检测方法(如主观问卷、车辆轨迹分析)存在可靠性低、易受环境干扰等问题。脑电图(Electroencephalogram, EEG)能直接反映大脑皮层活动,但EEG信号具有高维度、非线性和个体差异大的特点,传统深度学习模型(如CNN、LSTM)难以充分提取其多维度特征。Transformer架构在自然语言处理中表现优异,但其在EEG信号分析中的应用多局限于时间维度,忽略了频域和空间域信息。
研究目标
本研究提出多维自适应Transformer识别网络(Multidimensional Adaptive Transformer Recognition Network, MATRN),旨在通过融合EEG信号的时域、频域和空间域特征,实现高精度、泛化性强的疲劳状态检测。
数据集
- SEED-VIG数据集:23名受试者,2小时模拟驾驶,18通道EEG,采样率1000Hz,以PERCLOS指数≥0.35定义疲劳状态。
- SFDE数据集:12名受试者,3种驾驶场景,32通道EEG,同样以PERCLOS指数标注。
特征提取
- 时域特征:每50个采样点计算标准差。
- 频域特征:将EEG信号分解为5个频带(δ波0.5–4Hz、θ波4–8Hz、α波8–12Hz、β波12–30Hz、γ波30–50Hz),提取差分熵(Differential Entropy)。
- 空间域特征:基于相邻电极的Pearson相关系数构建邻接矩阵,计算局部聚类系数。
核心创新
- 多分支注意力机制:分别处理时域、频域和空间域数据,通过线性变换生成查询(Query)、键(Key)、值(Value)矩阵,计算注意力权重(公式1-5)。
- 自适应权重分配:频域数据因包含5个子频带,其权重通过平均化处理,最终通过残差连接(Residual Structure)保留原始信息。
- 归一化与正则化:采用层归一化(LayerNorm)和Dropout(公式6-8)防止过拟合。
循环压缩模块
- 通过类残差组件(ResNet-like)迭代3次压缩特征,保留关键判别信息。
- 最大池化(Max Pooling)降低计算复杂度,全连接层输出分类结果。
对比模型
包括CNN、3D-CNN-LSTM、ARFN等8种先进模型,评估指标为准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数。
交叉验证
采用留一受试者法(Leave-One-Subject-Out),确保模型泛化性。
MATRN在SEED-VIG和SFDE上的平均准确率分别优于对比模型5.81%和6.64%,证明其强泛化能力。
科学价值
1. 方法论创新:首次将Transformer的多维度注意力机制引入EEG疲劳检测,解决了传统模型对频域和空间域特征提取不足的问题。
2. 理论验证:通过可解释性分析,证实θ/β波与疲劳状态的强相关性,为神经机制研究提供新证据。
应用价值
- 可集成至车载实时监测系统,通过轻量化EEG设备(如干电极)预警疲劳驾驶。
- 模型框架可扩展至其他生理信号(如心电、眼动)的多模态融合分析。
局限性
- 个体差异性未完全解决,未来需结合迁移学习优化。
- 实时性待提升,需进一步压缩模型参数量。
(注:全文共计约1500字,涵盖研究全流程及核心创新点。)