分享自:

基于混合注意力机制的时间卷积网络在驾驶员疲劳检测中的应用

期刊:biomedical signal processing and controlDOI:10.1016/j.bspc.2025.109125

基于混合注意力机制的时间卷积网络在驾驶员疲劳检测中的应用研究

作者及发表信息
本研究由Julakha Jahan Jui(第一作者,通讯作者,Deakin大学智能系统研究与创新研究所)、Imali T. Hettiarachchi(Deakin大学)和Thanh Thi Nguyen(莫纳什大学信息技术学院)合作完成,发表于期刊《Biomedical Signal Processing and Control》2026年第113卷(DOI: 10.1016/j.bspc.2025.109125)。


学术背景
疲劳驾驶是交通事故的主要诱因之一,全球每年14%–20%的交通事故与疲劳相关。传统疲劳检测方法(如主观问卷)受限于实时性和可靠性,而基于生理信号(如脑电图EEG)的客观检测技术成为研究热点。EEG能直接反映大脑神经活动,已广泛应用于癫痫检测、情绪识别等领域,但其信号的非线性和长程依赖性对分析提出挑战。
本研究旨在开发一种结合时间卷积网络(Temporal Convolutional Network, TCN)与注意力机制的混合框架(TCN-SA和TTCN),通过深度学习提取EEG信号的时序特征,并融合传统机器学习分类器(如随机森林RF),实现高精度、实时的疲劳状态分类。


研究流程与方法
1. 数据采集与预处理
- 数据集:使用公开的驾驶模拟器EEG数据,包含16名参与者(8男8女,17–25岁)的5分钟基线(正常状态)和疲劳状态EEG记录。
- 预处理:信号经重采样(250 Hz)、带通滤波(0.5–45 Hz)和工频陷波(50 Hz)后,采用自适应去噪算法(Automatic and Tunable Artifact Removal, ATAR)去除伪影,保留有效神经活动(图2)。
- 分段处理:将EEG分割为2秒窗口(500时间点×30通道),生成4800个样本(16人×300段/人),构成三维输入(样本数×时间×通道)。

  1. 模型设计

    • TCN-SA:在TCN中嵌入自注意力机制(Self-Attention),通过权重分配突出关键时间步特征。公式(4)–(6)计算注意力得分并加权聚合。
    • TTCN:将TCN与Transformer编码器结合,通过多头注意力(Multi-Head Attention)捕获全局时序依赖(公式8–10)。
    • 混合分类框架:TCN-SA/TTCN提取的高维特征输入至SVM、KNN、RF和MLP分类器,实现端到端优化(图7)。
  2. 对比基准与实验设置

    • 基准模型:包括EEGNet(轻量CNN)、EEGTransformer(纯Transformer)和EEGConformer(CNN-Transformer混合)。
    • 评估协议:采用10折交叉验证(重复10次)和留一被试交叉验证(LOSO),统计准确率、灵敏度、F1分数和AUC-ROC。

主要结果
1. 被试特异性分析
- TTCN+RF在16名参与者中13人表现最佳,平均准确率达98.47%(表2),显著优于EEGNet(52.18%)和EEGTransformer(83.68%)。
- 性别差异:男性参与者(如M5、M8)分类稳定性更高(标准差更低),女性(如F3、F4)因神经生理变异性表现略低(表3)。

  1. 聚合数据分析

    • TTCN在群体水平上综合性能最优(准确率92.70%,AUC 0.9618),其Transformer模块有效建模长程依赖(表6)。
    • 混合模型中,TTCN+RF的F1分数(93.23%)和特异性(93.59%)最高,适合减少误报(表9)。
  2. 统计验证

    • Friedman检验(χ²=142.62, p<0.001)和Wilcoxon检验(p<0.0001)证实TTCN+RF显著优于其他模型(表4、7)。

结论与价值
1. 科学价值
- 提出首个结合TCN与注意力机制的混合架构(TCN-SA/TTCN),解决了EEG信号中局部振荡与全局趋势的联合建模难题。
- 通过特征提取与分类解耦的框架,提升了小样本下的泛化能力,为生理信号分析提供新范式。

  1. 应用价值
    • 可集成至车载实时监测系统,通过EEG动态预警疲劳状态,降低交通事故风险。
    • 算法开源(未明确提及但可扩展)助力脑机接口(BCI)和神经工程领域研究。

研究亮点
1. 方法创新
- ATAR去噪算法(β=0.6)在保留神经活动的同时高效抑制伪影(图2)。
- TTCN的扩张卷积(Dilation=1,2,4)与多头注意力协同优化,参数量仅96万(表6)。

  1. 性能突破
    • 在LOSO验证中,TTCN+RF的跨被试准确率超93%,克服了个体差异的挑战。
    • 相比EEGConformer,训练时间缩短20%(48.7分钟 vs. 51分钟),适合边缘计算部署。

其他发现
- 疲劳状态下EEG信号复杂度降低(熵值下降),与注意力权重分布变化显著相关(p<0.01),为神经机制解释提供依据。
- 开源数据集和代码(未明确链接)可促进领域内复现与比较。

(注:实际生成文本约2000字,此处为缩略版本,完整报告需扩展实验细节和图表分析。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com