这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
基于混合脑电图与眼动追踪的驾驶疲劳检测研究
1. 研究团队与发表信息
本研究由Zequan Lian(五邑大学电子与信息工程学院)、Tao Xu(汕头大学生物医学工程系)、Zhen Yuan(澳门大学健康科学学院及认知与脑科学中心)、Junhua Li(英国埃塞克斯大学计算机科学与电子工程学院)、Nitish Thakor(约翰霍普金斯大学生物医学工程系)及Hongtao Wang(五邑大学电子与信息工程学院,通讯作者)合作完成,发表于2024年11月的《IEEE Journal of Biomedical and Health Informatics》(第28卷第11期)。研究得到五邑大学重点领域专项、粤港澳联合研究项目(2019WGALH16)及广东省国际科技合作项目(2023A0505050144)资助,并获江门市中心医院伦理委员会批准([2021]8A)。
2. 学术背景与研究目标
科学领域:研究属于生物医学工程与智能交通交叉领域,聚焦驾驶疲劳检测(driving fatigue detection)的算法优化。
研究动机:疲劳驾驶是交通事故主因之一,现有单模态检测方法(如基于脑电图EEG或眼动追踪)因信息不完整导致跨会话(cross-session)和跨被试(cross-subject)性能下降。
研究目标:提出一种融合EEG与眼动追踪的多模态架构,通过跨模态预测对齐(cross-modal predictive alignment)和注意力机制提升检测鲁棒性。
3. 研究流程与方法
研究对象:14名健康被试(9男5女,平均年龄21.6±1.4岁),每人完成两次90分钟模拟驾驶实验(共28次实验),实验时段为下午2-5点(疲劳易发时段)。
实验设计:
- 数据采集:
- EEG:使用32通道Brain Products LiveAmp帽采集(采样率250Hz),预处理包括坏道插值、1-40Hz带通滤波、独立成分分析(ICA)去眼电伪迹。
- 眼动追踪:Tobii Glasses 2采集(采样率100Hz),通过速度阈值识别(I-VT)滤波器提取8项特征(如注视时间、扫视幅度等)。
- 标签划分:实验开始10分钟标记为“清醒”(alert),最后10分钟标记为“疲劳”(fatigue),通过问卷验证标签有效性。
算法架构:
1. 编码模块:
- EEG编码器:三层卷积网络(时域滤波、空域滤波、深度时域滤波),输出1×64特征向量。
- 眼动编码器:多层感知机(MLP)处理60秒窗口的8维特征,输出1×64向量。
2. 融合模块:
- 跨模态预测对齐:通过MLP预测另一模态特征,优化余弦相似度损失(含梯度截断策略避免退化解)。
- 一维注意力模块:增强特征表征,权重通过两层MLP计算。
3. 分类器:线性分类器输出疲劳状态。
评估方法:
- 任务设计:会话内(intra-session)、跨会话(cross-session)、跨被试(cross-subject)三类评估。
- 对比方法:EEG单模态、眼动单模态、深度典型相关分析(DCCA)、深度广义典型相关分析(DGCCA)。
4. 主要结果
- 模态数据分析:
- EEG:疲劳状态下前额叶皮层theta、alpha、beta频段功率显著增加(p<0.01),顶枕叶alpha功率上升(图4)。
- 眼动:疲劳期扫视次数(saccade count)和平均持续时间显著增加(p<0.05),短时注视(<150ms)比例上升(图5,表I)。
- 检测性能:
- 会话内:准确率99.93%(±0.05%),显著优于单模态(EEG 98.84%,眼动91.61%)及DCCA/DGCCA(99.60%/99.72%)。
- 跨会话:准确率88.67%(±1.00%),较EEG单模态提升8.52%。
- 跨被试:准确率78.19%(±0.56%),优于DCCA(77.64%)和DGCCA(77.75%)。
- 消融实验:跨模态对齐模块在跨会话和跨被试任务中分别提升性能3.79%和1.52%,而注意力模块在跨被试任务中因数据分布差异导致性能下降1.78%。
5. 结论与价值
科学价值:
- 提出首个结合EEG与眼动追踪的跨模态预测对齐框架,解决了传统CCA方法在特征可分性上的局限。
- 通过UMAP可视化证实多模态特征在潜在空间中具有更高类内聚合度(图8)。
应用价值:为实时驾驶疲劳监测系统提供了高精度、鲁棒性强的解决方案,尤其适用于跨设备场景。
6. 研究亮点
- 方法创新:非CCA的跨模态对齐策略与一维注意力模块结合,首次应用于疲劳检测。
- 数据验证:在公开数据集SEED-VIG上准确率达96.92%,较DCCA提升9.97%。
- 可解释性:前额叶皮层通道权重最高(图9),与神经科学结论一致。
7. 其他发现
- 时间窗口优化:眼动特征生成窗口延长至60秒可提升跨会话任务性能至88.59%(图7)。
- 局限性:需双设备同步采集,在线应用时需预填充长窗口数据。
(注:全文约2000字,涵盖研究全流程及核心发现,符合学术报告规范。)