这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
基于注意力机制的混合深度学习模型在可穿戴设备压力识别中的应用研究
第一作者及研究机构
本研究由Ritu Tanwar(印度北阿坎德邦国立理工学院)、Orchid Chetia Phukan(印度德里英德拉普拉斯塔信息技术学院)、Ghanapriya Singh(印度哈里亚纳邦库鲁克谢特拉国立理工学院)、Pankaj Kumar Pal(印度北阿坎德邦国立理工学院)和Sanju Tiwari(墨西哥塔毛利帕斯自治大学)共同完成。研究成果发表于期刊《Engineering Applications of Artificial Intelligence》第127卷(2024年),文章编号107391,在线发布于2023年11月2日。
研究领域与动机
该研究属于情感计算(Affective Computing)与健康信息技术的交叉领域,聚焦于通过多模态生理信号(multimodal physiological data)实现压力识别的自动化。传统压力识别方法依赖手工提取特征(handcrafted features)和机器学习算法,但存在精度不足、鲁棒性差的问题。本研究旨在通过结合卷积神经网络(CNN)、长短时记忆网络(LSTM)和注意力机制(attention mechanism),构建一种混合深度学习模型,以提升压力识别的准确性和实时性。
科学问题
1. 多模态信号融合的复杂性:生理信号(如心电图ECG、皮肤电活动EDA)的噪声干扰和时序依赖性增加了特征提取难度。
2. 长期依赖关系的捕捉:传统LSTM对长序列数据的记忆能力有限,难以动态加权关键特征。
3. 实际应用需求:可穿戴设备需兼顾计算效率与模型性能,当前方法在资源消耗与精度间难以平衡。
1. 数据预处理
- 数据集:采用公开的WESAD(Wearable Stress and Affection Detection)数据集,包含15名受试者的ECG、EDA、肌电图(EMG)、呼吸(resp.)和体温(temp.)信号,采样频率700 Hz。
- 信号处理:缺失值通过邻近均值填充;数据归一化采用Min-Max方法;通过5秒滑动窗口(2秒步长)将1D信号转为2D输入。
2. 模型架构
- 混合深度学习模型:
- CNN模块:两层2D卷积(10和30个滤波器,核大小5×5),ReLU激活函数,最大池化层降维。
- LSTM模块:256单元和50单元的双层LSTM,tanh激活函数,捕捉时序依赖。
- 注意力机制:基于Luong注意力模型,动态加权LSTM输出的隐藏状态,生成128维上下文向量。
- 决策融合对比:将CNN、CNN-LSTM和本模型的输出通过软投票(soft voting)融合,验证本模型的独立性优势。
3. 实验设计
- 单模态与多模态输入:分别测试ECG、EDA等单模态及多模态组合的性能。
- 评估指标:准确率(accuracy)、加权F1分数(weighted F1-score)、计算复杂度(FLOPs、MACs)和内存占用。
1. 性能对比
- 单模态:ECG信号表现最佳(准确率74.76%,F1分数66.72%),体温信号最差(准确率57.97%)。
- 多模态组合:融合ECG、EDA、呼吸和体温时,模型达到峰值性能(准确率92.70%,F1分数89.95%),显著优于传统CNN(70.52%)和CNN-LSTM(91.42%)。
- 决策融合模型:虽在部分组合中略优(如ECG单模态准确率76.33%),但本模型在多模态场景下更稳定且资源效率更高。
2. 计算效率
- 模型参数2721万,FLOPs 1773万,内存占用980.23 MB,与CNN-LSTM相当,但精度提升显著。
- 训练时间分析:多模态输入(如ECG+EDA+呼吸+体温)需3768秒,与CNN-LSTM(3810秒)接近。
3. 混淆矩阵分析
多模态输入下,压力类别的识别准确率最高(92%),基线(baseline)和愉悦(amusement)类别的误判率显著降低。
科学价值
1. 方法创新:首次将注意力机制引入CNN-LSTM框架,解决了多模态信号融合中的动态特征加权问题。
2. 性能突破:92.7%的准确率为当前压力识别领域的最高水平之一,较传统方法(如随机森林80%)提升显著。
应用价值
1. 可穿戴设备集成:模型轻量化设计(如5秒窗口)适合实时处理,为智能健康监测提供技术支撑。
2. 跨领域扩展:框架可适配其他生理信号(如脑电图EEG),拓展至情绪识别、驾驶疲劳检测等场景。
局限性
1. 数据多样性不足:仅使用WESAD数据集,未覆盖不同文化或性别群体的应激反应差异。
2. 可解释性挑战:深度学习模型的“黑箱”特性可能影响医疗场景中的信任度。
该研究通过混合深度学习框架推动了压力识别技术的实用化进程,为情感计算在健康管理中的应用提供了新范式。