基于决策树方法的虚拟现实模拟生理信号分析与压力分类:一项关于VR视频游戏缓解压力的生理学研究与创新算法应用报告
本研究发表于开源期刊 Bioengineering 2023年第10卷第766期,题为“Physiological Signal Analysis and Stress Classification from VR Simulations Using Decision Tree Methods”。论文的主要作者为来自加拿大多伦多城市大学电气、计算机和生物医学工程系的Syem Ishaque、Naimul Khan和Sridhar Krishnan。这项研究旨在通过生理信号分析评估一款虚拟现实(Virtual Reality, VR)视频游戏在压力管理中的作用,并开发新型机器学习算法以实现高效的压力分类。
学术背景与研究目标
长期压力对心血管、肌肉组织和免疫系统具有显著危害。因此,主动评估各种活动对压力的影响并进行有效干预至关重要。压力反应会引发生理变化,特别是通过自主神经系统(Autonomic Nervous System, ANS)的两个分支——交感神经系统(Sympathetic Nervous System, SNS,激发状态)和副交感神经系统(Parasympathetic Nervous System, PNS,放松状态)的活动变化来体现。心率变异性(Heart Rate Variability, HRV)、皮电反应(Galvanic Skin Response, GSR)和呼吸(Respiration)信号是评估ANS活动的常用生理指标。
尽管有研究探讨视频游戏对社交技能和认知功能的积极影响,但结合生理信号分析并运用机器学习技术深入研究视频游戏(特别是VR游戏)对压力调节作用的研究仍相对有限。因此,本研究旨在达成以下目标: 1. 全面评估一款名为“Bubble Bloom”的VR视频游戏在缓解由其他VR任务诱发压力方面的生理学效果。 2. 开发一种新型的个性化分类与回归树(Classification and Regression Tree, CART)模型,并应用一种新的基尼指数算法,以实现高效的二分类压力识别。 3. 提出一种从多特征中衍生的新型k-means特征,并与集成梯度提升、极端梯度提升等机器学习算法结合,用于对VR过山车模拟中诱发的五级压力进行分类。
研究流程详解
本研究分为数据收集、特征提取、生理学分析和机器学习分类等多个紧密相连的步骤。
1. 数据采集 研究获得了大学伦理委员会的批准,共招募了15名健康受试者(平均年龄32.4±10.6岁)。实验使用Captive T-Sens无线传感器同步采集三种生理信号:心电图、皮电反应和呼吸信号。整个实验包含四个阶段: - T1(基线期,5分钟): 受试者安静阅读或休息,以获取其基础生理参数。 - T2(VR过山车模拟,7分钟): 通过刺激性的VR过山车体验诱发恐惧和焦虑相关压力。 - T3(颜色斯特鲁普任务,7分钟): 进行认知颜色冲突任务,通过认知负荷诱发压力。 - T4(VR Bubble Bloom游戏,5分钟): 受试者游玩旨在放松的VR钓鱼游戏“Bubble Bloom”。 最终,从13名完成基线、过山车和斯特鲁普任务的受试者以及11名完成所有四个阶段(包括VR游戏)的受试者中,共获得了150个有效信号片段,构成了50个样本数据集(每个样本对应一个实验阶段的一个受试者,包含从多个信号中提取的多个特征)。
2. 信号预处理与特征提取 为避免自动化软件可能引入的误差,所有特征均采用手动处理方式提取,以确保数据质量。 - 预处理: 心电信号采用50 Hz陷波滤波和小波分解进行去噪和光滑处理;皮电反应信号采用低通巴特沃斯滤波器;呼吸信号采用带通布莱克曼滤波器。 - 特征提取: 从三个信号中总共提取了21个特征。 - 时域特征: 从心率间期序列中提取,包括平均心率、标准差、相邻间期差值的均方根等。 - 频域特征: 通过自回归模型和Lomb-Scargle周期图将心率间期序列转换成功率谱密度,提取极低频、低频、高频、总功率以及低频/高频比值等。其中,低频活动主要与交感神经活动相关,高频活动与副交感神经活动相关,其比值是评估压力与放松状态的关键指标。 - 非线性特征: 通过Poincaré图分析提取SD1和SD2,分别代表瞬时和长期心率变异性;并计算近似熵以评估信号的规律性。 - 皮电反应与呼吸特征: 计算皮电信号的平均值和标准差,以及呼吸率。
3. 生理学分析与统计检验 研究人员详细分析了受试者在四个实验阶段中各项生理特征的变化趋势。例如,压力状态下预期会观察到平均心率、低频、低频/高频比值、近似熵、皮电反应值和呼吸率上升,而高频、相邻间期差值的均方根等则下降。为了验证VR游戏阶段(T4)后生理指标的变化是否具有统计学意义,研究对T4与压力诱发阶段(T2, T3)的数据进行了t检验,并以p值小于0.05作为判断标准。
4. 机器学习分类模型开发与评估 这是本研究的核心创新部分。 - 二分类压力识别(放松 vs. 压力): 基于50个样本的18个心率变异性特征数据集。数据标签根据已发表的文献标准进行手动标注(例如,低频/高频比值>3标注为压力状态)。研究比较了多种算法,包括支持向量机、朴素贝叶斯、集成梯度提升以及本研究提出的个性化CART决策树模型。该CART模型的核心创新在于使用了一种新型基尼指数算法。与需要反复遍历所有特征和分割点以计算不纯度的传统算法不同,新算法首先对特征和标签进行排序,然后基于预设分割点(研究中设为0.5)逻辑性地将候选数据分配到左/右节点,从而更快速、高效地确定最佳分割点,提升了模型效率和决策准确性。 - 五级压力分类(从放松到高压力): 使用从VR过山车阶段实时采集的86个数据样本(以30秒为时间窗),包含11个特征。研究引入了另一个关键创新——新型k-means特征。该特征并非用于传统聚类,而是作为一个新的输入特征。其生成算法是:首先使用k-means聚类算法(k=100)在所有11个特征的数据上寻找聚类中心;然后,利用这些聚类中心构建一个新的k-means模型;最后,将原始数据输入此新模型,得到的预测聚类标签即作为代表所有原始特征综合信息的一维k-means特征。研究将决策树、极端梯度提升和集成梯度提升算法嵌入一个包含最小-最大缩放预处理、卡方特征选择和网格搜索超参数调优的管道中,分别使用全部11个特征和单一的k-means特征进行分类性能对比。
主要研究成果
1. 生理学分析结果证实VR游戏具有减压效果 统计分析结果表明,在经历了VR过山车和斯特鲁普任务的压力诱发阶段后,受试者游玩“Bubble Bloom”VR游戏(T4阶段)导致了多项生理指标向放松状态转变。具体数据支持如下:平均心率从T3的76 bpm降至T4的74 bpm;近似熵从0.875降至0.757;皮电反应平均值从5.665降至3.257。最重要的是,反映压力状态的关键指标——通过Lomb-Scargle方法计算的低频/高频比值,从T3的1.80降至T4的0.88(低于1.5的放松阈值);同时,高频成分从1.49×10³ ms²/Hz增加至2.65×10³ ms²/Hz。这些变化大多具有统计学显著性(p值 < 0.05),有力地证明了该VR游戏能够有效促进副交感神经活动,降低交感神经兴奋,从而缓解压力。
2. 二分类压力识别取得优异性能 在二分类任务中,本研究提出的个性化CART模型达到了87.75%的准确率,优于支持向量机(60%)和朴素贝叶斯(70%)。而集成梯度提升模型表现更为突出,实现了100%的准确率。经过5折和10折交叉验证,个性化CART模型仍保持稳健性能(5折平均准确率75.77%),证明了其有效性。论文指出,集成梯度提升作为强学习器,能够通过迭代优化损失函数来减少误差,适应性更强。
3. 新型k-means特征显著提升五级分类模型性能 在五级压力分类任务中,使用新型k-means特征相比使用全部11个原始特征,显著改善了模型性能: - 决策树模型: 使用k-means特征时,准确率从50.00%提升至72.22%,均方误差从1.39大幅降低至0.06,决定系数从0.04提升至0.72。 - 极端梯度提升模型: 使用k-means特征时,准确率从67.65%提升至72.22%,均方误差从0.83降至0.06。 - 集成梯度提升模型: 虽然准确率均为69.12%,但使用k-means特征时均方误差更低(0.22 vs. 0.83),决定系数更高(0.83 vs. 0.22),表明模型对数据的拟合度更好。
此外,使用k-means特征的管道模拟时间比使用全部特征节省了36秒。这表明k-means特征通过整合多个特征的核心信息,有效减少了数据散度和噪声,降低了模型的计算复杂度和误差幅度,从而以更快的速度获得了更好的性能。
结论与价值
本研究得出以下主要结论: 1. 生理学验证: 通过严谨的时域、频域和非线性分析,首次在生理层面证实了特定设计的VR视频游戏“Bubble Bloom”能够有效降低由恐惧和认知任务诱发的压力水平。 2. 算法创新有效: 提出的新型基尼指数算法使个性化CART决策树模型能够高效、准确地进行二分类压力识别。 3. 特征工程突破: 创造性地将k-means聚类算法转化为一种特征提取方法,生成的k-means特征在五级压力分类任务中能有效整合信息、减少误差、提升多种机器学习模型的性能与效率。 4. 方法学贡献: 研究展示了结合详细生理学分析与先进机器学习算法(包括强学习器和新型弱学习器)的综合研究路径,为实时压力监测与分类提供了新的技术思路。
研究亮点
其他有价值的发现
学习曲线分析揭示了所开发模型(特别是集成梯度提升和决策树)存在过拟合的风险(训练分数完美而验证分数有差距)。作者指出,这是未来需要改进的方面,并建议通过调整学习率、收缩因子和限制树深度等策略来缓解。这一分析体现了研究团队对模型稳健性的关注。
这项研究不仅为VR技术在心理健康干预领域的应用提供了有力的生理学证据,更在机器学习算法和特征工程方面做出了实质性创新,为可穿戴设备实时压力监测与个性化压力管理系统的开发奠定了重要的技术基础。