基于Conformal Prediction的抑郁症预测方法

基于Conformal Prediction的抑郁症预测方法研究

背景介绍

抑郁症是一种常见的心理障碍,表现为持续的悲伤、衰弱以及对活动失去兴趣。它不仅增加了自杀的风险,还给患者及其家庭带来了巨大的心理负担。目前,抑郁症的诊断主要依赖于心理健康报告,如Beck抑郁量表(BDI-II)、Hamilton抑郁评定量表(HRSD)和患者健康问卷(PHQ-8)。然而,这些诊断方法依赖于临床医生的主观经验和患者的认知能力,耗时且效率低下。

近年来,随着深度学习技术的快速发展,基于深度学习的抑郁症预测方法显示出巨大的潜力。然而,这些深度模型通常作为“黑箱”模型部署,缺乏可信度,无法提供预测的置信度。对于抑郁症预测这样的高风险临床应用,不确定性量化在决策过程中至关重要。为此,本研究提出了基于Conformal Prediction(CP)的抑郁症预测方法(Conformal Depression Prediction, CDP),旨在为模型预测提供理论覆盖保证的有效置信区间。

论文来源

本论文由Yonghong Li、Shan Qu和Xiuzhuang Zhou共同撰写。Yonghong Li和Xiuzhuang Zhou来自北京邮电大学人工智能学院,Shan Qu来自北京大学人民医院精神科。该论文已发表于IEEE Transactions on Affective Computing期刊,发表日期为2025年,DOI为10.1109/TAFFC.2025.3542023。

研究流程

1. 研究目标与方法概述

本研究的主要目标是开发一种不确定性量化方法,用于面部抑郁症预测。具体来说,作者提出了两种方法:Conformal Depression Prediction(CDP)和其改进版本CDP-acc。CDP通过Conformal Prediction为模型预测提供边际覆盖保证的置信区间,而CDP-acc则通过近似条件覆盖进一步优化置信区间,使其更紧致且适应特定输入。

2. 数据集与模型选择

研究使用了两个常用的面部抑郁症数据集:AVEC 2013和AVEC 2014。这些数据集包含面部视频,视频中的每个帧都标记了BDI-II评分。研究选择了经典的C3D和SlowFast网络作为基线模型进行面部抑郁症预测。

3. 不确定性量化方法

a) CDP方法

CDP方法的核心思想是利用Conformal Prediction为模型预测提供置信区间。具体步骤如下: 1. 校准集的构建:将数据集划分为训练集、校准集和测试集。 2. 模型训练:使用训练集训练深度神经网络模型。 3. 置信区间的计算:在校准集上计算预测偏差,作为Conformal Score,并根据用户定义的置信水平计算置信区间。

b) CDP-acc方法

CDP-acc方法通过近似条件覆盖进一步优化置信区间。具体步骤如下: 1. 预测分布的估计:将校准集上的预测划分为若干子区间,估计每个子区间内的条件分布。 2. 置信区间的构建:根据估计的条件分布,构建嵌套序列,计算最短宽度的置信区间。

4. 实验与评估

研究通过以下指标评估不确定性量化方法的性能: - 预测区间覆盖概率(PICP):衡量置信区间覆盖真实值的概率。 - 平均预测区间宽度(MPIW):衡量置信区间的平均宽度。 - 分层覆盖率(SSC):评估不同方法在不同抑郁症严重程度下的条件覆盖率。

主要结果

1. 预测误差

研究比较了不同训练损失函数和网络架构下的预测误差。结果表明,Quantile Regression(QR)在大多数情况下表现出较小的预测误差,尤其是在AVEC 2013数据集上。

2. 不确定性量化性能

CDP和CDP-acc方法在PICP和MPIW指标上表现出色。CDP-acc在保持覆盖率的同时,显著减少了置信区间的宽度。特别是在AVEC 2014数据集上,CDP-acc的PICP达到了93.72%,MPIW仅为20.17。

3. 条件覆盖率评估

CDP-acc方法在条件覆盖率评估中表现最佳,其SSC值接近1-α,表明该方法能够更好地适应不同抑郁症严重程度的预测。

研究结论

本研究提出的CDP和CDP-acc方法为面部抑郁症预测提供了有效的不确定性量化框架。CDP通过Conformal Prediction为模型预测提供边际覆盖保证的置信区间,而CDP-acc则通过近似条件覆盖进一步优化置信区间,使其更紧致且适应特定输入。实验结果表明,CDP-acc在保持覆盖率的同时,显著减少了置信区间的宽度,为抑郁症预测提供了更精确的不确定性量化。

研究亮点

  1. 创新性方法:本研究首次将Conformal Prediction应用于抑郁症预测,提出了一种无需重新训练模型的不确定性量化方法。
  2. 理论保证:CDP方法提供了理论覆盖保证的置信区间,确保了预测的可信度。
  3. 实际应用价值:CDP和CDP-acc方法为抑郁症预测提供了更可靠的决策支持,特别是在高风险临床应用中具有重要意义。

其他有价值的信息

研究还进行了参数分析,探讨了子区间数量对CDP-acc性能的影响。结果表明,子区间数量为14时,CDP-acc的PICP和MPIW达到最佳平衡。此外,研究还比较了不同经验分布估计方法对CDP-acc性能的影响,发现直方图估计方法在大多数情况下表现最佳。