分享自:

多国中老年人抑郁症状的决定因素:一种机器学习方法

期刊:npj digital medicineDOI:10.1038/s41746-025-01905-7

本研究由华中科技大学医药卫生管理学院Can Lu、中国人民大学农业与农村发展学院Shenwei Wan以及华中科技大学Zhiyong Liu(通讯作者)共同完成。该研究成果以文章《Determinants of depressive symptoms in multinational middle-aged and older adults》的形式,发表于npj Digital Medicine期刊(出版于2025年,卷号8,文章ID 501)。这是一项利用机器学习(Machine Learning)方法,针对多国中老年人群抑郁症风险的社会经济决定因素进行深入探究的原创性研究。

学术背景 本研究隶属于数字医学(Digital Medicine)与公共卫生、老年精神健康交叉领域。抑郁症是影响中老年人生活质量和预期寿命的重大公共卫生问题,全球约有10%-20%的60岁以上老年人受到具有临床意义的抑郁症状困扰。传统的流行病学研究多采用线性模型,难以充分刻画抑郁症风险背后生物、心理、社会因素之间复杂的非线性交互作用。同时,全球范围内社会经济快速变迁与人口老龄化加剧,使得不同收入阶层和性别群体面临的抑郁风险存在显著异质性,尤其是低收入和女性群体更为脆弱。尽管机器学习在心理健康预测中展现出潜力,但其“黑箱”特性限制了临床可解释性与实际应用。因此,本研究旨在整合可解释的机器学习框架,跨越不同国家队列,系统解析中老年抑郁症状的关键预测因子,并重点揭示这些因子在不同收入和性别亚组中的差异,从而为制定精准、公平的干预策略提供实证依据。研究的具体目标是:1)评估多种机器学习算法在多个国际老龄化队列中预测抑郁症状的表现;2)利用SHAP(Shapley Additive Explanations)框架识别并解释影响抑郁风险的关键特征;3)通过按收入和性别分层,探究预测因子贡献度的异质性。

详细研究流程 本研究是一个基于横断面数据的计算性研究,其核心工作流程包括数据准备、模型构建与评估、结果解释与异质性分析三大阶段,涉及多个细致的步骤。

第一阶段:数据准备与预处理。 研究团队从五个大型跨国老龄化队列中提取了横截面数据,包括美国的健康与退休研究(HRS,第14波)、英国的英国老龄化纵向研究(ELSA,第8波)、欧洲的健康、老龄化与退休调查(SHARE,第7波)、中国的中国健康与养老追踪调查(CHARLS,第4波)以及墨西哥的墨西哥健康与老龄化研究(MHAS,第5波)。研究对象为50岁及以上的成年人。经过排除抑郁症状数据缺失、个体变量缺失超过20%以及未报告任何慢性病的参与者后,最终纳入分析的样本总量为68,372人(HRS: 16,045; ELSA: 7,864; SHARE: 13,927; CHARLS: 15,963; MHAS: 14,573)。研究定义了一个二分类结局变量“抑郁症状风险”,依据各队列经过验证的抑郁量表(如CES-D、EURO-D)设定阈值进行划分。

研究选取了15个特征变量,涵盖人口统计学特征(年龄、性别、婚姻状况、教育水平)、社会经济状况(家庭总财富四分位数、家庭总收入四分位数、就业状态)、生活方式因素(吸烟、饮酒、体力活动、数字排斥)以及健康状况指标(自评健康、日常生活活动能力/工具性日常生活活动能力受限情况、慢性病数量)。为确保跨队列可比性,团队对所有变量进行了系统的协调与标准化编码。针对数据中存在的缺失值,研究采用了多重插补方法以减少偏差。一个关键的预处理步骤是处理数据不平衡问题:数据集中有抑郁症状的个体(28.10%)属于少数类。为此,研究应用了合成少数类过采样技术(Synthetic Minority Oversampling Technique, SMOTE),生成合成样本以平衡训练数据集,从而提升模型对少数类的识别敏感度。

第二阶段:预测模型开发与性能评估。 对于每个独立的队列数据集,研究将其随机划分为训练集(80%)和测试集(20%)。研究团队系统性地评估了六种机器学习算法:LightGBM、逻辑回归(Logistic Regression)、支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest)、XGBoost和AdaBoost。这些算法代表了不同的建模思想,从经典的统计模型到高效的梯度提升框架。为了获得最优模型,研究采用了5折交叉验证结合网格搜索的策略来迭代优化每个算法的超参数,并以受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUC)作为主要性能指标进行模型选择。最终,在内部测试集上,使用一系列指标(AUC、准确率、精确率、召回率、F1分数)全面评估各模型的预测性能。本研究的创新性方法在于并未止步于性能比较,而是深度融合了可解释性分析。

第三阶段:SHAP分析与异质性探究。 在确定每个队列中性能最佳的模型后,研究核心采用了SHAP(Shapley Additive Explanations)这一基于合作博弈论的可解释人工智能框架。SHAP值可以量化每个特征对于单个预测结果(局部解释)乃至整个模型(全局解释)的贡献度,并能展示特征影响的方向(正向或负向)。研究计算了所有样本的SHAP值,生成了特征重要性摘要图,直观展示了每个队列中影响抑郁风险的前15个特征及其贡献排序。为进一步揭示社会经济背景的影响,研究进行了两项关键的异质性分析:首先,将每个队列的参与者按家庭收入四分位数分为高、中、低三组,分别计算各收入组内特征的平均SHAP贡献值,比较同一特征重要性随收入水平的变化。其次,进行了性别分层分析,分别计算男性和女性样本中的特征SHAP贡献,以识别风险因素的性别特异性模式。

主要研究结果 研究结果内容丰富,主要可分为模型性能、关键预测因子识别以及异质性模式三大方面。

在模型性能方面,不同算法在不同队列中表现各异,但集成学习算法整体表现优越。具体而言,XGBoost在四个队列(CHARLS, SHARE, HRS, MHAS)中均取得了最佳的AUC值,范围在0.7677至0.8771之间,显示出其处理多样化老龄化人口数据的强大适应性和捕捉复杂模式的能力。例如,在HRS队列中,XGBoboost的AUC高达0.8771,精确率为0.8170。然而,在英国的ELSA队列中,LightGBM表现更为出色,取得了近乎完美的AUC值0.9011,其准确率、精确率、召回率和F1分数均超过0.89,表明该模型对ELSA数据特有的数据结构或健康系统特征有极佳的判别力。相比之下,逻辑回归、SVM等传统算法性能普遍不及XGBoost和LightGBm。这些结果为针对特定人群特征选择合适算法提供了实证依据。

在关键预测因子的识别上,SHAP分析揭示了跨队列的一致性与差异性。一个最突出的发现是,自评健康(Self-rated health) 在除MHAS外的所有四个队列(SHARE, ELSA, HRS, CHARLS)中,都是贡献度最高的最强预测因子。其SHAP贡献值在SHARE队列高达+0.77,在HRS队列为+0.81。这表明个体对自身健康状况的主观评估是抑郁风险的核心枢纽,它整合了客观健康状况与心理社会因素。慢性病状态、功能限制(ADL/IADL)以及社会经济因素(收入、财富、教育)也 consistently 被识别为重要预测因子。然而,特征的重要性排序存在显著的队列间差异。最引人注目的是,在墨西哥的MHAS队列中,性别(Gender) 取代自评健康成为最重要的预测因子(SHAP贡献+0.31),凸显了地区文化背景和性别角色对抑郁风险通路的深刻影响。此外,数字排斥、吸烟等生活方式因素的重要性也因队列而异。

异质性分析结果进一步深化了上述发现,揭示了风险画像的社会经济与性别维度。按收入分层分析显示,虽然自评健康在几乎所有收入组中均保持主导地位,但次级因素的相对重要性在低收入群体中发生了显著变化。例如,在HRS和CHARLS队列中,家庭财富、就业状态、数字排斥和婚姻状况等因素在低收入组中的影响力更大。这表明对于经济上处于劣势的群体,物质匮乏、工作不稳定、数字鸿沟和社会孤立等社会经济脆弱性会叠加放大其抑郁风险。而在高收入组,主观健康感知的影响更为突出,暗示当物质需求得到满足后,心理感受层面的因素占据更主导地位。按性别分层分析表明,自评健康同样是男女两性中最主要的预测因子,但其他因素的影响力存在性别差异。例如,在MHAS队列,慢性病对女性的影响更大;而在多个队列中,工作状态、吸烟等因素对男性的贡献相对更高。这些细微差别强调了在抑郁风险评估和干预设计中考虑性别敏感性的必要性。

研究结论与意义 本研究得出结论:利用XGBoost和LightGBM等可解释的机器学习框架,能够有效地在多国中老年人群中预测抑郁症状风险,并精细解析其复杂的社会经济决定因素。自评健康是一个普遍且主导性的风险预测因子,但其与其他因素的交互作用以及风险因素的整体构成,强烈依赖于具体的社会经济背景、文化环境和性别角色。抑郁风险并非均质分布,而是呈现出以收入和社会性别为轴心的显著异质性。低收入群体,尤其是其中的女性,面临着一系列相互交织的物质、社会和行为风险因素的叠加冲击。

该研究的科学价值在于,它超越了传统线性模型的局限,通过机器学习与可解释性人工智能的结合,以数据驱动的方式揭示了抑郁风险中复杂、非线性的相互作用模式,并提供了量化特征贡献度的透明化工具。其应用价值则直接指向“精准公共卫生”(Precision Public Health):研究结果强烈提示,一刀切的抑郁预防策略效果有限。未来的干预措施必须是“量身定制”和“情境敏感”的。例如,针对低收入老年人群的干预可能需要整合经济支持、就业促进、数字技能培训和社会连接增强等多维度策略;而在像墨西哥这样的特定文化背景下,需要特别关注性别平等的政策与项目,以缓解性别相关的压力源。研究为全球范围内制定公平、有效的老年抑郁症状干预策略提供了严谨的、基于证据的决策依据。

研究亮点 本研究的亮点主要体现在以下几个方面:1. 方法学的创新性与整合性:成功将高性能的机器学习预测模型(XGBoost/LightGBM)与前沿的可解释性框架(SHAP)相结合,既保证了预测准确性,又破解了“黑箱”难题,使复杂模型的决策过程变得可理解、可解释。2. 研究视角的跨国家与异质性聚焦:同时分析来自欧美亚拉五大洲的五个具有代表性的大型老龄化队列,实现了真正的跨国比较;并突破性地将收入与性别作为核心分层变量进行异质性分析,深刻揭示了抑郁风险的社会经济梯度与性别分化模式。3. 核心发现的普适性与特异性并存:不仅确认了自评健康这一跨文化强预测因子的核心地位,还敏锐地捕捉到了如MHAS队列中性别因素的首要性等重要文化特异性发现,强调了情境化理解的重要性。4. 向精准公共卫生的明确导向:整个研究的设计、分析与结论都紧密围绕如何为不同特征的亚人群制定精准干预策略这一最终目标,具有明确的转化医学和公共卫生政策意涵。

其他有价值内容 此外,论文也坦诚地讨论了本研究的局限性,主要包括:横断面设计限制了因果推断;仅纳入个体层面变量,缺乏医疗可及性、家庭动态、社会政策等 contextual 因素;各国社会保障体系差异导致结构变量难以协调,限制了更深入的跨国比较。这些局限也为未来研究指明了方向,例如采用纵向设计追踪风险轨迹,以及整合更广泛的多层次数据以构建更全面的风险模型。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com