健康寿命蛋白质组特征的开发与验证

一、学术背景:从寿命延长到健康寿命的增进

随着20世纪以来全球医疗和社会经济水平的提高,人类整体寿命(Lifespan)显著延长,尤其是在发展中国家。然而,健康寿命(Healthspan)——即个体在无重大慢性疾病和功能障碍、保持全面健康状态下生活的年限——却未能与寿命同步增长。这在全球范围内造成了“健康寿命缺口”(healthspan-lifespan gap),使越来越多的人口虽然生命得以延长,但晚年多伴随慢性疾病、残疾和功能丧失,造成巨大社会、经济和医疗负担。

面对这一挑战,抗衰老生物学领域出现了“老年医学科学”(Geroscience)研究范式。与以往仅聚焦单一疾病的防治不同,Geroscience强调同时针对影响衰老进程的核心生物学机制(如炎症、免疫失衡、代谢异常、细胞功能障碍等“衰老标志”hallmarks of aging)进行干预,希望能延缓全身多类慢性疾病的发生,从源头上延长健康寿命。

在相关研究的推动下,各类生物标志物(Biomarkers of aging)陆续被提出。这些标志物可用于测量衰老状态甚至预测疾病、死亡风险,包括临床生理参数、血液生化指标、组学特征(表观遗传、蛋白质组、代谢组等)和综合评分模型。然而,目前学界和医疗界主要聚焦于“寿命标志物”或死亡预测因子,直接反映健康寿命的生物标志物尚属空白。这主要因为健康寿命定义尚无统一标准,标志物开发需依赖长期大样本随访、收集健康个体直至各类结局的完整数据,难度远高于单纯预测寿命或单一疾病。

鉴于此,如何基于“健康寿命”的定义,开发可准确预测个体健康状态变化、用于跨人群、跨疾病、跨干预的“健康寿命生物标志物”,成为临床转化和抗衰老干预研究的关键挑战和前沿热点。

二、论文来源与作者背景

本文为一项原创性研究论文,题为《A proteomic signature of healthspan》,发表于美国国家科学院院刊(PNAS, Proceedings of the National Academy of Sciences)2025年第122卷第23期。该研究由Chia-Ling Kuo(第一作者及通讯作者,University of Connecticut Health Center)、Peiran Liu、Gabin Drouard、Eero Vuoksimaa、Jaakko Kaprio、Miina Ollikainen、Zhiduo Chen、Luke C. Pilling、Janice L. Atkins、Richard H. Fortinsky、George A. Kuchel及Breno S. Diniz等作者团队完成,涉及美国康涅狄格大学健康科学中心、芬兰赫尔辛基大学、英国埃克塞特大学等多家顶尖机构。

论文于2025年6月6日正式公开,属于PNAS“直接投稿”类别,获得国际学者Ana Maria Cuervo编辑。数据主要源自英国生物银行(UK Biobank)和芬兰双生子队列(Finnish Twin Cohort),Proteomics测定采用Olink Explore 3072高通量蛋白质组平台,研究设计严谨、样本量巨大、技术路线创新,具有突出的学术价值和广泛的转化前景。

三、研究设计与方法流程详述

1. 研究目的与总体设计

本研究旨在开发一种基于蛋白质组的大规模生物标志物——健康寿命蛋白质组评分(Healthspan Proteomic Score, HPS),以准确预测个体健康寿命(即首次发生包括癌症、糖尿病、心衰、心肌梗死、中风、慢性阻塞性肺疾病、痴呆或死亡等重大健康事件前的岁月数),并系统验证其预测性能在不同人群、不同健康结局及不同测量指标下的有效性与临床应用价值。

具体设计包括:

  • 以UK Biobank(UKB)Pharma Proteomics Project(PPP)大队列为基础开发HPS模型;
  • 利用独立子样本、芬兰“Essential Hypertension Epigenetics Study”外部队列等多重队列进行交叉、外部验证;
  • 采用横断面及随访数据、多层次对比各种蛋白、表观遗传等生物年龄相关打分模型;
  • 关联蛋白水平、临床健康指标及各类重大结局,揭示其潜在生物学机制。

2. 主要实验流程与步骤

(1)样本来源及基本特征

  • UKB PPP Cohort:筛选并纳入53,018名UKB活跃参与者(2006-2010年招募,40-70岁),其中43,119人在研究基线时未诊断健康寿命定义内的重大疾病,被作为主要研究对象,随机分为70%的训练集(30,184人)和30%的测试集(12,935人)。
  • 蛋白组测定:利用Olink Explore 3072平台,测量UKB样本血浆中2923种蛋白质的表达,涵盖心血管、炎症、神经、肿瘤等多个功能系统,数据遵循严格的批次校正及缺失值插补(K=10的KNN法)。

(2)HPS开发与建模过程

  1. 健康寿命定义的确立
    参照前沿研究,作者将健康寿命定义为个体出生至首次确诊下列任一疾病:恶性肿瘤(不含非黑色素瘤皮肤癌)、糖尿病(I型/II型/营养不良型)、心衰、心肌梗死、中风、慢性阻塞性肺疾病、痴呆、或死亡。

  2. 特征选择与模型建立

    • 首先,通过LASSO(最小绝对收缩与选择算子)Cox回归模型,在2,920个蛋白质和年龄中筛选最具预测力的变量,严控模型复杂度,最终保留86种蛋白质和年龄指标,总模型完整保留接近最优偏差。
    • 在此基础上组装Gompertz生存模型,计算各样本未来10年内首次发生上述事件的概率(风险Rh),以1-Rh定义HPS——分值越低表示风险越高。
  3. 训练-测试与交叉验证

    • 用训练集开发模型,用测试集独立评估性能,包括与多种生物年龄评分(如Proteomic Aging Clock, PAC,PhenoAge,BioAge,Protage-EN等)和表型指标对比,检验模型在多种疾病、死亡等结局的预测力和泛化性。

(3)主要数据分析与统计方法

  • 采用Spearman相关系数、Wilcoxon秩和检验、Aalen加法风险模型、Harrell’s C统计量等多重统计方案。
  • 除标准年龄、性别、种族、受教育程度等,进一步矫正BMI、吸烟状况、高血压、高胆固醇、就业背景、样本集构成等多层协变量,力求降低混杂影响。
  • 多重比较采用FDR(Benjamini-Hochberg方法)严谨控制假阳性。
  • 所有蛋白信号均做归一化、逆正态变换,生物信息学分析则结合FUMA等工具进行通路富集和功能注释。

(4)外部验证

  • 采用芬兰Essential Hypertension Epigenetics Study数据,纳入401名芬兰双生子队列样本(血压表型、死亡结局、中长期随访、蛋白组与表观遗传数据齐备),系统评估HPS在其它欧洲队列的适用性和扩展性,并与DNA甲基化、代谢组等多维度生物年龄指标直接对比。

3. 主要实验结果与逻辑递进

(1)健康寿命结局与样本表型

  • 在UKB PPP训练-测试大队列中,约28.8%的无基线重大疾病参与者在13.5年随访期内首次发生健康寿命定义内事件,癌症、心梗、糖尿病、COPD等为主要首发病因,首次发病年龄均值约66.7岁。
  • 按HPS分组,各类慢病患者或风险人群(男性、老年、吸烟者、肥胖者、高血压或高胆固醇患者)在基线时HPS分值显著低于其他人群,显示生物年龄分型的区分度和疾病早期生物学改变的敏感性。

(2)HPS与生物年龄、临床结局的关联

  • HPS与实际年龄呈中等负相关(r = -0.73),与PAC等蛋白组时钟(r = -0.87)、表型年龄分(如PhenoAge、BioAge)(r = -0.79、-0.74)呈密切负相关;与表型虚弱指数(frailty index)弱负相关。
  • 多变量回归及生存分析表明:HPS分值越低,未来10年内首次发生主要慢病或死亡风险显著升高——每减少0.1分,对应增加1600起新病例/10万人年。低HPS组在各类单病种、总体死亡、癌症分型等多重健康结局事件中表现出更差的生存/健康预后(如Kaplan-Meier生存曲线显著分离,HR为每0.1单位下降,死亡风险增加55%)。

(3)蛋白质组生物学机制与HPS逻辑支持

  • 统计学筛选出HPS低分组特异上调或下调的蛋白质(累计1398个,Bonferroni校正后),在免疫反应、炎症反应、细胞信号转导、代谢调控等26个hallmark通路高度富集,强化了蛋白组与衰老生物学之间的实质联系。
  • 与PAC等传统寿命时钟直接对比下,HPS在多种器官相关慢病、死亡、多个健康结局预测上具有更优或相当的分辨力,并且二者结合可获得更强的预测效能和更广泛的适用性。

(4)外部验证与泛化性能

  • 芬兰EH-EPI队列中,HPS分值与死亡、糖尿病、代谢组标志物等健康结局显著相关,评分低者死亡率更高,表现稳定;与DNA甲基化时钟、其他蛋白组学指标同时验证,HPS显示更强或相当的前瞻性生物预测力,具备在不同族群应用的潜力。

(5)联合与交互作用分析

  • 进一步探索发现,HPS低+PAC高的个体属于“最差生物学衰老分组”,介于健康人(HPS高+PAC低)与单指标准分者之间。联合分型可优选出虽然临床尚健康、但已出现显著系统生物学不良改变的高风险人群,有助于靶向预防性老年干预。

四、研究结论、科学价值与应用前景

1. 主要结论

  • HPS作为一种健康寿命蛋白组学评分,能够精准预测健康中青年群体未来主要慢性疾病或死亡(健康寿命终止)风险,在多种亚组(年龄、性别、吸烟、肥胖、基线慢病)均表现优良分型能力。
  • HPS反映了全身系统级别的生物衰老状态(systemic biological aging),并捕捉到了衰老标志相关的功能障碍进程,而非单一器官或单一危险事件。
  • HPS不仅与传统蛋白组、表观遗传等“寿命分”相关,也能独立提供新的健康风险分层维度;多 measures 联用将增强健康结局预测和精准医学分型能力。
  • 应用HPS将极大推动抗衰老干预的人群筛查、效果评估、临床试验结局替代,缩短随访周期,提高试验效率,推动Geroscience在临床转化和健康老龄社会建设中的落地。

2. 科学及应用意义

  • 科学价值:填补了健康寿命生物标志物空白,为健康老龄社会和全生命周期慢病防控提供了新型精准工具,推动蛋白组学与老年医学的深度融合。
  • 应用前景:HPS可作为新一代生物年龄测量工具,被用于疾病风险评估、高风险人群筛查、干预效果监控、药物研发、保险及公共卫生政策制定等多元场景,极具临床与产业转化潜力。

五、研究亮点与创新点

  • 首次基于大样本人群纵向随访,严格定义健康寿命生物结局结构性开发蛋白组评分模型,填补国际空白。
  • 模型涵盖广泛蛋白组信号,富集于衰老相关的炎症、免疫、信号通路等通用通路,揭示了慢病共性生物学机制。
  • 样本量巨、数据多维,横跨英、芬不同族群和样本源;具备良好泛化和外部扩展能力。
  • 与前沿蛋白组、表观遗传等多种生物年龄模型直接对比,优劣分析系统,带来极高技术可靠性与权威性。
  • 联合多分型实现更精准生物健康分层,为个体化抗衰老干预及早筛查、精准治疗带来现实科学依据。

六、其他信息与未来展望

  • 模型代码、分析流程开源托管于github,可供学界自由下载与拓展。
  • 研究作者及团队为国际一流老年医学、蛋白组学、人口队列研究者,项目获得英国、芬兰、美国等国家顶尖科学基金与医疗研究资助,权威性高。
  • 研究中对健康寿命定义亦进行了限制性讨论,承认电子病历资料较难纳入所有慢性功能障碍,但实际模型预测主流常见健康结局,已具广泛应用适应性。
  • 未来需进一步在多种族、多年龄、更广泛医疗数据人群中验证HPS评分临床转化价值,推动国际健康老龄政策和精准医学研究落地。

七、结语

该项研究作为健康寿命领域的开创性蛋白组学探索,不仅推动了生物年龄精准分类和“从实验室到床边”的临床转化,也为全球老龄化社会背景下的“延长健康寿命”目标建设提供了坚实的基础性科学工具。HPS及其衍生结合策略,有望指引未来抗衰老干预、慢病预防、健康政策制定等诸多创新方向,奠定了新时代精准健康管理的理论和技术基石。