大规模血浆蛋白组学揭示阿尔茨海默病的诊断生物标志物和通路
一、研究背景与学术意义
阿尔茨海默病(Alzheimer’s disease, AD)作为全球范围内老年痴呆症发病率最高的类型,约占全部痴呆症患者的60%—80%。其主要发病群体为65岁以上人群,特征性病理改变包括淀粉样蛋白β(amyloid-β)斑块的沉积、神经纤维缠结以及广泛的神经元丧失。虽然近年来神经影像、脑脊液检测及基因组学为AD的研究带来诸多进展,但AD的早期诊断与疾病进程的客观监测仍受限于侵入性检测方式(如脑脊液穿刺或脑部PET成像)以及有限的生物标志物储备。血浆由于采集简便、患者依从性高,被视为未来AD无创诊断与动态监测的理想基体。但既往基于血浆的蛋白质组学研究样本量普遍较小,且检出蛋白数有限,掣肘了血浆生物标志物的系统性发现和验证。
此前的多项学者研究(如Walker等人、Sung等人、Guo等人)虽然均采用了蛋白质组学思路探索AD相关血浆蛋白,但多数纳入AD或痴呆患者仅数百例,且分析蛋白种类有限,导致发现的生物标志物数量有限且外部验证不足。基于这些不足,迫切需要开展大规模、系统性并配有严谨外部验证的数据研究,以揭示更丰富、稳健的血浆蛋白分子图谱,助力AD的早筛、诊断和病程追踪。
二、论文来源与研究团队介绍
本研究发表于2025年6月的《Nature Aging》,DOI: https://doi.org/10.1038/s43587-025-00872-8。研究主要由Washington University in St. Louis的Knight Alzheimer Disease Research Center合作多个中心完成,通讯作者为cruchagac@wustl.edu,研究团队汇聚了神经退行性疾病、蛋白质组学和机器学习等领域的多学科专家。该成果不仅由美国知名神经退行性疾病临床队列支持,还联合了多个国际合作数据集,是迄今最大规模的AD血浆蛋白组学研究之一。
三、研究设计、实验流程与技术创新
1. 三阶段研究设计与样本采集
(1)阶段一:发现阶段(Discovery)
- 数据来源:Knight ADRC队列,2,131份血浆样本。
- 病例构成:1,381名认知正常对照(CO),750名临床诊断AD患者。
- 检测平台:SomaScan 7k平台,覆盖6,905个蛋白分子(对应6,106种独特蛋白)。
(2)阶段二:复制与元分析阶段(Replication & Meta-analysis)
- 复制样本:Knight ADRC及Stanford ADRC联合队列,共1,235份血浆(715对照+520 AD)。
- 目的:对第一阶段筛选出的候选蛋白进行方向一致性和统计验证。仅经多重检验校正(FDR)并在两个队列均达名义显著水平(p<0.05)的蛋白分子进入下轮。
(3)阶段三:外部大队列验证及横向比较
- 数据集一:ROSMAP(Religious Orders Study + Rush Memory and Aging Project),外部样本322例AD、150名对照。
- 数据集二:Global Neurodegeneration Proteomics Consortium (GNPC),外部样本1,733名AD、4,833名对照。
- 研究还将发现新蛋白与往期六项血浆及三项脑脊液(CSF)蛋白质组学研究进行了全方位对比,验证特异性和共通性。
2. 关键实验与数据分析流程
- 蛋白绝对含量定量:采用高通量SomaScan 7k蛋白芯片,用寡聚核苷酸适配体识别并定量血浆蛋白。
- 统计与机器学习分析:
- 采用多元线性回归筛查蛋白显著性(临床诊断与蛋白水平关联)。
- 逻辑回归(logistic regression)与Cox比例风险模型评估蛋白与AD进展速度关联。
- 整合机器学习模型(如支持向量机、随机森林、Lasso回归等)筛选高预测价值蛋白,训练AD预测分类器,并在独立队列及不同平台(如Olink、Alamar)交互验证。
- 进阶分析:
- 新旧生物标志物分类统计。
- 路径富集分析(如KEGG、GO、Reactome等数据库)系统性解析蛋白组学异常背后的分子功能网络。
- 临床亚群/共病对标实验,分别测试对路易体痴呆(DLB)、额颞叶痴呆(FTD)、帕金森病(PD)的区分能力。
四、主要研究结果详述
1. 首轮筛选及复验证明
- 首轮在2,131份样本中,检测6,905蛋白分子,共发现1,540个蛋白(对应1,646个适配体)与临床AD诊断相关。
- 经过第二轮复制后,得到416个蛋白(456个适配体)在两个队列方向一致且p<0.05,且经FDR多重校正后依然显著。
- 根据蛋白水平分组(最高与最低三分位数),正向相关蛋白的AD风险比均值为1.50,负向相关为0.72,少数蛋白最大OR高达3.58,生物学效应显著。
2. 外部大队列和过往研究交互验证
- 在ROSMAP和GNPC外部队列中,有99%(453/456)适配体可覆盖,78%(353/456)方向一致,77%名义显著(p<0.05),74%(333/456)多重校正后依然显著(相关系数r=0.675)。
- 与以往六项血浆研究和三项CSF研究系统比对,发现新鉴定的416蛋白中仅52个(16%)在以往研究也多重显著,212个为以往未报道(主要受样本规模和分析深度制约)。
3. 跨体液蛋白组学对比:血浆与脑脊液信号异同
- 与最新一项CSF大队列蛋白质组研究(n=2,286)交叉验证,血浆416蛋白有445个在CSF中也可检测到,但多重检验下只有174个在CSF与AD相关,且排名靠前的血浆蛋白(如SPC25、CTF1、ACHE)在CSF中亦为显著标志物,但大部分CSF显著蛋白(如YWHAG、TMOD2等)未在血浆中发现信号。
- 仅约8%的CSF-AD相关蛋白也在血浆中呈正相关,提示两种体液的蛋白分子失调具有独立或补充的机制学指征,不同的标志物集合帮助理解疾病全貌。
4. AD进展相关危险蛋白与时间分析
- 纳入761例纵向随访样本(平均随访3.5年),共625个蛋白与临床AD进展名义相关(p<0.05)。
- 在416个与诊断相关蛋白中,20个与AD进展亦方向一致,进一步确定了这些分子既能反映当前诊断,也可能预示疾病动力学过程。其中MIA和COL10A1两个蛋白方向相反,说明部分蛋白参与疾病保护或代偿。
5. 路径富集与分子网络揭示AD保守与新颖机制
- 富集分析表明:显著蛋白主要涉及五大方面:①脂质代谢(如APOE、CLU等核心调控蛋白首次多重显著);②免疫与止血(如补体通路、血小板活化);③细胞外基质与血脑屏障;④神经元活动与神经系统指征(如轴突引导、髓鞘形成、突触发生和神经递质GABA/Dopamine系统);⑤广义代谢途径。
- 多条信号通路(如14-3-3媒介、FoxO转录调控、GPVI级联)首次在大规模血浆中明确指向AD失调,扩展了对其疾病基础机制的认识。
- 大量蛋白如SMOC1、SPAR等未在血浆或CSF先前报道,为后续致病分子功能研究与药物靶点开发提供丰富线索。
6. 机器学习高预测模型及异病区分性能
- 通过机器学习模型筛选出7个蛋白组合后,分类AD的AUC高于0.72,分辨生物标志物定义AD的AUC高达0.88。模型在ROSMAP、GNPC队列及异构平台(Olink、Alamar)交叉验证均表现优异。
- 同时该模型对路易体痴呆、额颞叶痴呆及帕金森病呈现特异性区分能力,提示血浆蛋白图谱可作为神经退行性疾病之间的鉴别诊断新工具。
五、结论及学术与应用价值
本项研究系统性地绘制了迄今最大规模的血浆-AD蛋白组学分子图谱,为早期AD筛查、无创诊断、疾病进展评估与新靶点发现提供坚实数据及理论基础。
- 科学意义:该研究首次在超大体量队列及多平台多中心验证下,明确提出大量新型AD血浆蛋白标志物及多条全新相关生物学通路,为AD的发病机制研究和蛋白质组标志物的跨体液比较奠定基石。
- 应用价值:血浆蛋白图谱具备转化前景,可推动开发新型AD早筛或动态监测检测试剂盒,提高患者获益概率,亦有助于精准医疗和药物开发。
- 方法创新:采用高通量SomaScan、机器学习算法、富集分析及多中心大数据验证模式,显著提升了研究发现的稳健性和临床推广潜力。
- 亮点小结:大规模、多中心、跨体液、机器学习筛选、外部队列多重验证、丰富新生物标志物和机制学发现,是本研究最大特色和学术贡献。
六、研究展望与潜在影响
随着血浆蛋白质组测序技术与生物信息学的发展,该类大样本队列、系统验证的研究有望不断推动AD无创诊断的实用化,并为多种神经退行性疾病的临床分型、个体化管理开启新篇章。此项研究也提供了蛋白组学和人工智能在医学转化领域深度耦合范例,为未来精准医学研究树立了范本。