分享自:

大规模血浆蛋白质组学改善2型糖尿病患者外周动脉疾病的预测:一项前瞻性队列研究

期刊:Diabetes CareDOI:https://doi.org/10.2337/dc24-1696

研究报告:通过大规模血浆蛋白质组学提高2型糖尿病患者外周动脉疾病的预测能力

一、研究作者和发布信息

这项研究由来自中国华中科技大学同济医学院、波士顿大学、牛津大学等机构的作者完成,包括Hancheng Yu、Jijuan Zhang、Frank Qian、Gang Liu等人。这篇文章题为《large-scale plasma proteomics improves prediction of peripheral artery disease in individuals with type 2 diabetes: a prospective cohort study》,发表于《Diabetes Care》期刊的2025年第48卷第2期,并附有DOI标识(https://doi.org/10.2337/dc24-1696)。


二、研究背景

本研究所在的科学领域为血浆蛋白质组学与外周动脉疾病(Peripheral Artery Disease,PAD)的风险预测,其特别关注2型糖尿病(Type 2 Diabetes,T2D)患者。尽管PAD是T2D患者中一种严重的并发症,但目前关于血浆蛋白质组学与PAD之间的关系尚不明确。此外,早期识别PAD高风险个体对改善患者的长期健康结局至关重要。

之前的研究已发现了一些与PAD风险相关的循环蛋白(例如,Apolipoprotein A-IV和ACE2),但这些研究多局限于小样本或横断面设计,参与的蛋白数量有限。在这种背景下,本研究旨在通过大规模血浆蛋白质组学探索2型糖尿病患者中蛋白质与PAD风险的关联,同时评估血浆蛋白是否能够改善PAD风险预测模型的性能。

本研究的目标具体包括: 1. 探究T2D患者血浆蛋白与PAD的关系。 2. 评估PAD相关蛋白能否提高PAD风险预测能力。


三、研究方法与流程

本研究基于英国UK Biobank的队列数据,采用了多步骤的研究设计和数据分析流程。以下是具体流程和方法:

1. 研究对象的选择
  • 样本来源:UK Biobank,包括超过50万名参与者。
  • 筛选流程:起初选定了24,021名确诊为T2D的参与者,并逐步排除以下个体:
    • 没有血浆蛋白数据(n=21,294)。
    • 基线即已患有PAD的患者(n=81)。
    • 报告在行走时出现腿痛(可能提示PAD症状,n=414)。
    • 测量的蛋白中缺失值超过30%的参与者(n=373)。
  • 最终样本量:1,859名T2D患者。
2. PAD事件的确认

通过链接住院和死亡登记记录,并使用国际疾病分类代码(ICD-10)识别随访期间的PAD事件。研究中的PAD定义包括E11.5, I70-I72, I73.9等相关编码。

3. 蛋白质组学数据
  • 检测技术:使用Olink Explore 3072平台对血浆样品进行蛋白量化,覆盖了2,941种蛋白分析物,最终纳入2,920种蛋白。
  • 数据处理:剔除了缺失值超过30%的蛋白测量,将其余数据标准化为z分数。
4. 协变量与其他变量的测量

收集了参与者的基线特征,包括人口统计学指标(例如年龄、性别、种族)、生活方式(例如吸烟状态、饮酒、身体活动)、临床生物标志物(例如BMI、HbA1c、eGFR、HDL水平)和药物使用等。

5. 数据分析
  • 关联分析:采用Cox多变量回归模型分析每一种蛋白与PAD风险的关联,校正了多项混杂因素。
  • 变量选择:利用LASSO回归从显著相关蛋白中选择最具预测价值的蛋白。
  • 建模与验证:将选定蛋白与临床变量结合,开发三种预测模型:仅使用临床变量的模型(Clinical Model)、结合蛋白和临床变量的模型(Protein-Clinical Model)以及包含加权蛋白风险评分的模型(PRS-Clinical Model)。使用时间依赖ROC曲线、C-指数等评估模型性能。
  • 敏感性分析:通过排除特定病例、调整基线变量等多维度确保分析的稳健性。

四、主要研究结果

1. 与PAD风险相关的蛋白
  • 在2,920种蛋白中,研究发现463种蛋白与PAD风险显著相关,其中439种正相关,24种负相关。
  • PAD风险增加的前五种蛋白(按显著性排序):EDA2R、ADM、NPPB、CD302和NPC2。
  • PAD风险降低的前五种蛋白:BCAN、UMOD、PLB1、CA6和KLK3。
2. 蛋白相关通路的富集分析

通过基因功能富集分析(Gene Ontology)和Kyoto基因与基因组百科全书(KEGG)分析发现,相关蛋白主要参与信号转导、细胞因子-受体相互作用和炎症反应等生物过程。

3. 风险预测模型的表现
  • 临床模型的C-指数为0.664。
  • 将LASSO选择的45种蛋白加入后的Protein-Clinical模型的C-指数显著提高至0.826。
  • 加入PRS的PRS-Clinical模型进一步提高至0.835。
4. 预测性能增益

在5年、10年和15年的预测时间段中,Protein-Clinical模型和PRS-Clinical模型的AUC均显著高于仅使用临床变量的模型。例如,5年AUC增益分别为0.194和0.200。


五、研究结论

  1. 本研究通过大规模血浆蛋白质组学分析,确定了多个与PAD风险相关的循环蛋白,并揭示了其潜在的生物学功能。
  2. 在基于临床变量的传统预测模型基础上加入蛋白质组数据可显著增强PAD的预测性能。
  3. 研究建议未来利用血浆蛋白质组学技术,可更有效识别2型糖尿病患者中PAD高风险个体,为早期干预提供科学依据。

六、研究亮点与意义

  1. 大规模蛋白质组学数据:覆盖了超过2,900种血浆蛋白,是目前关于PAD预测研究中数据量最大的之一。
  2. 方法学创新:使用LASSO算法筛选预测变量,将蛋白质组学与传统临床指标有效结合。
  3. 临床与公共卫生意义:优化和改进PAD的预测和筛查策略,为个体化治疗与资源分配提供新工具。

七、研究局限性

尽管研究具备严谨的设计,仍有一些限制需注意: 1. 结果未通过外部数据集验证。 2. UK Biobank样本以欧洲裔为主,推广至其他种族或地区需谨慎。 3. 未包含一些可能影响PAD风险的重要变量(例如血管僵硬),可能低估了模型能力。

本研究为理解PAD风险的蛋白质组学基础提供了重要信息,并提升了临床预测能力,具有重要的科学和应用价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com