心力衰竭(Heart Failure, HF)在全球范围内造成了巨大的健康负担,其高发病率、高死亡率和高昂的医疗费用使得准确的风险预测对于优化治疗、分配资源和患者咨询至关重要。在此背景下,Spyridon Skoularigkis、Christos Kourek等作者于2025年8月1日在《Journal of Personalized Medicine》上发表了题为“Prognostic Models in Heart Failure: Hope or Hype?”的综述文章。本文旨在对急性和慢性心力衰竭领域现有的预后模型进行全面的批判性评估,探讨其优势、局限性以及在真实世界临床实践中的应用前景,并展望未来的发展方向。
本文首先概述了心力衰竭的全球流行现状及其复杂性,强调了在不同表型(如射血分数降低的心衰HFrEF和射血分数保留的心衰HFpEF)中进行准确预后分层的必要性。预后模型通过整合临床、生物标志物和影像学数据,旨在为个体化治疗、资源分配和患者咨询提供支持。文章随后系统性地回顾了预后模型的开发方法、评估指标(如区分度与校准度),并将其分为基于临床评分、生物标志物、影像学以及人工智能/机器学习(AI/ML)等不同类型。
急性心力衰竭的预后模型 在急性心力衰竭部分,文章重点介绍了几种关键的预后工具。急性失代偿性心力衰竭国家注册(ADHERE)风险树是最早广泛使用的模型之一,它基于血尿素氮(BUN)、收缩压和血清肌酐对患者进行分类,用于快速预测院内死亡率。其优势在于简单易用,但局限性在于仅适用于院内预后,且外部验证有限。急诊心力衰竭死亡风险分级(EHMRG)模型则专为急诊室环境设计,用于预测7天和30天死亡率。该模型纳入了年龄、心率、收缩压、肌酐、血氧饱和度和肌钙蛋白等变量,并在大型前瞻性研究中显示出优异的区分能力(C统计量高达0.81),能有效识别极低风险和高风险患者。STRATIFY决策工具则是首个旨在识别急诊室中30天内发生不良事件(如死亡、急性冠脉综合征等)低风险患者的模型,其阴性预测价值高,有助于安全地减少不必要的住院。Get with the Guidelines–Heart Failure(GWTG-HF)风险评分来源于美国大型注册研究,包含年龄、收缩压、心率等七个变量,对HFrEF和HFpEF患者均显示出良好的院内死亡率预测能力。拉里萨心力衰竭风险评分(LHFRS)是一个简化工具,仅使用高血压病史、心肌梗死病史和入院时红细胞分布宽度(RDW)三个变量,在国际队列中验证了其对1年死亡率和再住院风险的预测价值。文章指出,RDW本身作为一个易于获取的生物标志物,其升高与全身性炎症、氧化应激等有关,是急性心衰不良预后的独立预测因子。
这些急性心衰模型的共同优势在于使用简单、可床边应用,能快速进行风险分层以指导临床决策,如是否需要重症监护或可早期出院。然而,它们也存在显著局限:多数模型基于单一国家(尤其是北美或欧洲)的队列开发,普遍适用性存疑;多为静态模型,无法纳入住院期间病情动态变化的数据;且大多未整合新型生物标志物或电子健康记录(EHR)的实时数据流。文章认为,EHMRG和GWTG-HF是其中经过严格验证、可重复性较好的模型。
慢性心力衰竭的预后模型 对于慢性心力衰竭,文章回顾了多个用于长期风险预测的模型。MAGGIC(慢性心力衰竭荟萃分析全球工作组)风险评分是应用最广泛的工具之一,它基于13个常规临床变量(如年龄、NYHA分级、LVEF)来估计1年和3年死亡率风险。该模型简单易用,且在HFrEF和HFpEF患者中均显示出可靠的预测性能,但缺乏对动态变化和新型生物标志物的整合。GISSI-HF风险评分源自意大利的大型队列,包含了12个最强的预测因子,如年龄、NYHA分级、eGFR、LVEF等,其简化版本保持了良好的区分度(C统计量约0.75)。CHARM风险评分源自大型临床试验,其独特之处在于涵盖了全谱LVEF的患者,识别了21个独立预测因子,对全因死亡率和心衰住院复合终点均有良好的区分能力。
西雅图心力衰竭模型(SHFM)是一个多变量工具,可估计1-3年生存率,其独特优势在于能够模拟启动或强化某种治疗(如药物、ICD、CRT)对个体预后的潜在生存获益,但模型较为复杂,且在HFpEF中的应用有限。巴塞罗那生物标志物心力衰竭风险计算器(BCN Bio-HF)代表了更现代的模型,它整合了常规临床变量与新兴生物标志物,如NT-proBNP、高敏肌钙蛋白T和sST2,并考虑了ARNI、ICD/CRT等现代治疗的影响,在预测2年死亡率和心衰住院方面表现出色(C统计量分别达0.83和0.79)。COACH风险引擎采用多状态模型方法,模拟患者在不同临床状态(如稳定、住院、死亡)间的转换,提供了对生存和再住院风险的动态、纵向评估,方法学上更为先进。此外,LHFRS也被证明在慢性心衰门诊患者中具有预后效用。
文章特别指出,现有模型在HFpEF患者中的表现往往不如在HFrEF中理想。许多主流模型最初是基于HFrEF人群开发的,虽然MAGGIC等模型在HFpEF亚组中显示出中等性能,但区分度通常较低。目前,一些专门针对HFpEF的模型(如GWTG-HF评分、H2FPEF评分)或结合多组学、机器学习的方法正在探索中,但大多缺乏外部验证,尚未在临床实践中常规使用。
临床实践中的希望与炒作 文章的第四部分“临床实践中的希望与炒作?”对预后模型的现实应用进行了深入探讨。作者承认,这些模型通过提供结构化风险评估,确实增强了临床决策能力。在急性心衰中,它们有助于分诊和识别早期出院患者;在慢性心衰中,则指导长期管理、高级治疗选择和临终计划。然而,模型在真实世界的采纳率仍然有限。这主要归因于几个关键障碍:1)普遍适用性差:许多模型源于特定人群(如西方、临床试验人群),在HFpEF、共病患者、非西方人群中的外部验证不足。2)静态性:大多数模型依赖入院或基线数据,无法捕捉疾病进展或治疗反应带来的动态风险变化。SHFM和BCN Bio-HF等模型虽有所改进,但动态风险评估能力仍有待发展。3)整合不足:模型的复杂性、未嵌入电子健康记录系统以及临床医生对其不熟悉,阻碍了其在日常工作流程中的常规使用。4)可解释性问题:新兴的机器学习和人工智能模型虽然可能提高准确性,但其“黑箱”特性降低了临床医生的信任度和使用意愿。
作者强调,要提升模型的临床影响力,必须使其能够持续更新以反映当代治疗模式(如ARNI、SGLT2抑制剂),并需要跨不同人群和医疗系统进行广泛的外部验证。更重要的是,必须将模型无缝嵌入临床决策支持工具,通过用户中心设计和有效的患者风险沟通(如可视化工具、通俗语言总结)来提升参与度。
未来展望 文章最后展望了心力衰竭预后模型的未来发展方向。首先,模型需要利用反映当前治疗范式的当代队列进行重新校准。其次,必须进行跨不同人群和医疗系统的广泛外部验证。第三,推动模型与临床工作流程的深度整合至关重要,例如将其嵌入电子健康记录系统以实现数据自动填充和提供可操作的决策支持。第四,开发能够整合连续数据(如系列NT-proBNP水平、用药变化)的动态纵向模型,是实现更精准风险分层和监测治疗反应的关键前沿。第五,人工智能和机器学习方法在整合高维数据和识别复杂模式方面具有潜力,但需解决可解释性、过拟合和缺乏验证等问题,发展“可解释AI”和简化输出工具是赢得临床信任的必要条件。第六,精准医学时代将基因组学、蛋白质组学、代谢组学等多组学分析纳入风险分层策略,有望识别与疾病进展和治疗反应相关的新分子特征。第七,远程监测和可穿戴技术(如植入式传感器、智能手表)能够实时追踪生理参数,实现持续的风险评估和失代偿早期检测,从而将护理模式从被动反应转向主动预防。
结论与意义 本文的结论是,心力衰竭预后模型为临床决策提供了有价值的支持,但其临床效用常受限于普遍适用性差、依赖静态变量以及在实践中因复杂性和整合不足而使用率低。新兴技术(机器学习、多组学、远程监测)有望实现更动态和个性化的预测,但也带来了可解释性和公平性方面的挑战。为了实现其真正的影响力,预后模型必须经过持续验证、无缝嵌入医疗系统,并同时支持临床决策和患者参与。弥合开发与实施之间的差距需要多学科合作、强有力的验证以及对可用性、公平性和透明度的坚定承诺。在这个不断发展的领域中,预后模型代表着希望的途径,但要充分实现其潜力,就必须警惕炒作,并积极应对其局限性。
本文的价值在于为临床医生和研究者提供了一份关于心衰预后模型的全面、批判性的“路线图”。它不仅系统梳理了现有工具的优缺点和适用场景,还指出了当前临床应用的瓶颈和未来的创新方向。文章强调,模型的最终价值不仅在于预测准确性,更在于其在实际护理中的整合程度、对不同人群的公平性以及对医患共同决策的支持能力。这对于推动心力衰竭的个性化、精准化管理具有重要的指导意义。