本文献发表于《The Lancet Haematology》期刊,于2023年8月18日在线出版,题为《Measuring chronic myeloid leukaemia TKI-related toxic effects in the real world: a systematic review and critical assessment of content validity of patient-reported outcome measures》。主要作者Yolba Smit、Sanne J.J.P.M. Metsemakers、Jeroen J.W.M. Janssen等均来自荷兰奈梅亨的Radboud大学医学中心血液科及其他相关部门,合作者还包括来自荷兰莱顿大学医学中心和代尔夫特Reinier de Graaf医院的研究人员。这篇论文是一篇系统性综述,旨在系统性地识别并严格评估用于评估慢性髓系白血病患者报告的治疗相关毒性(尤其是酪氨酸激酶抑制剂相关毒性)的患者报告结局测量工具的内容效度。
随着慢性髓系白血病治疗进入以长期口服酪氨酸激酶抑制剂为标准的时代,患者的生存期已得到极大保障,治疗的重心逐渐转向管理与预防靶向治疗带来的症状和并发症。这些TKI虽然能挽救生命,但会引发大量且持久的毒性效应,显著影响患者的生活质量。然而,目前关于TKI毒性效应的认知存在重大缺口:临床试验中严重依赖医生报告的不良事件,其报告系统是为短期化疗设计的,往往低估了患者实际经历的症状发生率和严重程度;且绝大多数白血病临床试验并未将患者报告结局作为研究终点。因此,获取真实世界中患者自我报告的症状负担数据,对于改善临床护理、指导治疗决策、填补知识空白至关重要。要收集可靠的患者报告毒性数据,临床医生和研究人员需要知道有哪些可用的PROM工具,并能够评估这些工具的质量。本研究正是为了回应这一需求,通过系统性综述,识别相关PROM工具,并依据国际公认的COSMIN标准,对其内容效度进行批判性评估,同时描述其可行性特征。
论文首先明确了系统性综述的研究方法与流程。研究团队遵循PRISMA 2020指南,系统检索了PubMed和Embase数据库(2017年1月1日至2022年10月21日),并补充检索了11个专门的PROM工具网站以及相关综述和文章的参考文献。纳入标准包括:评估患者症状的自评工具;工具可获取;工具专为或在慢性期CML患者(使用TKI)中经过验证。排除仅关注单一症状类别(如抑郁)的工具。经过严格的筛选,从10,623篇文献和11个网站中,最终确定了6个部分用于评估CML患者症状的PROM工具。研究的核心是使用COSMIN风险评估清单的Excel模板,对这6个工具的内容效度质量进行独立、双盲评估。内容效度涵盖三个方面:相关性(所有项目均与目标构念相关)、全面性(未遗漏构念的关键方面)、可理解性(患者能按设计意图理解项目)。评估流程分为三步:第一步,根据已有研究评估PROM开发过程的质量;第二步,评估其内容效度研究的质量;第三步,基于前两步的结果,结合评审者自身的评估,对工具的总体内容效度进行评级,并对证据质量进行GRADE分级。所有评估均由两名评审员独立完成,分歧通过讨论解决。
论文详细阐述了此次系统性综述的主要发现。首先,研究识别出的六个PROM工具包括:欧洲癌症研究与治疗组织慢性髓系白血病24项核心生活质量问卷(EORTC QLQ-CML24)、EORTC症状集(EORTC Symptom Set)、癌症治疗功能评估-白血病量表(FACT-Leu)、一份中文通用问卷(Generic Chinese questionnaire)、血液恶性肿瘤患者报告结局(HM-PRO)以及MD安德森癌症中心慢性髓系白血病症状评估量表(MDASI-CML)。这些工具共涵盖了90个症状集群,其中47个项目在不同工具间存在重叠,43个项目为某个工具所独有。各工具在症状覆盖的详细程度上各有侧重,例如EORTC症状集对皮肤和眼部问题有最详细的询问,但缺乏脱发和恶心项目;FACT-Leu未评估眼、口、关节和肌肉问题;中文问卷包含了六个性健康项目以及毛发颜色改变、胸腹水等独特项目,但未涉及口腔、味觉或消化不良问题;HM-PRO和MDASI-CML则均遗漏了眼部问题和肌肉痉挛等关键TKI副作用。
随后,论文报告了基于COSMIN标准的内容效度评估结果。在开发质量方面,没有一个工具被评为“很好”或“充分”。三个工具(EORTC QLQ-CML24、EORTC症状集和MDASI-CML)被评为“可疑”,主要因为构念来源、使用情境、访谈员是否受训、数据分析方法或数据编码独立性等方面信息不明确。另外三个工具(FACT-Leu、中文通用问卷和HM-PRO)被评为“不充分”,原因包括开发样本不能代表目标人群、未在目标人群中进行认知访谈、或未评估可理解性与全面性。在内容效度研究质量方面,同样没有工具获得“很好”或“充分”的评级。HM-PRO和MDASI-CML被评为“可疑”,而其他四个工具因未邀请独立于开发阶段之外的专业人员评估项目相关性和全面性而被评为“不充分”。
综合以上评估和评审者判断,论文得出了总体内容效度评级。结果显示,六个工具中没有一个被评为“充分”。五个工具(EORTC QLQ-CML24、EORTC症状集、FACT-Leu、HM-PRO和MDASI-CML)的总体内容效度被评为“不一致”。导致评级不一致的原因各不相同:EORTC QLQ-CML24、FACT-Leu和MDASI-CML因其并非所有项目都与“症状负担”这一构念直接相关(例如包含生活质量项目);EORTC QLQ-CML24、EORTC症状集和FACT-Leu未在独立于开发组之外的不同群体中评估全面性;评审者认为HM-PRO和MDASI-CML在全面性上“不充分”,因为它们遗漏了眼部问题和肌肉痉挛等CML患者的关键症状;而EORTC症状集则因其部分项目来源于实体瘤患者,被认为并非全部与CML患者相关。支持这些评级证据的质量从“中等”(MDASI-CML)到“低”(其余四个工具)不等。唯一的中文通用问卷被评为“不充分”,且证据质量“极低”,主要因其开发研究质量不充分且缺乏内容效度研究。评审者评估认为,两个EORTC工具是唯一在全面性上被评为“充分”的工具,但它们均因上述相关性原因被评为“不一致”。
在讨论部分,论文深入分析了研究发现的意义与未来方向。作者指出,选择评估TKI治疗毒性的PROM工具时,需同时考虑内容效度和使用情境下的可行性。遗憾的是,现有工具均未达到内容效度“充分”的标准,一个主要缺陷是缺乏在独立于开发阶段之外的患者或临床医生样本中对全面性的评估。在五个“不一致”的工具中,两个EORTC工具在全面性上表现最佳,覆盖了关键的TKI特异性副作用(如眼部问题、肌肉痉挛),但因其项目来源混杂或包含非症状负担核心的生活质量项目,在相关性上存在瑕疵。这凸显了目前缺乏一个专门针对CML患者TKI治疗毒性、具有充分内容效度的PROM工具。论文建议,未来的研究应致力于开发或完善这样一个工具,而两个EORTC工具中来源于CML患者的症状项目可以作为一个良好的起点。此外,未来工作还需评估单个症状项目的心理测量学特性(尤其是对TKI剂量变化或停药的响应度),并了解CML患者对在真实世界中使用自我报告工具的偏好,以确保成功实施。
最后,论文总结了本研究的价值与贡献。这项系统性综述首次运用严格的COSMIN方法,对用于评估慢性期CML患者TKI相关毒性的现有PROM工具的内容效度进行了全面、透明的评估。研究明确指出了现有工具的不足之处,特别是缺乏独立验证的全面性评估以及普遍存在的关键症状遗漏问题。尽管没有工具达到“充分”标准,但本研究对各工具内容效度和可行性特征的详细评估与描述,为临床医生、研究人员和政策制定者在当前条件下做出知情选择提供了宝贵的依据。更重要的是,它明确提出了该领域未来研究的关键方向:开发一个具有充分内容效度的、专门针对CML治疗毒性的PROM工具,这对于在真实世界中有效监测和管理TKI治疗及停药后的症状、最终改善患者生活质量具有至关重要的意义。研究也强调了在PROM工具开发和实施过程中,深入、多样化地让患者参与的必要性,以确保工具真正符合患者的需求和体验。