分享自:

体外诊断(IVD)新规下临床性能评估的原则与清单

期刊:critical reviews in clinical laboratory sciencesDOI:10.1080/10408363.2025.2453148

《体外诊断(IVD)新时代下检测项目临床性能评估的原则与清单》学术报告

作者与发表信息
本文由S. J. Lord(澳大利亚悉尼大学NHMRC临床试验中心)、A. R. Horvath(新南威尔士大学)、S. Sandberg(挪威卑尔根大学)等来自欧洲临床化学与实验室医学联盟(EFLM)检测评估工作组(WG-TE)的跨学科团队合作完成,发表于2025年《Critical Reviews in Clinical Laboratory Sciences》第62卷第3期。


主题与背景
本文针对体外诊断(IVD)监管新规下临床性能评估的标准化需求,提出了一套原则与清单框架。随着欧美监管机构(如欧盟IVDR 2017/746和美国FDA)对临床证据要求的强化,实验室自建检测(LDT)和商业化IVD均需证明其“适合目的性”(fit-for-purpose)。然而,目前缺乏针对不同检测目的(如诊断、筛查、风险分层、预后等)的临床性能评估统一指南。本文旨在填补这一空白,促进实验室专业人员、IVD行业与监管机构的共识。


核心观点与论据

  1. 临床性能的定义与评估原则

    • 定义:临床性能(clinical performance)指检测项目根据目标人群和预期用途,正确分类特定临床条件的能力。本文强调需区分“科学有效性”(scientific validity,生物标志物与疾病的关联性)与“临床性能”(实际分类能力)。
    • 关键原则:评估需围绕四个核心要素展开:检测目的(如诊断、预后)、目标人群、目标条件(target condition)和性能指标(如灵敏度、特异性)。
    • 支持证据:以高敏肌钙蛋白(hs-cTn)为例,其诊断非ST段抬高心肌梗死(NSTEMI)的性能需通过预设的“排除/纳入”截断值验证,而非仅依赖统计学关联(如AUC值)。
  2. 检测目的的分类与临床意义

    • 七大目的:包括风险分层、筛查、诊断、预后、治疗获益预测、治疗反应监测和疾病监测(图2)。不同目的对应不同的目标条件(如诊断针对当前疾病状态,预后针对未来事件)。
    • 临床逻辑:例如,筛查测试需高阴性预测值(NPV)以减少假阴性,而预后测试需高阳性预测值(PPV)以支持高风险干预。
    • 案例支持:hs-cTn用于心血管风险分层时,需证明其能将患者分类至可行动的10年风险阈值(如ESC指南的7.5%-15%)。
  3. 临床性能指标与解释框架

    • 核心指标:灵敏度(sensitivity)、特异性(specificity)、PPV、NPV及重分类改善(net reclassification improvement)。
    • 数据呈现:建议以“每1000例检测中的真假阳性/阴性数”量化临床收益与危害。例如,hs-cTn用于NSTEMI排除时,99.3%的NPV意味着每1000例阴性结果中7例假阴性可能因早期出院受损。
    • 局限性:AUC虽可衡量整体区分度,但无法直接指导临床决策,需结合预设截断值分析。
  4. 研究设计类型与适用场景

    • 横断面研究:适用于诊断/筛查(图3a),如同步进行指数检测与金标准评估。
    • 队列研究:适用于预后/风险分层(图3b),需随访观察目标事件(如心肌梗死)。
    • 随机对照试验(RCT):治疗预测需RCT证明“测试阳性组”在靶向治疗中获益(图3d),如乳腺癌内分泌治疗选择依据雌激素受体状态。
    • 偏倚控制:强调避免“两阶段设计”(two-gate design)的样本选择偏倚,提倡代表性人群抽样。
  5. 监管与实践挑战

    • 多用途检测的评估:同一检测(如电解质分析)在不同适应症中需分别验证,但全面证据难以短期完成。建议通过临床指南综述和现有数据整合应对。
    • 标准化缺失问题:不同厂商的同类检测(如hs-cTn试剂)因缺乏标准化可能导致分类差异,需通过上市后研究监测。

意义与价值
1. 学术价值:首次系统整合IVD临床性能评估的多学科共识,提出可操作的研究设计清单(图1),弥补了既往指南对非诊断用途检测的忽视。
2. 应用价值:为IVD制造商、实验室和监管机构提供标准化框架,加速符合新规的检测项目开发和审批。例如,通过明确“目标条件”与“临床收益”的关联性,优化临床试验设计。
3. 行业影响:推动IVD从“分析性能导向”转向“临床结局导向”的评估模式,强化患者安全。


亮点与创新
- 跨学科协作:融合实验室医学、临床流行病学、IVD产业视角,平衡科学严谨性与实践可行性。
- 动态评估理念:提出“上市后性能随访”框架,强调真实世界数据对临床性能再验证的作用。
- 术语革新:将IVDR中“相关性”(correlation)修订为“正确分类”(correctly classify),更精准反映临床性能本质。

(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com