临床与实验室标准协会(Clinical and Laboratory Standards Institute, CLSI)于2010年10月发布了名为《临床实验室参考区间的定义、建立和验证;批准指南—第三版》(EP28-A3c)的正式指南文件。该文件旨在为诊断实验室和诊断测试制造商提供关于确定定量实验室检测参考区间(Reference Interval)的最新、全面的指导原则。本报告将对该指南的核心内容进行系统性梳理和阐述。
一、 文件概述与背景
本文件由CLSI制定并发布。CLSI是一个非营利的会员制组织,其核心使命是通过制定和实施具有全球适用性的临床实验室标准和指南,促进实验室医学的卓越发展。该文件的制定遵循了CLSI的共识流程(Consensus Process),即由全球实验室社区内受实质影响、具备能力且感兴趣的相关方达成实质性一致。文件的主席为Gary L. Horowitz博士,并由一个包括Sousan Altaie、James C. Boyd、Ferruccio Ceriotti、Uttam Garg、Paul Horn、Amadeo Pesce、Harrison E. Sine、Jack Zakowski等专家在内的工作组(Working Group on Reference Intervals)负责具体编写,同时得到了临床化学和毒理学领域委员会(Area Committee on Clinical Chemistry and Toxicology)及多位顾问的审阅与支持。
该指南是对2000年发布的第二版指南的更新。在临床实验室实践中,参考区间是将患者检测结果与健康或特定状态人群的预期值进行比较、从而辅助医学决策的基础。然而,传统的“正常值”概念模糊且缺乏统一的确定流程。因此,本指南基于国际临床化学与检验医学联合会(International Federation of Clinical Chemistry and Laboratory Medicine, IFCC)专家小组提出的参考值理论,旨在提供一个系统化的方案,以建立可靠、有用的参考区间。
二、 指南的主要目标与核心理念
本指南的主要目标是提供一个详细的协议,用于确定满足最低可靠性要求和临床实用性的参考区间。它侧重于与健康相关的参考值,并涵盖了为新分析物或新分析方法建立参考值、以及在不同实验室间转移已验证参考区间的具体要求。
指南强调了一个重要的理念转变:鉴于实践中很少有实验室能够独立完成大规模的参考区间研究,实验室应将工作重点从“建立”转向“验证”参考区间。即,实验室可以采纳由制造商、多中心研究或其他权威来源建立的参考区间,并通过相对简单的流程(例如,使用少量参考个体样本)来验证这些区间是否适用于本实验室的特定人群和方法学。这一理念旨在降低实验室的负担,同时保证参考区间的适用性。
三、 核心概念与术语定义
文件首先明确了IFCC提出的一系列关键术语,以确保讨论的准确性和一致性: * 参考个体(Reference Individual):根据明确定义的标准选择的个体。 * 参考人群(Reference Population):所有参考个体组成的群体(通常是假设的)。 * 参考样本组(Reference Sample Group):从参考人群中选出的、足以代表该群体的足够数量的个体。 * 参考值(Reference Value):通过对参考个体进行观察或测量所获得的值(检测结果)。 * 参考分布(Reference Distribution):参考值的分布。 * 参考限(Reference Limit):从参考分布推导出的、用于描述目的的值(例如,2.5%和97.5%百分位数)。 * 参考区间(Reference Interval):介于两个参考限之间(包括参考限)的区间,通常指中间95%的区间。 * 观察值(Observed Value):患者的实验室检测结果,用于与参考值、参考区间等进行比较。
这些术语构成了一个清晰的逻辑链条:从定义参考个体开始,到获得参考值,进而分析得到参考分布和参考限,最终确定用于临床比对的参考区间。
四、 建立参考区间的详细流程
对于需要从头建立参考区间的情况(例如,新分析物或新方法),指南概述了一个包含13个步骤的详细协议:
这一流程体现了“先验(a priori)”方法,即在采样和分析前就应用排除和分区标准。在某些情况下,也可以使用“后验(a posteriori)”方法,即从已有的大量数据(如体检数据库)中,根据既定标准在测量后筛选参考值。此外,指南还讨论了“间接抽样”技术,即从非专门为参考区间研究设计的数据集中提取数据,但指出这种方法应被视为粗略估计,并推荐尽可能使用直接方法。
五、 关键考量与具体方法
1. 参考个体的选择与问卷设计: 选择过程的核心是定义“健康”状态。指南提供了排除标准(如近期疾病、用药、吸烟、饮酒等)和分区因素(如年龄、性别、种族、饮食、昼夜节律等)的示例列表。设计一份详尽的问卷是实施这些标准的关键工具,问卷应简洁、保密,并通常需要获得伦理审查委员会的批准。指南附录中提供了一个包含人口学信息、健康状况、生活习惯、用药史等问题的问卷示例。
2. 分析前与分析中的考虑: 参考区间的有效性高度依赖于分析前和分析中变量的严格控制。这包括: * 受试者准备:饮食(空腹与否)、药物、运动、体位、采样时间(生物节律)等。 * 标本因素:标本类型(血清、血浆等)、采集技术、抗凝剂、处理、储存和运输条件。 * 分析方法学特征:必须详细描述方法,报告分析不精密度、检测限、线性、回收率、干扰特性,特别是方法的正确度(Trueness)以及结果可追溯至更高级别方法或材料的证明(如果存在)。
3. 参考值的统计分析: 这是指南的技术核心部分,详细说明了如何从收集的参考值数据中推导出参考区间。 * 估计方法: * 非参数方法:这是最基本且推荐的方法,尤其适用于统计支持有限的实验室。该方法不假设数据服从特定分布。将n个观测值排序后,第2.5个百分位数(下限)的秩次R1 = 0.025(n+1),第97.5个百分位数(上限)的秩次R2 = 0.975(n+1)。当n=120时,R1≈3,R2≈118,即取排序后第3位和第118位的值作为参考限的估计。该方法需要至少120个观测值才能可靠估计2.5%和97.5%百分位数。 * 稳健方法(Robust Method):当样本量有限(如少于120)时,可作为替代方案。它是一种介于参数和非参数方法之间的折中方法,使用中位数和关于中位数的绝对中位差(MAD)等稳健统计量进行迭代计算,对离群值不敏感,且不要求数据严格服从高斯分布。指南在附录B中提供了详细的计算示例。 * 参数方法:假设数据(或经转换后)服从高斯分布,使用均值和标准差进行计算。由于许多分析物不呈高斯分布,需进行数据转换(如对数转换),过程较为复杂。 * 样本量要求:非参数方法至少需要120个参考值(每个分区)。样本量直接影响参考限估计的精确度。可以使用参考区间宽度的一定比例(如小于0.2倍)作为90%置信区间宽度的可接受标准来评估样本量是否充足。 * 离群值处理:在分析数据前,需检查并处理离群值。指南推荐使用Dixon的D/R比率检验(若极端值与次极值之差大于全距的1/3,则考虑删除)或Tukey的箱线图法(利用四分位距计算边界)来识别离群值。除非有明确证据表明是分析错误,否则应谨慎对待离群值的删除。 * 分区决策:在合并不同亚组(如男性和女性)的数据前,需要判断是否需要为各亚组建立独立的参考区间。仅凭统计显著性差异(如t检验)并不足够,因为大样本时微小差异也可能显著。指南介绍了Harris和Boyd提出的标准:计算标准化差值Z,若Z大于临界值Z* = 3 √(n_avg/120),则建议分区;或者,若两个亚组的标准差之比超过1.5,也建议分区。更直接的方法是评估合并后参考区间导致任一亚组超出参考限的比例是否超过4%(理想为2.5%)。 * 置信区间:计算出的参考限是对总体百分位数的估计,存在抽样变异。应为每个参考限计算置信区间(通常为90%),以量化其不确定性。置信区间的宽度取决于样本量和数据分布。
4. 参考区间的转移与验证: 这是指南强调的、更切合实验室日常实践的部分。 * 转移(Transference):当从一个实验室或研究将已建立的参考区间应用到另一个实验室时,必须确保两个环境之间具有可比性。这包括: * 分析系统的可比性:通过方法学比对实验(遵循CLSI文件EP09协议)来评估新方法与原方法之间是否存在恒定或比例的系统误差。如果差异在临床可接受范围内,则参考区间可能可以直接转移或通过数学调整后转移。 * 测试人群的可比性:评估新实验室服务的患者人群与原参考区间建立时的人群在相关特征(如年龄、性别、种族、地理位置)上是否相似。 * 验证(Validation):在将外部参考区间应用于本地之前,必须进行验证。指南提供了两种实用的验证方法: * 主观验证:基于实验室人员的经验和现有患者数据分布进行初步判断。 * 使用少量参考个体(如n=20)进行验证:从本地符合标准的参考个体中收集少量样本(如20份)。如果这20个结果中不超过2个(即≤10%)落在待验证参考区间之外,则可以合理地接受该区间适用于本地。也可以使用更复杂的统计检验(如基于二项分布或更灵敏的检验)来提高判断的敏感性和特异性。这是实验室验证参考区间最可行的方法。 * 使用较多参考个体进行验证:如果资源允许,收集更多样本(如60个)可以进行更严格的统计检验(如参考限的置信区间是否重叠),但成本更高。
5. 多中心参考区间研究: 指南鼓励开展多中心研究以建立通用的参考区间集合。前提是:参与中心需遵循统一的参考个体选择和分析前标准;分析方法需实现标准化和结果可追溯性(通过使用有证参考物质);并实施明确的质量控制程序。一旦建立了通用的参考区间,各实验室只需进行本地验证即可,这大大减轻了单个实验室的负担。
六、 其他议题 指南还简要讨论了定性分析、治疗药物监测、时间依赖/激发试验、个体内变异以及“危急值”等与参考值相关但不在本文件主要范围内的主题。
七、 文件的意义与价值
CLSI EP28-A3c指南具有重要的科学价值和应用价值: 1. 标准化与规范化:它提供了从参考个体选择到最终参考区间确立及验证的全流程标准化方案,结束了“正常值”确定过程的混乱状态,提升了实验室数据的可比性和可靠性。 2. 实践指导性强:指南不仅阐述了理想化的建立流程,更正视了大多数实验室资源有限的现实,重点推荐了“验证”而非“建立”的策略,并提供了具体、可操作的验证方案(如使用20个参考样本),使指南更具实用性和可操作性。 3. 方法论全面:详细介绍了非参数、稳健、参数等多种统计方法,并讨论了样本量、离群值处理、分区检验、置信区间等关键技术细节,为实验室数据分析和决策提供了坚实的统计学基础。 4. 前瞻性视角:指南认识到方法标准化和结果可追溯性的发展趋势,倡导通过多中心研究和制造商的可追溯性努力,最终实现参考区间的通用化,从而优化全球实验室资源。 5. 质量保证:通过强调分析前、分析中因素的控制以及参考区间适用性的持续验证,该指南是实验室全面质量管理体系的重要组成部分,直接关系到患者检测结果的正确解读和医疗决策的质量。
八、 亮点总结 * 核心理念转变:从强调每个实验室独立“建立”参考区间,转向鼓励通过标准化和“验证”来采纳可靠的参考区间。 * 强调验证的可行性:明确提出了使用少量(如20个)本地参考个体样本进行参考区间验证的具体方案和判断标准,极大地降低了实验室实施的门槛。 * 引入稳健方法:针对小样本量情况,正式推荐了稳健统计方法作为非参数方法的有效补充,扩展了参考区间建立的适用场景。 * 倡导多中心合作与标准化:指出了通过方法标准化和多中心研究建立通用参考区间的未来方向,符合检验医学全球化发展的趋势。 * 内容系统全面:涵盖了从理论定义、个体选择、标本处理、统计分析到转移验证的全链条,是一份极具操作性的权威技术指南。