本文《放射药物机构间质量控制测量的放射化学与分析考量》(”Radiochemical and analytical aspects of inter-institutional quality control measurements on radiopharmaceuticals”)发表于期刊 EJNMMI Radiopharmacy and Chemistry,于2019年在线发布。通讯作者是Erik de Blois,来自荷兰鹿特丹的Erasmus MC(医学中心)的放射学与核医学科。主要合作作者包括Rory M. S. de Zanger, Ho Sze Chan, Mark Konijnenberg和Wouter A. P. Breeman。
本研究的科学领域是核医学,具体聚焦于放射药物(radiopharmaceuticals)的质量控制(QC)领域。随着核医学的进步,越来越多的新型放射药物(如靶向肽类药物)被开发用于诊断和治疗。然而,许多这类药物并未获得正式的上市许可,也未被收录入《欧洲药典》(European Pharmacopoeia, Ph. Eur.)的具体专论。因此,在实际临床应用中,必须参照药典中的通用质量章节进行质量控制。放射化学纯度(Radiochemical Purity, RCP)是放射药物最关键的质量放行标准之一,通常通过高效液相色谱(HPLC)结合在线放射性检测(in-line detection)来测定。
在多中心临床试验日益增多的背景下,一个根本性矛盾凸显出来:尽管所有参与机构的放射性药房都遵循相同的标准化标记和操作程序(SOPs),但他们往往使用不同品牌、不同配置的液相色谱(LC)、尤其是超高效液相色谱(UHPLC)系统和放射性检测设备(如不同品牌的探测器、闪烁晶体、数据采集软件等)。这些硬件和软件的差异,以及数据处理方法(如基线校正、平滑算法)的不同,可能导致即使对同一样品,不同实验室测得的RCP结果也会出现显著差异。这种不一致性使得在多中心试验中制定统一的RCP放行标准变得复杂且结果可能具有“任意性”(arbitrary)。
基于此背景,本研究的主要目标是:系统性地比较和揭示在评估三种不同放射药物([111In]In-CCK, [68Ga]Ga-bombesin, [177Lu]Lu-PSMA类似物)时,不同机构间在质量控制(QC)测量结果上产生差异的关键技术因素。研究旨在阐明即使是采用标准化的操作流程,色谱图解读、数据输出和处理方式以及本地化的实际操作如何影响最终的RCP值,并为未来多中心试验的质量控制标准化提供实践建议和证据。
本研究是一项多因素、多中心的分析比对研究,并非开发新放射药物,而是专注于分析现有质量控制流程的变异性。其工作流程可概括为以下几个核心环节:
第一,研究对象的准备: 研究人员选取了三种具有代表性的放射药物作为研究对象: 1. [68Ga]Ga-bombesin:一种用于正电子发射断层扫描(PET)诊断的类似物。 2. [111In]In-CCK:一种用于单光子发射计算机断层扫描(SPECT)诊断的类似物。 3. [177Lu]Lu-PSMA:一种用于治疗转移性去势抵抗性前列腺癌的放射性治疗药物。
所有药物的标记过程均在Erasmus MC(研究机构1)严格遵循其各自的标准操作程序(SOPs)进行。具体操作简述如下:对于[68Ga]Ga-bombesin,使用68Ge/68Ga发生器淋洗的68Ga溶液与含DOTA-bombesin的药盒在加热条件下反应;对于[111In]In-CCK,将[111In]InCl3溶液加入含DOTA-CCK的药盒加热标记;对于[177Lu]Lu-PSMA,则将[177Lu]LuCl3与DOTA-PSMA前体在特定缓冲体系中加热反应。标记完成后,取样用于后续HPLC分析。
第二,建立本地化(机构1)的基准测量与参数测定: 在使用机构1自身的HPLC-放射性检测系统(Waters Alliance系统,配备NaI(Tl)晶体和Osprey探测器)进行分析前,研究团队首先进行了一系列关键的背景和系统参数测定: * 背景辐射测量:针对每种放射性核素(Ga-68, In-111, Lu-177),进行了空白注射(30分钟运行),以测量并记录其特定的、与能量相关的本底计数。 * 检测限(LOD)与定量限(LOQ)确定:通过注射一系列已知活度的标记化合物,建立活度(kBq)与色谱峰高(μV)之间的线性校准曲线(图2)。基于测得的本底值及其标准差,计算出各核素的LOD(本底+3倍标准差)和LOQ(本底+10倍标准差)。结果显示,不同核素的本底、LOD和LOQ存在显著差异(例如,Lu-177的本底和LOD/LoQ值最高),强调了核素特异性校准的重要性。 * 数据处理参数设定:为后续的色谱数据处理,设定了统一的阈值(Threshold),例如400 μV,用于区分真实色谱峰与背景噪声。这一步骤是为了减少人为解读差异。
第三,系统性探究数据处理算法的影响: 本研究的一个核心创新点是深入量化了数据处理算法对RCP结果的直接影响。研究团队在机构1,使用同一套原始色谱数据,人为应用了两种不同的平滑算法(smoothing algorithm):“移动平均”(Mean)法和“Savitzky-Golay”法。他们系统性地改变了平滑算法中考虑的数据点数量(从5到31点),然后计算每种平滑设置下的RCP值。这个实验旨在模拟不同实验室软件中可能的不同数据处理偏好。例如,一个实验室的分析软件可能默认使用Savitzky-Golay平滑,而另一个可能使用移动平均,或者使用了不同的平滑“窗口宽度”(即数据点数)。通过这种方法,可以直接观察到平滑算法和强度如何“重塑”色谱峰形,并最终改变主峰面积积分结果,从而影响RCP。例如,对于[111In]In-CCK,使用Savitzky-Golay算法并采用少于12个数据点进行平滑时,会对RCP结果产生“戏剧性”影响(见图3)。
第四,实施跨机构的实验室间比对: 为了将理论分析扩展到真实世界的实践差异,研究团队还将其中两种放射药物([68Ga]Ga-bombesin和[111In]In-CCK)的标记试剂盒和SOPs发送给另外两个研究机构(机构2和机构3)。这两个机构使用他们自己的HPLC系统(均为Thermo Fisher/Dionex Ultimate 3000系统)和放射性探测器(均为Raytest Gabi系统,配备更大尺寸的NaI晶体),并使用不同的数据处理软件(Chromeleon)。尽管遵循完全相同的标记SOP,但三个机构在HPLC硬件(如晶体尺寸、流通池体积、电子学响应时间)、软件和数据平滑处理设置上存在诸多不同(见表4总结)。这三个机构对同批次样品进行QC分析后,将其RCP结果进行对比。这种设计允许研究者在控制“标记过程”这一变量的前提下,单独观察“分析系统”差异对最终结果的影响。
研究通过上述精心设计的流程,获得了清晰且具有说服力的结果,揭示了影响RCP测量的多个关键因素:
1. 数据处理算法对RCP结果的显著影响: 这是本研究揭示的最直接、最量化的内部变异来源。对于三种药物,应用不同的平滑算法(Mean vs. Savitzky-Golay)和平滑强度(数据点数),计算出的RCP值出现了明显的波动范围: * [111In]In-CCK的RCP范围在88%到96%之间。 * [68Ga]Ga-bombesin的RCP范围在89%到95%之间。 * [177Lu]Lu-PSMA类似物的RCP范围在92%到99%之间。
这些波动范围本身就超过了通常被视为“合格”的边界(例如95%)。图5直观地展示了如何通过对同一张原始色谱图应用不同的平滑和积分设置,得到视觉形态不同、进而RCP计算值不同的结果。这证明,即便是分析同一个物理样品,仅仅由于数据处理软件中参数设置的不同,就可能得出截然不同的RCP结论。
2. 跨机构间RCP测量的不一致性: 多中心比对的结果进一步证实了上述问题在真实世界中的存在。虽然所有机构都报告了较高的RCP值(例如,[68Ga]Ga-bombesin在机构2的测定值为96.7%),但各机构间测得的数值并不完全一致。图4汇总了不同分析条件下的RCP结果,有些结果低于90%的放行标准(红色条),有些在90-95%之间(橙色条),有些则高于95%(绿色条)。这种差异归因于多个“机构特异性”因素的综合作用,包括:本地背景辐射水平(实验室环境)、系统固有特性(如探测器噪声、灵敏度、晶体尺寸、流通池设计)、以及个人对色谱图的解读(例如,对峰拖尾的处理、积分起止点的判断)。
3. 基础系统参数的差异性: 研究还量化了不同放射性核素在同一个检测系统上的基础性能差异。表5显示,Lu-177的背景信号(3.7 ± 0.3 kBq)显著高于Ga-68(1.0 ± 0.1 kBq)和In-111(0.7 ± 0.1 kBq)。这意味着,对于Lu-177标记的药物,检测系统需要具备更高的信噪比能力来准确识别低含量杂质。这些核素依赖性的参数,如果不加区分地进行统一设定,也会引入误差。
本研究得出一个强有力的核心结论:放射化学纯度(RCP)的测量结果具有强烈的“方法依赖性”和“系统依赖性”。即使相关参数已经过验证,操作遵循标准化程序(SOP),不同机构间由于硬件、软件、数据处理流程和个人解读的差异,所获得的RCP值仍然可能存在显著的、有时甚至会影响放行决策的偏差。这使得在多中心临床试验中,如果仅基于单一中心的数据来制定统一的RCP放行标准,其结果可能带有“任意性”(arbitrary)。
本研究的重要价值体现在以下几个方面: * 科学价值:它系统地识别并量化了在放射药物QC这一看似标准化的领域中,导致测量结果变异性的多个、常常被忽视的技术细节。它将通常被视为“黑箱”或仅凭经验设置的软件数据处理参数(如平滑算法)提升到了需要标准化和验证的重要地位。 * 应用价值/实践意义:研究为正在进行或计划开展多中心放射性药物临床试验的研究者、监管机构和放射性药房提供了关键的警示和具体的行动指南。论文强烈建议,在启动多中心试验之前,参与机构不应仅满足于采用相同的标记SOP,还必须对其在线放射性检测条件进行交叉验证和标准化比较。具体建议包括:使用具有较长半衰期的放射性核素制备一种稳定的“热溶液”(”hot liquid”)参考样品,在参与机构间进行“环试”(ring trial),以比对和校准各自的HPLC-放射性检测系统;详细规定并统一色谱数据处理方法(如平滑算法类型、参数、积分规则);基于实验室内的重复性和实验室间的中间精密度研究,为每个特定药物确定一个本地化的RCP范围作为放行标准,而非一个绝对阈值。
论文在讨论部分还提及了一些其他重要的考量点,例如: * 放射性分解杂质:放射药物在储存中可能因辐射自分解产生多种放射性杂质,这些杂质在色谱图上可能表现为“拖尾”或“拖尾峰”,而不是清晰的独立峰。在计算RCP时,这些“拖尾”部分(只要其信号高于最低峰高标准)也应被计入总活性,否则会高估RCP。这增加了积分的人为判断难度。 * 方法验证的深度:研究强调,为了确保多中心结果的可靠性,除了常规的方法验证(特异性、线性、精密度等),还应特别关注实验室间的中间精密度,并考虑通过加标实验来验证准确性。 * 对药典通则的依赖与挑战:文章指出,由于许多新型放射药物缺乏专属药典专论,不得不依赖通用章节。然而,通用章节的规定往往不够细致,无法覆盖所有硬件和软件组合的特定情况,因此更需要使用者进行深入的系统适用性验证和机构间比对。
总而言之,本研究是一篇高质量的、具有强烈实践指导意义的分析报告。它深刻地揭示了放射药物质量控制领域的复杂性,并为推动该领域,特别是在多中心合作背景下的标准化和结果可靠性,提供了至关重要的科学依据和操作框架。