本研究由来自瑞士洛桑大学医院、洛桑大学、瑞士联邦理工学院洛桑分校以及伯尔尼大学医院高级神经影像支持中心、西门子医疗国际股份公司等机构的Jonathan Rafael-Patiño, Elda Fischi-Gomez, Antoine Madrona, Veronica Ravano, Bénédicte Maréchal, Tobias Kober, Silvia Pistocchi, Alexander Salerno, Guillaume Saliou, Patrik Michel, Roland Wiest, Richard McKinley, Jonas Richiardi等研究者共同完成。这项研究于2025年发表在《Stroke》期刊(第56卷,第915-925页)上。
本研究的学术背景聚焦于急性缺血性脑卒中的神经影像学领域。扩散加权磁共振成像(Diffusion-weighted magnetic resonance imaging, DWI)及其衍生的表观扩散系数(Apparent Diffusion Coefficient, ADC)图,在急性脑卒中的诊断、缺血核心(infarct core)定位以及紧急再灌注治疗(如取栓)的决策中扮演着核心角色。特别是,DEFUSE等临床试验的标准常基于固定的ADC阈值(例如620 × 10⁻⁶ mm²/s)来自动化分割缺血核心体积,以筛选适合进行血管内治疗的患者。然而,ADC图并非严格的定量指标,其数值和图像质量容易受到扫描平台、成像协议(如扩散梯度方向的数量)等多种技术因素的影响。这种成像协议的异质性可能导致不同医疗机构间测得的缺血核心体积和位置存在差异,从而影响治疗决策的准确性、多中心临床试验结果的可比性,以及ADC作为影像生物标志物的可靠性。尽管已有研究关注不同厂商平台间ADC值的差异,但对于扩散梯度方向数量这一关键协议参数如何具体影响缺血核心的判定及其与临床预后的关联,尚缺乏系统性的研究。因此,本研究旨在通过回顾性数据分析,系统性地探究由不同扩散梯度方向数(模拟不同临床常用协议)所生成的ADC图,如何影响急性前循环卒中患者缺血核心的体积估算、空间定位,以及其与美国国立卫生研究院卒中量表(National Institutes of Health Stroke Scale, NIHSS)评分和改良Rankin量表(Modified Rankin Scale, mRS)评分等临床结局指标之间的关联。
本研究的详细工作流程包含以下几个主要步骤: 首先,是研究样本的选择与数据准备。研究团队从洛桑大学医院的急性卒中注册与分析数据库(Astral registry)中,筛选了2018年5月至2021年1月期间就诊的1210例前循环急性卒中患者。经过严格的排除标准(如无配对DWI和结构成像数据、图像质量差、缺乏高分辨率DWI数据等),最终纳入了726名患者进行分析。这些患者的临床特征,包括年龄、性别、干预类型(血管内治疗、静脉溶栓、桥接治疗、无干预)、入院及24小时NIHSS评分、3个月mRS评分等,均被详细记录(见表1),为后续分析提供了基线数据。 其次,是成像数据的获取与处理。所有患者的MRI数据均在3T MRI系统上采集。关键的DWI序列采用了高角度分辨率方案,包含20个扩散编码方向(b-vectors)和10个b=0图像。研究还采集了T1和T2加权结构像。在图像处理阶段,首先将结构像配准到平均的b0扩散图像空间。然后,使用基于卷积神经网络的SynthSeg工具,从T1加权像中分割出颅内总体积,并估计白质、灰质和脑脊液的体积分数。接着,利用DWI数据计算出高角度分辨率的ADC图(标记为ADC20)。 第三,是模拟协议异质性的核心方法。鉴于在急性期对同一患者重复进行不同协议的扫描存在伦理和技术挑战,本研究创新性地采用了基于物理的模拟方法。研究者利用已采集的20个方向的高分辨率DWI数据,通过贪婪搜索算法,从原始数据中“子采样”出不同的扩散梯度方向子集,以模拟临床上常见的低分辨率协议。具体生成了两种模拟协议:一种是模拟仅有4个扩散方向的低角度分辨率协议(标记为ADC4),该协议模拟了急诊室常用的快速扫描方案;另一种是模拟具有12个方向的中间分辨率协议(标记为ADC12)。对于ADC4,研究者还通过多次子采样生成了14个略有不同的方向组合变体,以模拟扫描过程中患者头部轻微倾斜或不同中心协议微小差异带来的影响。这种方法使得在同一个患者数据集上,能够直接比较不同“虚拟”协议下的结果,从而精确量化协议差异的效应。 第四,是基于阈值的缺血核心分割。为了确定缺血病灶,研究采用临床实践中广泛使用的阈值法。首先,将SynthSeg分割出的白质区域映射到DWI图像空间。然后,对每一个ADC图(包括ADC20、ADC12和各ADC4变体),应用DEFUSE研究中采用的固定阈值(620 × 10⁻⁶ mm²/s)来初步识别低于该阈值的缺血体素。为了减少假阳性,研究进一步对生成的二值化病灶掩模进行了形态学开运算和闭运算处理,并过滤掉体积小于1 mm³的微小连通区域。通过这一流程,为每个协议(及每个ADC4变体)都得到了一个二进制的缺血核心分割图。 第五,是统计分析。分析主要分为几个层次:1) 白质ADC分布分析:比较ADC20与ADC4方案下,整个白质区域内ADC值的分布差异,包括均值、标准差、峰度和偏度,并采用Wilcoxon符号秩检验评估其显著性。2) 缺血核心体积分析:使用Bland-Altman分析评估ADC20与ADC4(以及ADC12)方案之间缺血核心体积测量的一致性和偏差范围。同时,采用混合β回归模型,在控制年龄、性别和干预类型等协变量的情况下,检验扩散采集方案本身对缺血核心体积的独立影响。3) 缺血核心位置一致性分析:通过计算Jaccard系数,量化ADC20方案与各个ADC4变体方案之间缺血核心体素空间位置的重叠程度,以评估协议变化对病灶定位稳定性的影响。4) 临床关联性分析:分别计算基于ADC20和ADC4方案得到的缺血核心体积与三项临床评分(入院NIHSS、24小时NIHSS、3个月mRS)之间的斯皮尔曼秩相关系数。此外,还使用广义加性模型进行多变量回归分析,在控制年龄、性别和干预类型后,比较两种方案下病灶体积对临床评分预测能力的差异。最后,研究还进行了一项模拟临床决策影响的探索性分析:利用一部分患者已有的商业软件(RAPID)缺血体积报告,建立模型来近似估算本研究方法在20方向和4方向协议下得到的体积对应的商业软件输出值,然后参照DEFUSE-3等试验的标准(如核心体积>70 mL且发病至到院时间>4.5小时的患者可能被视为不适合取栓),识别那些因协议不同(ADC4估算>70 mL而ADC20估算<70 mL)可能导致治疗资格判定不一致的潜在病例。
本研究的主要结果如下: 关于白质ADC分布,分析发现,与20方向方案相比,4方向方案下的ADC值分布发生了显著改变。4方向方案的ADC均值略高(872.94 μm²/s vs. 864.97 μm²/s),标准差更大(283.08 μm²/s vs. 261.90 μm²/s),表明测量变异性增加。更重要的是,20方向方案的峰度(24.22 vs. 18.48)和偏度(3.85 vs. 3.14)均显著更高。这揭示了20方向方案的ADC值分布更尖锐、更向左(低ADC值方向)偏斜。这种分布形状的改变,可能直接影响基于固定阈值(620 μm²/s)的分割结果,因为更多的体素可能聚集在阈值附近。 关于缺血核心体积,结果明确显示,低角度分辨率协议会高估缺血核心体积。与作为参考标准的ADC20方案(平均体积3.97 mL)相比,ADC4方案的平均体积为7.88 mL,ADC12方案为6.07 mL。Bland-Altman分析表明,ADC4与ADC20之间的平均偏差为3.91 mL,95%一致性界限范围很宽(-10.88至26.47 mL)。多变量回归模型进一步证实,在控制了年龄、性别和干预类型后,采用4方向方案会导致估计的缺血核心体积显著减少(实际上是相比4方向的高估值,20方向的值更低),该效应具有极强的统计学意义。这表明协议差异是缺血核心体积测量的一个独立且重要的偏倚来源。 关于缺血核心位置,空间重叠性分析揭示了惊人的不一致性。计算所有患者ADC20方案与14个ADC4变体之间的Jaccard系数,其中位数仅为0.22(四分位距为0.13-0.39)。这意味着,在不同协议下识别出的缺血体素,平均只有约22%是重合的。图4展示的病例概率图也直观地表明,低分辨率协议下识别的病灶位置存在显著的空间变异性。 关于临床关联性,这是本研究的关键发现之一。无论是在单变量还是多变量分析中,基于20方向方案计算的缺血核心体积与临床评分的相关性均显著强于基于4方向方案的结果。具体而言:与入院NIHSS评分的相关性,20方向为0.471,而4方向降至0.257;与24小时NIHSS评分的相关性,20方向为0.436,4方向降至0.227;与3个月mRS评分的相关性,20方向为0.270(显著),而4方向降至0.060(不显著)。在多变量模型中,20方向方案对临床评分变异的解释度也更高。按干预类型分层分析后,这一趋势依然存在:在所有亚组中,20方向数据的相关性均优于4方向数据。这表明,使用高角度分辨率协议获得的缺血核心体积,能更好地反映患者的临床严重程度和远期功能结局,其作为预后生物标志物的效力更强。 最后,在模拟临床决策影响的分析中,研究者发现,在170名有商业软件报告数据的患者子集中,有16名患者符合以下条件:基于4方向模拟数据估算的核心体积超过70 mL,而基于20方向数据估算的体积则低于70 mL,且发病至到院时间超过4.5小时。在这16人中,有8人实际接受了血管内治疗。这意味着,如果这些患者当初是按照4方向协议进行扫描评估,他们中的一部分(特别是那8名接受治疗者)可能会因为“核心梗死过大”而被判定为不适合取栓,从而错失治疗机会。这凸显了成像协议异质性对真实世界临床决策可能产生的直接且重大的影响。
本研究的结论是,DWI采集协议的异质性(特别是扩散梯度方向数量的不同)会显著影响ADC图的白质内分布特征,进而导致基于阈值法分割的缺血核心在体积、空间位置上产生巨大差异,并削弱缺血核心体积与关键临床评分之间的关联强度。低角度分辨率协议(如4方向)会系统性高估梗死体积,降低病灶定位的可靠性,并使其与临床预后的相关性减弱,这可能会影响治疗决策的准确性和多中心研究结果的比较。因此,为了提升ADC作为卒中管理影像生物标志物的可靠性和一致性,在临床实践和研究中推动成像协议的标准化至关重要。
本研究的亮点在于:首先,研究问题具有重要的临床现实意义,直接针对多中心卒中研究和临床实践中因MRI协议不统一导致的潜在偏倚这一痛点。其次,研究方法巧妙且高效,通过物理模拟从高分辨率数据中“反向生成”低分辨率协议数据,避免了在急性卒中患者身上进行重复扫描的伦理和实操难题,实现了严格的自身对照。第三,分析全面而深入,不仅比较了体积差异,还首次系统量化了协议异质性对病灶空间定位一致性(通过Jaccard系数)以及与多个时间点临床结局关联性的影响。第四,揭示了潜在的临床决策影响,通过模拟分析,将技术差异直接转化为可能错失治疗机会的患者数量,使研究结论更具冲击力和警示价值。第五,提供了公开的代码,用于复现模拟数据处理流程,增强了研究的可重复性和透明性。
此外,研究也坦诚地指出了其局限性:主要聚焦于扩散方向数量的影响,而未考虑层厚、翻转角等其他协议参数;低分辨率协议是模拟而非实际采集;使用的DEFUSE阈值分割法本身可能比商业软件保守;以及由于图像质量问题排除部分患者可能引入的选择偏倚(尤其是未干预组中被排除的患者病情更重、年龄更大)。这些都为未来更深入的研究指明了方向。这项研究为神经影像和卒中领域提供了一个强有力的证据,表明成像协议的细微差别足以显著改变关键的定量指标,并呼吁业界重视成像方案的标准化工作。