自动化灌注成像未能改善晚期窗口大血管闭塞卒中ASPECTS评分或侧支评分的可靠性

分享自：
自动化灌注成像未能改善晚期窗口大血管闭塞卒中ASPECTS评分或侧支评分的可靠性

期刊:Journal of NeuroInterventional SurgeryDOI:10.1136/jnis-2026-025321
本研究是一篇发表于《Journal of NeuroInterventional Surgery》（J Neurointervent Surg）的原创性研究论文。主要作者为Anass Benomar及其合作者，于2026年在线发表（J Neurointervent Surg epub ahead of print: [please include day month year]. doi:10.1136/jnis-2026-025321）。该研究由来自加拿大、美国、法国、日本、菲律宾等多个国家，包括圣迈克尔医院（St. Michael’s Hospital）、麦克马斯特大学（McMaster University）、渥太华大学（University of Ottawa）等在内的近三十家医疗与研究机构的神经介入放射科、神经内科、神经外科专家共同完成。研究第一作者及通讯作者为Anass Benomar博士。
本研究属于急性缺血性卒中神经介入治疗领域的影像学评估方法学研究。研究背景在于，对于发病时间窗较晚（6-24小时）的大血管闭塞（Large Vessel Occlusion， LVO）所致急性缺血性卒中，血管内血栓切除术（Endovascular Thrombectomy， EVT）的有效性已获证实，但患者筛选至关重要。阿尔伯塔卒中项目早期CT评分（Alberta Stroke Program Early CT Score， ASPECTS）和CT血管成像（CT Angiography， CTA）侧支循环评分（Collateral Score， CS）是临床常规用于评估缺血核心负担和侧支循环状态的工具，但其评估者间可靠性（inter-rater reliability）一直存在争议且研究结果不一。与此同时，自动化CT灌注成像（Automated CT Perfusion， CTP）在晚期时间窗卒中评估中被广泛应用，以期更精确地量化缺血核心与半暗带。然而，近期临床试验证据表明，基于更简单的非增强CT（Non-Contrast CT， NCCT）和CTA的筛选策略可能取得与基于CTP的筛选相似的疗效。因此，一个关键的科学问题浮现：在已具备NCCT和CTA的基础上，额外提供自动化CTP灌注图，是否能提高临床医生对ASPECTS和CS评分的一致性（即可靠性）？这直接关系到临床实践和医疗资源配置。本研究旨在评估在众多评估者中，单独使用NCCT/CTA与联合使用自动化CTP灌注图时，ASPECTS和CS评分的可靠性差异，并探讨这些评分与EVT治疗决策的相关性。研究假设是，增加灌注成像信息并不会显著提高这两个视觉评分系统的可重复性。
本研究是一项评估者间与评估者内可靠性研究，遵循报告可靠性与一致性研究指南（Guidelines for Reporting Reliability and Agreement Studies， GRRAS）。具体工作流程如下：首先，进行病例筛选。研究人员回顾了2018年至2021年间在单一中心（加拿大圣迈克尔医院）因急性卒中症状接受头部CT检查的3144例连续成年患者。根据严格的纳入标准筛选出符合条件的晚期时间窗前循环LVO患者。为了避免谱偏倚（spectrum bias）并最小化Kappa统计量的悖论，研究者采用了一种方法学设计：从符合条件的人群中，根据自动化CTP软件（RAPID， iSchemaView）测定的缺血核心体积，按照1:1:1的比例，选取了30例具有广泛代表性分布（小核心：0–49 cc；中等核心：50–99 cc；大核心：>100 cc）的独特患者病例。这一样本量是基于预先设定的统计学效力计算确定的。接下来，创建评估病例集。针对这30例独特患者，每例生成两个独立的成像案例集：一组仅包含NCCT和CTA图像（称为“非CTP案例”），另一组则在NCCT和CTA的基础上增加了自动化CTP灌注图（称为“CTP案例”）。最终构建了一个包含60个案例（30个非CTP案例 + 30个CTP案例）的研究组合。在评估者招募方面，研究通过加拿大卒中联盟和加拿大介入神经学组邀请了29名符合资质的临床医生作为评估者（rater）。他们均为已完成卒中或神经介入专科培训、并在具备EVT能力的中心执业的专家，背景涵盖卒中神经内科、介入神经放射科、神经外科等。评估流程通过REDCap在线平台进行。每位评估者需要独立审阅全部60个案例（顺序随机），对每个案例提供三项评估：1）基于基线NCCT的ASPECTS评分；2）基于单相CTA的四点法Tan侧支循环评分（CS， 0-3分）；3）基于所有可用临床和影像学数据，是否推荐进行EVT。在至少3周的洗脱期后，这29名评估者中的28名（97%）以打乱的顺序再次对全部案例进行了评估，用于评估者内可靠性分析。本研究的核心是数据收集与统计分析。所有分析均使用R统计软件进行。主要使用Gwet’s AC1/AC2系数（κ_g）来评估ASPECTS和CS的评估者间及评估者内可靠性，并计算95%置信区间。此外，研究还分析了评分与EVT决策之间的相关性，使用Cramér’s V系数进行评估。研究预设了多个亚组分析，包括根据评估者专业背景、经验年限、是否常规使用CTP等进行分层比较。可靠性系数的解读依据Landis和Koch的标准。判断两组κ_g值是否存在统计学差异的标准是看其95%置信区间是否重叠。
本研究获得了详细的结果数据。首先，在ASPECTS评分的可靠性方面，无论是使用原始10分制还是进行二分类（如0-2分 vs. 3-10分），评估者间可靠性在“非CTP案例”和“CTP案例”两组间均无显著差异。具体数据显示，原始ASPECTS评分的评估者间可靠性在非CTP案例中为κ_g = 0.65 (95% CI: 0.53 to 0.78)，在CTP案例中为κ_g = 0.64 (95% CI: 0.51 to 0.77)，均为“实质性一致”（substantial），且置信区间完全重叠。当将ASPECTS二分为“极低”（0-2）和“较高”（3-10）时，可靠性提升至“几乎完全一致”（almost perfect），非CTP组κ_g = 0.80 (0.69 to 0.91)，CTP组κ_g = 0.82 (0.72 to 0.91)，依然没有显著差异。其他二分法（如0-5⁄6-10）并未提高可靠性。评估者内可靠性也表现出高度一致性，非CTP案例的平均κ_g为0.74 (SD， 0.14)，CTP案例为0.76 (SD， 0.10)，均为“实质性一致”。其次，在CTA侧支循环评分（CS）的可靠性方面，结果显示，无论是原始4分制评分还是二分类（0-1 vs. 2-3），其评估者间可靠性在两组案例中均呈现“几乎完全一致”，且无差异。具体数据为：原始CS评分在非CTP案例中κ_g = 0.82 (0.78 to 0.86)，在CTP案例中κ_g = 0.83 (0.79 to 0.86)。二分后可靠性反而有所下降。评估者内可靠性也非常高，平均值均在0.87-0.88之间。第三，在评分与治疗决策的相关性方面，ASPECTS评分与EVT决策显示出强烈的相关性（Cramér‘s V均值：非CTP组0.80， CTP组0.75），而CS评分与EVT决策的相关性为中等（Cramér‘s V均值：非CTP组0.56， CTP组0.54）。最重要的是，增加CTP信息并没有显著增强这两种评分与EVT决策之间的关联强度。亚组分析进一步支持了上述主要结果。无论评估者是神经科医生还是放射科/外科医生，无论其经验年限长短，无论其临床实践中是否常规使用CTP，增加CTP灌注图均未在任何亚组中显著提高ASPECTS或CS的评估者间可靠性。这些结果逻辑清晰地串联起来：研究首先证明了核心变量（ASPECTS和CS）在基础影像（NCCT/CTA）上已具备良好的可靠性；然后通过对照实验（增加CTP）证明这一可靠性并未因添加更“高级”的影像信息而改善；最后，通过相关性分析表明，这两种可靠的评分与关键临床决策（EVT）紧密相关，且这种相关性也不依赖于CTP。这些结果共同指向一个结论：CTP在提高这些视觉评分的可靠性和决策相关性方面，并未提供增量价值。
本研究的结论是明确的：对于晚期时间窗大血管闭塞性卒中，在评估ASPECTS和单相CTA侧支循环评分时，增加自动化CT灌注成像并不能提高这些评分的评估者间或评估者内可靠性，也未能增强它们与血管内血栓切除术治疗决策的相关性。仅使用非增强CT和CT血管成像就已能获得足够的评分可靠性，特别是当ASPECTS采用临床上常用的阈值（如0-2分 vs. 3-10分）进行二分时，可靠性可达几乎完全一致。该研究的科学价值在于，它通过一项严谨的多中心、多评估者可靠性研究，为当前卒中影像学评估的范式演变提供了重要的方法学证据。它挑战了“更复杂的影像技术必然带来更可靠评估”的潜在假设，证实了简单、快速的视觉评分工具在经验丰富的临床医生手中具有高度的可重复性。其应用价值尤为显著：首先，它支持在资源有限或无法快速获得CTP的医疗机构中，可以 confidently 依赖NCCT和CTA进行EVT患者筛选，这有助于在全球范围内，特别是在中低收入地区，推广和普及晚期时间窗卒中血管内治疗。其次，它提示在已具备CTP的医疗中心，临床医生可以更加信赖基于NCCT/CTA的初步快速评估，避免过度依赖可能受软件算法、后处理质量影响的灌注参数，从而简化工作流程，加快决策速度。研究结果与近期倾向于简化影像筛选策略的临床试验证据相互呼应，共同构成了简化卒中影像评估路径的坚实依据。
本研究的亮点突出体现在以下几个方面：第一，研究设计严谨且具有针对性：研究直指当前临床实践中的核心争议——CTP在晚期时间窗卒中评估中的增量价值。通过精心设计的病例对照（同一患者的基础影像vs.基础影像+CTP）和重复测量（评估者内可靠性），有效地控制了混杂因素，能够直接观察CTP带来的影响。第二，评估者群体具有广泛的代表性与高专业性：29名评估者来自多个专业背景（神经内科、神经放射、神经外科）和不同经验水平，且绝大多数在学术医学中心执业，这使研究结果更具普遍性和临床参考价值。第三，统计方法先进，结果报告全面：研究采用了适用于多评估者、有序分类数据的Gwet‘s AC系数，避免了传统Kappa系数在评分分布不均衡时可能出现的悖论。同时，研究不仅报告了整体可靠性，还进行了丰富的亚组分析和不同评分二分阈值的影响分析，并探讨了评分与最终治疗决策的相关性，使结论更加立体和实用。第四，重要的发现：研究明确否定了自动化CTP在提高ASPECTS和CS评分可靠性方面的作用，这一“阴性结果”具有重要的临床指导意义。同时，研究确认了ASPECTS（尤其是0-2分阈值）和CS在专业评估者中具有高度的可重复性，这增强了临床使用这些工具的 confidence。第五，对临床实践与研究的启示：研究结果强力支持了使用更简单、可重复性更高、更广泛可及的成像策略（NCCT+CTA）来对晚期时间窗卒中患者进行EVT筛选的趋势。这有助于降低医疗成本、提高救治效率，并促进治疗技术的公平可及。
此外，研究也坦诚地指出了自身的局限性：例如，提供给评估者的影像是经过挑选的代表性轴位图像，而非完整的可浏览数据集，这可能降低了实际临床评估中的变异性；病例数量有限（30例）但经过精心选择以覆盖广泛的缺血核心谱；存在评估者可能通过临床信息记忆关联两次评估的“携带效应”风险；研究仅评估了单相CTA的Tan侧支评分，未涉及多相CTA或动态CTA等其他可能更准确的方法；所有评估者均为专家，结果可能无法推广至培训不足的医师。这些局限性为未来研究指明了方向，例如在更真实的影像浏览环境下、针对不同侧支评分方法或包含更多非专家评估者的进一步研究。这项研究为晚期时间窗大血管闭塞卒中患者的影像评估提供了高质量的证据，强调了临床评估技能和简单影像工具的重要价值，对指导全球卒中救治实践具有重要意义。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问