分享自:

CT自动肾结石检测的准确性与精确度:一项体模与患者研究

期刊:Abdominal RadiologyDOI:10.1007/s00261-026-05499-w

本研究报告介绍了一项由Charat Thongprayoon(梅奥诊所肾病与高血压科)和Andrea Ferrero(梅奥诊所放射科)作为共同第一作者领导的研究,其合作者包括来自梅奥诊所肾病科、放射科、泌尿科、临床试验与生物统计学部的多位研究人员。该研究于2026年发表在《Abdominal Radiology》期刊上。这是一项旨在评估计算机断层扫描(CT)中自动肾结石检测与测量工具QSAS(定量结石分析软件) 的准确性与精度的原创性研究。

研究的学术背景聚焦于泌尿系统影像学和医学人工智能应用领域。无症状肾结石在成人中十分常见,其最大直径是预测未来症状性发作和决定临床管理策略(观察、药物治疗或手术干预)的关键指标。非增强CT是检测肾结石的金标准。然而,传统的手动测量方式耗时、费力,且存在显著的观察者间差异。与此同时,自动分割模型能够快速、精确地量化结石负荷,正逐渐整合到临床工作流中。临床实践中存在一个关键问题:针对疑似结石患者的专用CT协议通常采用1毫米薄层扫描,但许多无症状肾结石是在常规腹部CT(通常为3或5毫米层厚)中偶然发现的。目前,对于不同CT层厚下,自动工具检测结石的遗漏频率以及测量结石尺寸的准确性,尤其相较于结石真实尺寸(金标准)的定量数据十分缺乏。因此,本研究的主要目标是:在体外模型研究中,评估不同CT层厚下QSAS对肾结石的检测频率和直径测量的准确性;其次,在体内患者研究中,比较QSAS与放射科医生在测量结石直径方面的一致性。

本研究的工作流程主要分为两个部分:体外模型研究体内患者研究

第一部分:体外模型研究。 此部分旨在获得结石检测和尺寸测量的“地面真实值”对比数据。研究团队收集了120颗已知直径和成分的肾结石。结石成分通过红外光谱法确定,包括60颗钙基结石(30颗草酸钙,30颗磷酸钙)、30颗尿酸结石和30颗混合(钙-尿酸)结石。每颗结石的最大直径使用精度达0.1毫米的手动卡尺测量,作为参考标准。结石直径范围在1.4至9.9毫米之间。这些结石被随机放置在一个模拟人体X射线衰减的体模中。使用第三代双源CT扫描仪进行扫描,采用临床肾结石成分协议。原始数据被重建成三种不同的层厚:1毫米、3毫米和5毫米,以模拟不同临床场景。所有重建图像均使用梅奥诊所内部开发的QSAS软件进行处理。QSAS是一个全自动分析管道,其核心是一个用于分割肾脏区域的深度卷积神经网络(基于3D nnU-Net框架)。在本模型研究中,跳过了肾脏分割步骤,直接将结石检测算法应用于整个体模图像。该算法使用基于强度和形态学的规则:首先识别CT值≥150亨氏单位(HU)的明亮物体作为候选结石;然后,通过分析结石周围体素的直方图,自适应地确定HU阈值来精确界定结石边界;最后,通过一系列渐进式侵蚀步骤来区分和量化相邻的结石簇。对于每个检测到的结石,QSAS计算其三维分割区域中所有表面体素之间的最长距离,作为最大直径。

第二部分:体内患者研究。 此部分旨在评估QSAS在真实临床环境中的表现。研究回顾性纳入了24名近期在梅奥诊所接受了结石协议CT(1毫米层厚)检查的患者,这些患者的检查结果已由放射科医生确认,并且至少有一颗直径≥2毫米的肾结石。共分析了45颗结石。由一位放射科医生使用ITK-SNAP软件,在轴位、冠状位和矢状位上手动测量每颗结石的最大直径。同时,QSAS也自动处理相同的CT图像并测量结石直径。将QSAS的测量结果与放射科医生的手动测量结果进行比较,以评估两者之间的一致性。

数据分析方面,对于模型研究,计算了QSAS在不同层厚下的结石检测频率,并按实际结石直径和成分进行了分层。对于检测到的结石,通过斯皮尔曼相关系数、偏差(Bias)和绝对差(Absolute Difference)来评估QSAS测量的CT直径与卡尺测量的实际直径之间的相关性。将绝对差>1毫米定义为具有临床意义的误差。研究还构建了一个稳健线性回归模型,以CT测量直径、结石成分和CT层厚为预测因子,来预测真实的卡尺直径,并计算了95%预测区间。对于患者研究,使用配对t检验、组内相关系数(ICC)、中位绝对差以及Passing-Bablok回归来评估QSAS与放射科医生测量结果之间的一致性和偏差。

研究的主要结果如下:

模型研究中,结石检测频率随CT层厚增加而显著下降。总体检测频率在1毫米、3毫米和5毫米层厚下分别为100%、93%和86%。对于直径小于4毫米的小结石,以及尿酸结石,在较厚层厚下的漏检率更高。然而,所有三种层厚均检测到了所有77颗直径≥4毫米的结石。

尺寸测量准确性方面,QSAS测量直径与实际直径的相关性随层厚增加而降低(斯皮尔曼相关系数ρ:1毫米为0.97,3毫米为0.84,5毫米为0.59)。测量误差显著增加:QSAS测量直径与实际直径的中位绝对差在1毫米层厚下为0.3毫米,3毫米下为0.7毫米,5毫米下为1.5毫米。具有临床意义误差(>1毫米)的比例在1毫米、3毫米和5毫米层厚下分别为5%、28%和64%。

一个新颖且重要的发现是测量偏差呈现出成分特异性。在1毫米薄层图像上,所有类型结石的直径测量都较为准确。然而,在3毫米和5毫米的较厚层厚图像上,测量结果出现了系统性偏差:对于尿酸结石,QSAS倾向于低估其直径(平均偏差分别为-0.3毫米和-0.6毫米);而对于钙基结石和混合成分结石,则倾向于高估其直径(平均偏差分别为+0.3/+0.6毫米和+0.8/+0.8毫米)。这种偏差是恒定的,不随结石直径成比例变化。研究提供了详细的表格,列出了基于CT测量直径、结石成分和层厚的真实结石直径的95%预测区间,为临床解读提供了量化工具。

患者研究中,QSAS和放射科医生在1毫米层厚CT图像上检测到了相同的45颗结石。两者在测量结石直径上具有高度一致性(ICC = 0.94),平均差异仅为0.3毫米,且Passing-Bablok回归显示无显著的恒定或比例偏差。然而,两者测量值之间中位绝对差为1.1毫米,并且有51% 的结石测量差异超过了临床意义的1毫米阈值。值得注意的是,这一差异显著高于模型研究中QSAS在1毫米层厚下的误差率(5%)。作者分析,这可能部分源于测量方式的根本不同:QSAS计算的是结石在三维空间中的最大直径,更接近手动卡尺的测量方式;而放射科医生通常仅在三个二维正交平面(轴、冠、矢状面)上进行测量,可能无法捕获真正的三维最大径。

基于以上结果,研究得出结论:自动结石分割工具(如QSAS)在专用的1毫米薄层CT上能够准确、精确地测定肾结石直径。然而,对于在常规3或5毫米层厚腹部CT上偶然发现的结石,其检测和测量存在重要局限:小结石(尤其是尿酸结石)可能被遗漏;对于直径≥4毫米的结石,虽能被可靠检测,但报告的直径应被视为近似值而非精确值,且存在成分特异性的偏差(钙结石实际偏小,尿酸结石实际偏大)。这些定量数据对于临床决策至关重要:当报告的结石尺寸接近改变管理策略的阈值时(例如手术与药物治疗的界限),或当对比不同时间点、不同层厚CT图像的结石大小以评估生长或治疗反应时,必须考虑这种测量不精确性和偏差,必要时建议进行1毫米层厚的专用CT扫描以获取更准确尺寸。本研究提供的预测区间可直接整合到结构化放射学报告或决策支持工具中,帮助临床医生更合理地解读偶然发现的结石尺寸。

本研究的亮点在于:首先,研究设计严谨,采用了已知真实直径和成分的、大样本量(120颗)且成分多样化的结石模型,为评估自动测量工具的准确性提供了可靠的“金标准”。其次,量化了临床实践中长期存在但缺乏数据的关键问题,即不同CT层厚对结石检测和尺寸测量的具体影响程度,并首次明确揭示了在较厚层厚下测量偏差的成分特异性(尿酸结石被低估,钙结石被高估),这为理解部分容积效应的影响提供了新的见解。第三,研究不仅对比了自动工具与真实值,还在临床患者中对比了自动工具与人工测量,揭示了即使在使用理想薄层扫描时,人工测量本身也存在相当大的不精确性(51%的测量差异>1毫米),这凸显了自动化工具在提高测量一致性和精度方面的潜在价值。第四,研究产出了具有直接临床应用价值的成果,即针对不同CT测量直径、层厚和结石成分的真实直径预测区间,使放射科医生和临床医生能够更科学地评估偶然发现结石的潜在真实大小。

其他有价值的内容包括:研究承认了QSAS的局限性,例如不能区分肾结石与其他钙化灶(如血管钙化、肾囊肿钙化),仍需放射科医生进行质量控制;同时也指出了模型研究的局限性,如无法完全模拟体内运动、不同体型等因素,且仅使用了一台扫描仪和一种协议。这些都为未来研究指明了方向。这项研究通过精密的模型实验和临床验证,为CT自动肾结石分析工具的临床应用提供了关键的效能基准和解读框架,强调了在利用不同CT协议进行结石评估时,必须了解其技术局限性,并对自动化工具的输出结果进行情境化解读。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com