分享自:

基于双能计算机断层扫描与机器学习的肾结石成分无剂量依赖性表征:一项离体研究

期刊:European RadiologyDOI:10.1007/s00330-019-06455-7

本研究报告旨在介绍一项发表于《European Radiology》期刊的研究,题为“Urogenital dose independent characterization of renal stones by means of dual energy computed tomography and machine learning: an ex-vivo study”。该研究由德国科隆大学医院的Nils Große Hokamp博士等人于2019年完成并发表。本研究属于类型a,是一项关于利用双能计算机断层扫描(Dual-Energy Computed Tomography, DECT)结合机器学习(Machine Learning, ML)进行肾结石成分分析的离体原创性研究。

一、 研究作者、机构及发表信息

本研究的主要作者包括Nils Große Hokamp、Simon Lennartz、Johannes Salem、Daniel Pinto dos Santos、Axel Heidenreich、David Maintz和Stefan Haneder。他们主要来自德国科隆大学医院的放射诊断与介入放射学研究所(Institute for Diagnostic and Interventional Radiology)以及泌尿科(Department of Urology)。其中,Simon Lennartz博士也隶属于Else Kröner Forschungskolleg克隆进化研究学院。这项研究于2019年9月12日被接受,并最终发表在放射学领域的知名期刊《European Radiology》上。

二、 学术背景与研究目的

肾结石是发达国家中一个重大的健康问题,终生发病率高达15%,且其发病率和患病率近年来呈上升趋势。结石的成分多种多样,最常见的成分是草酸钙(一水或二水合物,即一水草酸钙Whewellite或二水草酸钙Weddellite),约占70-85%,其次是尿酸结石(10-15%)和磷酸铵镁(鸟粪石)结石(5-10%)。此外,还有黄嘌呤、胱氨酸和磷酸钙等罕见成分。结石的成分、数量、大小和位置是决定治疗方案(如药物治疗、体外冲击波碎石、内镜手术等)的关键因素。例如,鸟粪石结石常与感染相关,可能需要抗生素治疗;而尿酸结石则可能通过碱化尿液溶解。因此,在治疗前非侵入性地准确判断结石成分具有重要的临床意义。

传统的CT成像可以区分不透射线(如钙盐结石)和可透射线(如尿酸结石)的结石,但无法进一步细分钙盐结石的具体类型或准确识别混合性结石。近年来,双能CT(DECT)技术的发展为结石成分分析提供了新的可能。DECT通过获取物质在不同X射线能量下的衰减特性差异,能够提供比常规CT更丰富的材料信息。已有大量研究证明,DECT可以高精度地区分尿酸结石与非尿酸结石。然而,这些研究大多集中在单一成分(单晶体)的结石上,对于临床上同样常见的混合成分(双晶体)结石,相关研究较少且结果不一。此外,既往研究多采用手动放置感兴趣区(Region of Interest, ROI)测量衰减值并计算比值的方法,这种方法可能受ROI放置位置的影响,且未能充分利用图像中的所有体素信息。同时,不同研究采用的扫描剂量(常规剂量与低剂量)也可能影响衰减比值,限制了方法的普适性。

在此背景下,本研究引入了机器学习(ML),特别是浅层神经网络(Shallow Neural Network),作为数据分析的新工具。机器学习能够处理复杂的、高维的数据集,并从中学习模式,有望超越传统基于阈值的比值分析方法。本研究采用了一种新型的DECT技术——光谱探测器CT(Spectral Detector CT, SDCT)。与传统的双源CT(Dual-Source CT, DSCT)不同,SDCT采用双层探测器,能够同时、同空间地记录低能和高能光子的信息,避免了双源CT因角度插值可能引入的图像噪声,理论上能提供更精确的能谱数据。

因此,本研究的主要目的有两个:第一,评估基于SDCT获取的图像信息(包括常规图像、低keV和高keV虚拟单能图像)并结合机器学习(浅层神经网络),是否能够准确预测肾结石(包括纯结石和混合结石)的主要成分。第二,评估该机器学习模型的诊断准确性是否依赖于CT扫描的辐射剂量(即是否在低剂量和常规剂量下都能保持稳定性能)。

三、 详细研究流程

本研究是一项离体(ex-vivo)实验研究,其工作流程系统而严谨,主要包括以下几个步骤:

1. 研究样本准备与参考标准确立: 研究者收集了200颗通过非破坏性取石术获得的肾结石。所有结石在体外使用红外光谱法(Infrared Spectroscopy)进行成分分析,以此作为判断结石成分的“金标准”。红外光谱提供了结石的定量成分分析。根据分析结果,这200颗结石被分为纯(单晶体)和复合(双晶体)两种类型。其中,纯结石有116颗,复合结石有84颗。结石的主要成分被归纳为5大类进行后续分析:钙化类(包括一水草酸钙、二水草酸钙、磷酸钙)、胱氨酸、鸟粪石、尿酸和黄嘌呤。具体数量为:一水草酸钙80颗,二水草酸钙21颗,磷酸钙39颗,胱氨酸20颗,鸟粪石13颗,尿酸18颗,黄嘌呤9颗。结石大小在3至18毫米之间。这种详尽的样本构成确保了研究能够覆盖临床常见及少见的结石类型,并专门纳入了相当比例的混合性结石,以检验方法的鲁棒性。

2. 图像采集与重建: 所有结石被放置在一个非拟人水模的中心位置,使用飞利浦的IQon光谱探测器CT(SDCT)进行扫描。该设备的核心创新在于其双层探测器技术,能够同步采集低能和高能数据。扫描参数设置为:管电压120 kVp,准直64×0.625 mm,螺距0.359,矩阵512×512。为了模拟临床上的不同剂量场景,研究采用了两种管电流设置:41 mAs(低剂量协议,LD)和205 mAs(常规剂量协议,ND),对应的容积CT剂量指数(CTDIvol)分别为2 mGy和10 mGy。每个剂量协议都重复扫描两次,从而产生四个独立的数据集:ND1, ND2, LD1, LD2。这为后续验证模型在不同扫描条件下的稳定性提供了基础。对于每次扫描,除了重建常规图像(Conventional Images, CI)外,还重建了低能量(40 keV)和高能量(200 keV)的虚拟单能图像(Virtual Monoenergetic Images)。这些不同能量的图像包含了结石对不同能量X射线的衰减信息,是后续特征提取的关键。

3. 结石分割与数据准备: 所有图像序列被导入开源DICOM查看器Horos。研究者采用其内置的基于阈值的半自动分割算法对每个结石进行三维体积分割。分割是在常规图像上进行的,阈值区间设置为[0, +4096] Hounsfield单位(HU)。这样做的目的是模拟临床常规阅片流程,并确保包含所有相关体素信息(例如,有些体素在高keV图像上可能不显影)。分割完成后,将每个结石在常规图像上定义的体积感兴趣区(VOI)复制并粘贴到对应的40 keV和200 keV图像上,从而确保三个图像序列中每个结石的体素位置完全对应。随后,使用嵌入在Horos的PyOsirix插件中的Python脚本,将每个结石在所有三个图像序列(CI, 40keV, 200keV)中每一个体素的CT值(衰减值)导出为纯文本文件。最终,将所有结石的所有体素的衰减特征(每个体素对应三个衰减值)合并成一个总的数据文件,作为机器学习模型的输入数据。这个过程实现了从图像到结构化数据的转换,为基于体素的分析奠定了基础。

4. 神经网络设计、训练与测试: 本研究采用了一个浅层神经网络(Shallow Neural Network),在MATLAB环境中实现。网络结构相对简单,包含一个隐藏层(10个神经元)和一个输出层(5个神经元,对应5类主要结石成分),激活函数均为S型函数(Sigmoid)。这种“浅层”设计适用于当前的数据规模和任务复杂度。数据划分策略是本方法学的关键:研究者将第一次常规剂量扫描(ND1)获得的所有体素数据(共75,735个体素)随机分为三部分:训练集(70%,53,015体素)、验证集(15%,11,360体素)和测试集(15%,11,360体素)。训练集用于调整网络权重,验证集用于在训练过程中监控模型性能并防止过拟合,而ND1的测试集用于初步评估模型在“同剂量、同次扫描但未见过的数据”上的表现。更重要的是,为了检验模型的泛化能力和剂量独立性,训练好的神经网络被直接应用于另外三个完全独立的数据集进行测试:第二次常规剂量扫描(ND2)、第一次低剂量扫描(LD1)和第二次低剂量扫描(LD2)。这种测试方式严格模拟了模型应用于新患者或不同扫描协议时的场景。

5. 统计分析: 性能评估主要通过混淆矩阵和接收者操作特征曲线(ROC)进行。计算了基于体素(per-voxel)和基于整个结石(per-stone)的预测准确率。基于体素的准确率指模型正确分类的体素占总体的百分比。基于结石的准确率则是将单个结石的所有体素预测结果进行汇总(例如,通过多数投票),得出该结石的整体成分分类,再与金标准比较。此外,研究还使用ANOVA方差分析比较了不同成分结石在常规、低keV和高keV图像上的平均衰减值差异。

四、 主要研究结果

1. 衰减特征: 研究首先报告了不同成分结石在三种图像上的平均CT值(HU)。数据显示,不同成分的结石在三组图像上的衰减模式存在显著差异。例如,钙化类结石在常规图像上衰减值最高(542.6 ± 240.5 HU),在低keV图像上急剧升高(1558.6 ± 459.2 HU),而在高keV图像上接近零(7.0 ± 139.1 HU)。尿酸结石的衰减值则相对较低且在不同能量间变化较小。这些差异为机器学习模型区分不同成分提供了物理基础。统计检验(ANOVA)证实了这些差异具有显著性。

2. 神经网络性能(基于体素): 使用ND1数据训练神经网络仅用了28秒和170次迭代。模型在ND1验证集上达到了91.0%的准确率,表明训练有效且未出现过拟合。在ND1的独立测试集上,准确率为91.1%。当将此训练好的模型应用于完全独立的ND2数据集时,准确率同样为91.1%,证明了模型在相同剂量不同次扫描下的稳定性和可重复性。在应用于低剂量数据集时,模型依然保持了很高的准确率:LD1为87.1%,LD2为90.4%。这一结果直接支持了研究的第二个核心目标,即基于SDCT和机器学习的结石成分分析具有剂量独立性,在低剂量条件下也能可靠工作。

3. 错误分类分析: 混淆矩阵显示,无论是在常规剂量还是低剂量测试中,最容易发生错误分类的成分是鸟粪石(Struvite)胱氨酸(Cystine)。例如,在ND2测试中,鸟粪石体素的误分类率高达51.8%,胱氨酸为23.4%,尿酸为23.7%。被误分类的鸟粪石体素最常被预测为尿酸,而被误分类的胱氨酸体素最常被预测为钙化类结石。作者分析,这可能与这些成分的衰减特性在某些能量区间存在重叠有关。

4. 基于整个结石的性能: 尽管基于体素的准确率很高(>87%),但当把所有体素的预测结果汇总起来对整个结石进行分类时,误分类率略有上升。在ND2数据集中,共有28颗结石被错误分类(200颗中的14%)。其中12颗是复合结石,16颗是纯结石。错误分类最多的仍然是鸟粪石结石(10颗),而在这10颗被误判的鸟粪石结石中,有8颗是复合结石。这表明,虽然模型能很好地学习主要成分的特征,但当结石为混合成分时,体素层面的异质性可能会对整体分类造成一定干扰,但整体准确率(86%)仍然令人满意。

五、 研究结论与价值

本研究得出结论:结合光谱探测器双能CT(SDCT)的信息和浅层神经网络机器学习,可以准确地预测肾结石(包括纯结石和混合结石)的主要成分。更重要的是,该方法的准确性在常规剂量和低剂量CT协议下均能保持,显示出剂量独立性的特点。

其科学价值在于: 1. 方法学创新:首次系统地将基于体素的机器学习方法应用于SDCT肾结石成分分析,避免了传统ROI方法的主观偏差和信息利用不充分的问题。 2. 解决临床难点:明确将大量混合性结石纳入研究,并证明机器学习方法在此类复杂情况下的有效性,弥补了既往研究的不足。 3. 验证新技术:为新型SDCT技术在泌尿系结石精准分析方面的应用提供了扎实的实验证据。 4. 推动低剂量成像:证实了在低剂量扫描条件下仍能进行可靠的结石成分分析,这有助于在临床实践中推广低剂量CT检查,降低患者辐射风险。

其应用价值在于:为未来开发集成于临床工作流的自动化结石检测与成分分析工具奠定了基础。如果经过在体(in-vivo)研究的进一步验证,该方法有望帮助临床医生在术前无创地确定结石成分,从而为患者制定更个体化、更优化的治疗策略(例如,决定是否尝试药物溶解疗法,或选择何种手术方式),避免不必要的侵入性操作。

六、 研究亮点

  1. 研究对象的全面性:包含了200颗具有红外光谱金标准成分的结石,涵盖了所有主要结石类型,并特意纳入了高比例的(84颗)混合性结石,使研究结论更具临床代表性和说服力。
  2. 先进的技术平台:采用了新型的光谱探测器CT(SDCT),其时空匹配的双能数据采集方式为高精度体素分析提供了理想的数据源。
  3. 创新的分析方法:摒弃了传统的手动ROI测量法,采用了全自动的、基于整个结石体积所有体素的机器学习方法,最大限度地利用了图像信息,减少了人为误差。
  4. 严谨的验证策略:不仅使用了常规的训练-验证-测试集划分,更重要的是,用完全独立的、不同剂量和不同时间点扫描的数据集来测试模型,极好地证明了模型的鲁棒性和泛化能力,尤其是其剂量独立性这一核心优势。
  5. 明确的局限性探讨:作者坦诚地指出了研究的局限性,如仅为离体研究、所用SDCT系统单一、鸟粪石和胱氨酸分类准确性相对较低等,并为未来研究方向(如在体研究、全自动化流程、结合临床参数)提出了建议。

七、 其他有价值的内容

研究在讨论部分还深入比较了SDCT与更常见的双源CT(DSCT)在技术原理上的优劣,指出SDCT无需进行空间配准插值,可能减少图像噪声,有利于材料分解。同时,作者也讨论了将人工智能方法整合到临床常规中所面临的挑战(如耗时的手动分割),并展望了下一步实现全自动检测与分类的可能性。此外,研究还简要回顾了既往文献,通过表格形式总结了多项关于DECT结石分析的研究,为本研究提供了丰富的学术背景和对照。这些内容都增加了报告的深度和广度。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com