基于噪声生成和成像机制的隐式正则化学习网络用于低剂量CT重建

基于噪声生成和成像机制的隐式正则化学习网络在低剂量CT重建中的应用

低剂量计算机断层扫描(Low-Dose Computed Tomography,LDCT)已成为现代医学成像的重要工具,旨在降低放射性风险并保持图像质量。然而,降低X射线剂量常导致数据受损并引起反投影(FBP)重建不良,进而影响图像质量。为了应对这一问题,研究人员不断开发高级算法以在减少噪声和伪影的同时获取高质量图像。本次报道将详细介绍一项新的研究成果,旨在实现高性能的LDCT重建。

隐式正则化学习网络

背景介绍

在X射线CT成像中,减少辐射剂量一直是追求的目标,通过降低X射线管电流和/或电压,稀疏视图以及限制角度扫描来实现。然而,这些成像协议可能导致数据损坏和不稳定重建,从而使用经典的FBP算法得到的图像质量较差。因此,开发新的高质量重建算法,尤其是在LDCT中,成为迫切需求。

传统方法可分为三类:基于投影的校正方法、基于图像的恢复方法和迭代重建算法。基于投影的校正方法结合测量噪声的统计特征和先验知识进行去噪,然后使用FBP重建得到的投影数据。基于图像的恢复方法则利用图像域的先验信息处理重建图像上的伪影和噪声。迭代重建算法通过结合测量噪声的统计特征和CT图像的先验信息构建目标函数,通过优化迭代来获得高质量的CT图像。然而,选择适当的正则化和超参数非常困难,迭代算法通常因为反复的前后投影而计算成本高昂,限制了其临床应用。

近年来,CT重建技术逐渐集中在深度学习(Deep Learning,DL)方法上,尤其是数据驱动和模型驱动的深度学习策略。这些策略利用成对训练数据学习从噪声测量或图像到目标图像的非线性映射,尽管这些方法在计算成本和应用上令人鼓舞,但其输出可能缺乏数据一致性,需要大量的临床训练数据。

研究出处

这篇题为“Noise-Generating and Imaging Mechanism Inspired Implicit Regularization Learning Network for Low Dose CT Reconstruction”的研究论文刊登在IEEE Transactions on Medical Imaging期刊,卷号为43,编号为5,发布时间为2024年5月。作者包括Xing Li、Kaili Jing、Yan Yang、Yongbo Wang、Jianhua Ma、Hairong Zheng和Zongben Xu,分别来自西安交通大学、渥太华大学、南方医科大学、深圳先进技术研究院等研究机构。

研究方法

本文提出了一种基于全域噪声生成和成像机制的LDCT重建新模型,综合考虑LDCT内在噪声的统计特性以及图像域和sinogram域的先验信息。该模型通过基于近端梯度技术的优化算法来解决,具体步骤如下:

模型构建

  1. 生成模型定义

    • 投影数据( s )通常包含噪声,我们设定如下生成模型:[ s = t + \epsilon ]
    • 其中( t )表示探测器获得的射线量子,服从泊松分布;( \epsilon )为电子噪声,服从高斯分布。
  2. 优化问题的转化

    • 根据最大后验估计(MAP)理论,找到无噪声的干净投影数据( y )。再加入重建的CT图像( x )的数据保真度约束及sinogram和图像域上充足的正则化,优化问题形式化为:[ \min{t,y,x} \sum{i=1}^n \left((s_i - t_i )^2 / 2\sigma^2 - t_i \ln I_0 + t_i y_i + \ln t_i ! + I_0 e^{-y_i}\right) + \lambda_1 g_1(y) + \lambda_2 g_2(x) + |Ax - y|_2^2 / 2 ]

模型优化

使用交替更新投影域、sinogram域和图像域的数据,具体步骤如下:

  1. 更新投影数据( t )

    • 求解复合泊松分布参数的问题,通过连续变量松弛问题,使用牛顿法更新投影数据。
  2. 更新sinogram数据( y )

    • 根据近似二阶导数最小化对象函数,计算y的更新公式为:[ y^{(n)} = \textrm{prox}_{\lambda_1 \eta_2}(y^{(n-1)} - \eta_2 \nabla f(y^{(n-1)})) ]
  3. 更新CT图像( x )

    • 同样采用二阶导数最小化对象函数,计算x的更新公式为:[ x^{(n)} = \textrm{prox}_{\lambda_2 \eta_3}(x^{(n-1)} - \eta_3 \nabla f(x^{(n-1)})) ]

网络结构

我们将算法扩展到深度网络,通过展开每步迭代,构建名为NGIM-IRL的网络架构。该网络包含以下三个模块:

  1. T-Net:解决子问题,更新投影数据。
  2. Y-Net:解决sinogram数据恢复问题。
  3. X-Net:解决CT图像恢复问题。

该网络结构通过两个深度神经网络隐式学习sinogram和图像域的对应正则化操作符,提高了重建过程的解释性和有效性。

研究结果

该方法在多个数据集上展现了其优越性能。

数据集与实验设置

使用来自Mayo Clinic的Whole-body CT Scan Images数据集,以及Lodopab-CT数据集进行实验,模拟多种降级水平的低剂量图像。

实验结果

在不同剂量水平下的实验结果表明,相比传统和其他基于深度学习的方法,NGIM-IRL在峰值信噪比、结构相似性度量和均方根误差等方面表现优异。具体表现如下:

  1. 低剂量CT Grand Challenge数据集:在三个位剂量下,该方法都表现出最佳的图像质量和低伪影水平。
  2. Lodopab-CT数据集:该方法在定量指标上显著优于其他比较方法,表明其在低剂量CT重建任务中的良好适应性和稳健性。

网络训练与执行效率

相比其他迭代深度学习方法,NGIM-IRL的训练时间更短,执行时间也较快,尤其是在临床应用中更为重要。

研究意义

  1. 科学意义:该研究提出了一种基于噪声生成和成像机制的新模型,改进了LDCT重建的理论和实践,填补了传统方法和单纯基于机器学习方法的空隙。
  2. 应用价值:该方法在降低计算成本和提高图像质量方面显示出显著优势,具有重要的临床应用潜力。

本文提出的NGIM-IRL方法不仅在多个定量指标上超越了现有的方法,而且在实际图像质量和执行效率上也显示出显著优势,为LDCT重建领域提供了新的解决方案及研究方向。后续,研究团队将继续探索扩展该方法到光子计数CT和光谱CT的可能性,以进一步提升其临床应用价值。