这篇文档属于类型a,即报告了一项原创性研究。以下是对该研究的详细介绍:
该研究的主要作者包括Chun-Mei Feng、Yunlu Yan、Geng Chen、Yong Xu、Ying Hu、Ling Shao和Huazhu Fu。他们分别来自哈尔滨工业大学(深圳)深圳视觉目标检测与识别重点实验室、西北工业大学计算机科学与工程学院、Terminus Group以及新加坡A*STAR高性能计算研究所。该研究发表于《IEEE Transactions on Medical Imaging》期刊,时间为2021年。
该研究的主要科学领域是医学影像学,特别是磁共振成像(Magnetic Resonance Imaging, MRI)的加速成像技术。MRI在软组织对比度方面优于计算机断层扫描(CT),且避免了辐射暴露,但其扫描时间较长,影响了患者的体验并增加了成本。因此,加速MRI成像成为研究热点,特别是从欠采样k空间数据中重建图像的技术。然而,欠采样导致的混叠伪影(aliasing artifacts)会影响临床诊断。因此,研究的目标是从欠采样的k空间中恢复高质量图像,主要方法包括MRI图像重建和超分辨率(Super-Resolution, SR)技术。
现有的研究通常将辅助模态(auxiliary modality)作为先验信息简单结合,缺乏对不同模态融合机制的深入研究,且主要依赖卷积神经网络(CNN),而CNN在捕捉长距离依赖关系方面存在局限性。为此,作者提出了一种多模态Transformer(Multi-Modal Transformer, MTrans),旨在通过改进的多头注意力机制(Cross Attention Module)从辅助模态中吸收对目标模态有益的特征,从而实现加速MRI成像。
研究的主要流程包括以下几个步骤:
数据准备:研究使用了三个原始MRI数据集:FastMRI、UIMRI和多线圈数据集。FastMRI是目前最大的公开原始MRI数据集,UIMRI数据集包含400名受试者的全脑T1加权和T2加权k空间数据,多线圈数据集则包含20对膝盖PD和PDFS受试者的多线圈数据。数据集在实验前通过仿射配准进行对齐。
模型设计:MTrans模型由三个主要组件构成:两个分支的头部(Head)、多模态Transformer和尾部(Tail)。头部用于从多模态输入图像中提取不同尺度的模态特定特征,多模态Transformer用于聚合不同模态的特征,尾部则用于将特征映射为重建图像。模型通过多尺度图像块(patch)处理不同模态,捕捉高层上下文特征和局部细节。
特征提取与融合:头部由三个3×3卷积层组成,分别提取辅助模态和目标模态的特征。多模态Transformer将特征分割为图像块,并通过改进的交叉注意力模块(Cross Attention Module)进行模态间的特征融合。交叉注意力模块通过将当前分支的特征作为查询(query),与其他分支的特征进行交互,从而吸收有用的信息。
损失函数:研究采用L1损失函数来评估结果,损失函数包括目标模态和辅助模态的重建误差,通过权重α进行平衡。
实验与评估:研究在多个加速多模态MRI任务上评估了MTrans模型,包括MRI图像重建和超分辨率任务。实验结果表明,MTrans在FastMRI和真实临床数据集上均优于现有的最先进方法。
研究的主要结果包括:
重建任务:在FastMRI和UIMRI数据集上,MTrans在随机和等间隔欠采样模式下的重建结果均优于其他方法。例如,在FastMRI随机4倍欠采样下,MTrans的PSNR为29.3 dB,SSIM为0.638,均高于其他方法。
超分辨率任务:在FastMRI和UIMRI数据集上,MTrans在4倍放大任务中也表现出色。例如,在FastMRI数据集上,MTrans的PSNR为31.9 dB,SSIM为0.719,显著优于其他方法。
多线圈数据重建:在多线圈数据集上,MTrans的重建结果也优于传统方法和其他CNN方法,证明了其在多线圈场景下的有效性。
该研究提出了一种基于Transformer的多模态MRI加速成像框架MTrans,通过改进的交叉注意力模块有效地融合了不同模态的特征,捕捉了全局信息,显著提高了重建图像的质量并减少了伪影。MTrans在多个加速MRI任务上均表现出色,为多模态MRI成像提供了新的研究思路。
研究还进行了广泛的消融实验,验证了交叉注意力模块和多模态融合策略的有效性。此外,研究还探讨了不同融合策略和参数设置对结果的影响,进一步证明了MTrans的优越性。
总体而言,该研究为加速多模态MRI成像提供了一种高效且创新的解决方案,具有重要的科学价值和应用前景。