分享自:

基于深度学习的结直肠息肉分割方法:系统综述

期刊:J. ImagingDOI:10.3390/jimaging11090293

基于深度学习的结直肠息肉分割方法:系统性综述

作者及机构
本综述由Xin Liu(马来西亚理科大学电气与电子工程学院)、Nor Ashidi Mat Isa(通讯作者,同机构)、Chao Chen(马来西亚理科大学及四川轻化工大学自动化与信息工程学院)、Fajin Lv(重庆医科大学生物医学工程学院)共同完成,发表于期刊J. Imaging 2025年第11卷,文章编号293。

研究背景与意义
结直肠癌(Colorectal Cancer, CRC)是全球三大高发癌症之一,其早期筛查依赖结肠镜检测和息肉分割技术。然而,息肉在形态、大小、颜色和边界清晰度上存在高度多样性,且结肠镜图像对比度低,传统基于手工特征的方法(如纹理分析)泛化能力有限。2015年全卷积网络(Fully Convolutional Networks, FCNs)的提出推动了深度学习在该领域的应用,随后Transformer和Mamba等架构进一步提升了分割性能。本文系统性回顾了2018至2024年间发表的146篇论文,旨在总结不同网络架构(CNN、Transformer、混合架构、Mamba)在息肉分割中的进展,并分析其性能、数据集及未来趋势。

主要内容与观点

  1. 息肉分割的挑战与分类
    息肉分割面临六大核心挑战:

    • 形态多样性:息肉大小、形状、颜色差异显著,易与周围组织混淆。
    • 边界模糊:低对比度图像导致边缘难以精确分割。
    • 数据稀缺:像素级标注成本高,小样本易引发过拟合。
    • 泛化性不足:模型在跨数据集测试中性能下降。
    • 实时性需求:临床要求高帧率处理,但复杂模型计算量大。
    • 视频分割难点:内镜视频存在运动模糊、镜头抖动等干扰。
      作者按网络架构将方法分为五类:CNN、Transformer、混合架构、Mamba及其他(如扩散模型、SAM模型)。
  2. CNN-based方法

    • 优势:擅长局部特征提取,计算效率高(如U-Net、ResUNet++)。
    • 创新方向
      • 边界增强:如FEGNet通过拉普拉斯算子强化边缘特征;PRANet通过反向注意力逐步优化边界。
      • 多尺度处理:UHA-Net通过分层融合模块定位不同尺寸息肉。
      • 半监督学习:DEC-Seg仅需10%标注数据即可接近全监督性能。
    • 局限:长程依赖建模能力弱,对小息肉(面积≤1000像素)分割效果不稳定。
  3. Transformer-based方法

    • 优势:自注意力机制(Self-Attention)能捕捉全局上下文,如Swin-UNet和PolyFormer。
    • 创新方向
      • 多尺度交互:CTNet通过对比学习增强高层语义;MSRAFormer通过金字塔结构融合多尺度特征。
      • 轻量化设计:Polyp-LVT将参数量减少44%,保持13.21 GFLOPs计算量。
    • 局限:计算复杂度高,且对数据分布敏感(如SSFormer在域外数据上性能下降)。
  4. 混合架构方法

    • 设计思路:结合CNN的局部感知与Transformer的全局建模,如TransFuse通过双分支并行处理特征。
    • 典型模型
      • MVOA-Net引入几何方向Transformer编码器,提升多目标分割精度。
      • PFENet通过前景-边界协同增强模块优化模糊区域分割。
    • 局限:模型参数量大(如HD-Former),实时性受限。
  5. Mamba-based方法

    • 创新性:基于状态空间模型(SSM)的Polyp-Mamba通过线性复杂度处理长序列,在保持效率的同时提升边界敏感性。
    • 应用案例:VM-UNetv2通过视觉状态空间块(VSS Block)实现跨层特征融合,Dice系数提升1.5%。
  6. 视频息肉分割

    • 关键问题:时序信息利用与实时性平衡。
    • 代表性工作
      • PNS+通过全局-局部编码器提取时空特征,速度达170 FPS。
      • Diff-VPS引入多任务扩散模型,对抗视频中的运动模糊。

性能评估与数据集
- 评估指标:Dice系数(Dice Coefficient)、平均交并比(mIoU)、帧率(FPS)。
- 主流数据集:Kvasir-SEG、CVC-ClinicDB、ETIS-LaribPolypDB,涵盖不同分辨率与光照条件。
- 模型对比:44个模型中,TransFuse-S以98.7 FPS兼顾速度与精度,而Polyp-Mamba在长序列任务中表现最优。

未来趋势与挑战
1. 数据层面:需开发更大规模、多中心的标注数据集。
2. 算法层面:轻量化设计与域自适应(Domain Adaptation)是重点方向。
3. 临床整合:实时性需提升至≥30 FPS,并解决内镜器械遮挡等实际干扰。

论文价值
本综述首次系统梳理了Mamba架构在息肉分割中的应用,对比了不同方法的性能边界,为临床AI工具开发提供了技术选型参考。其提出的分类框架(如按问题导向划分网络架构)和开源数据集汇总(如Sun-SEG视频数据集)将成为领域基准。

亮点
- 全面性:涵盖146篇文献,时间跨度达7年,包括新兴的Mamba方法。
- 问题导向分析:将方法归类至具体挑战(如边界模糊、小息肉分割),而非仅按架构分类。
- 性能基准:提供44个模型的Dice、FPS等量化对比,辅助工程落地决策。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com