基于深度学习的结直肠息肉分割方法:系统性综述
作者及机构
本综述由Xin Liu(马来西亚理科大学电气与电子工程学院)、Nor Ashidi Mat Isa(通讯作者,同机构)、Chao Chen(马来西亚理科大学及四川轻化工大学自动化与信息工程学院)、Fajin Lv(重庆医科大学生物医学工程学院)共同完成,发表于期刊J. Imaging 2025年第11卷,文章编号293。
研究背景与意义
结直肠癌(Colorectal Cancer, CRC)是全球三大高发癌症之一,其早期筛查依赖结肠镜检测和息肉分割技术。然而,息肉在形态、大小、颜色和边界清晰度上存在高度多样性,且结肠镜图像对比度低,传统基于手工特征的方法(如纹理分析)泛化能力有限。2015年全卷积网络(Fully Convolutional Networks, FCNs)的提出推动了深度学习在该领域的应用,随后Transformer和Mamba等架构进一步提升了分割性能。本文系统性回顾了2018至2024年间发表的146篇论文,旨在总结不同网络架构(CNN、Transformer、混合架构、Mamba)在息肉分割中的进展,并分析其性能、数据集及未来趋势。
主要内容与观点
息肉分割的挑战与分类
息肉分割面临六大核心挑战:
CNN-based方法
Transformer-based方法
混合架构方法
Mamba-based方法
视频息肉分割
性能评估与数据集
- 评估指标:Dice系数(Dice Coefficient)、平均交并比(mIoU)、帧率(FPS)。
- 主流数据集:Kvasir-SEG、CVC-ClinicDB、ETIS-LaribPolypDB,涵盖不同分辨率与光照条件。
- 模型对比:44个模型中,TransFuse-S以98.7 FPS兼顾速度与精度,而Polyp-Mamba在长序列任务中表现最优。
未来趋势与挑战
1. 数据层面:需开发更大规模、多中心的标注数据集。
2. 算法层面:轻量化设计与域自适应(Domain Adaptation)是重点方向。
3. 临床整合:实时性需提升至≥30 FPS,并解决内镜器械遮挡等实际干扰。
论文价值
本综述首次系统梳理了Mamba架构在息肉分割中的应用,对比了不同方法的性能边界,为临床AI工具开发提供了技术选型参考。其提出的分类框架(如按问题导向划分网络架构)和开源数据集汇总(如Sun-SEG视频数据集)将成为领域基准。
亮点
- 全面性:涵盖146篇文献,时间跨度达7年,包括新兴的Mamba方法。
- 问题导向分析:将方法归类至具体挑战(如边界模糊、小息肉分割),而非仅按架构分类。
- 性能基准:提供44个模型的Dice、FPS等量化对比,辅助工程落地决策。