本研究的通讯作者是Xinjian Chen(IEEE高级会员),来自苏州大学电子与信息工程学院。其他主要作者包括Jingtao Wang、Muhammad Mateen(IEEE会员)、Dehui Xiang(IEEE会员)等,合作单位还包括山东第一医科大学医学信息与人工智能学院。该研究发表于IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)2025年10月刊(第47卷第10期)。
本研究属于医学图像分析与人工智能交叉领域,针对视网膜病变分割中标注数据稀缺的核心挑战。视网膜疾病如脉络膜新生血管(CNV)和色素性视网膜炎(RP)可导致严重视力损伤,而深度学习模型需要大量像素级标注数据,这类标注在医学领域耗时耗力且依赖专家知识。传统元学习方法(meta-learning)虽能解决小样本学习问题,但缺乏构建多任务的丰富类别医学数据集。因此,本研究提出任务增强的元学习分割方法(Task Augmentation-based Meta-learning Segmentation method, TAMS),通过创新的病灶模拟算法自动生成多类别视网膜病变数据,突破元学习在医学图像分割中的应用瓶颈。
研究目标包括: 1. 开发无需多源数据采集的元任务增强框架 2. 设计可解释的视网膜病灶模拟系统 3. 建立三阶段元学习训练方案提升模型泛化能力 4. 实现跨设备、跨模态的鲁棒性分割
核心创新在于提出的病灶模拟算法(Lesion Simulation Algorithm, LSA),包含两个关键模块:
(1)病灶特征生成 - 从真实视网膜病变图像提取三类特征:轮廓(contour)、尺寸(size)和位置(position) - 通过仿射变换(affine transformation)和弹性变形(elastic deformation)批量增强特征 - 示例:对OCT图像中的CNV病灶,采用func.2→func.3→func.4→func.5→func.8的模拟序列;对CFP图像的RP病灶则使用func.1→func.6→func.7→func.8序列
(2)病灶伪造模块 - 仿真函数库:基于OpenCV(cv2)开发可解释的定制化函数,能同步生成565×584(CFP)和1024×512(OCT)分辨率图像及像素级标签 - 生成模拟网络(GSNet):采用改进的对抗训练策略(算法2),包含: - U-Net编码器-解码器结构 - 多尺度特征融合模块(集成MAE的像素重建能力) - 马尔可夫判别器(PatchGAN)和复合损失函数(MSE+L1)
算法1详细描述了TAMS的工作流程:
阶段一:数据生成与预训练 - 输入:n张真实病变图像及其标签,k张正常图像 - 输出:n×k张带标签的合成图像(syn) - 使用合成数据预训练U-Net获得初始参数θ
阶段二:元训练 - 构建元任务分布p(τ):从n类合成数据中采样形成多任务(如2ways-5shot-5query) - 采用两种元学习算法: - MAML:通过支持集计算φτ = θ - α∇θLtrainτ(θ) - iMAML:引入正则化项φτ = argmin(Ltrainτ(θ) + λ/2‖φ-θ‖2) - 通过查询集损失优化元学习器参数θ’
阶段三:目标任务适应 - 在真实数据(target data)上微调获得最终参数θ” - 仅需30-50%的标注数据即可达到传统方法100%数据的性能
数据集涉及3种目标数据集和7种辅助数据集(表I): - BV1000:OCT-CNV数据集(94眼) - RPHS:CFP-RP数据集(219眼) - RIPS:公开CFP-RP数据集(8眼)
对比方法包括: - 传统深度学习:U-Net、U-Net++、TransUNet等 - 迁移学习(TL)与自监督学习(SSL)基线 - 其他元学习方法(使用D6-D10和FSS-1000构建任务)
评估指标:Dice系数(DSC)、IoU、召回率(recall)、精确率(precision)
表III显示TAMS在三个数据集上全面超越现有方法: - BV1000:iTAMS相比次优方法(D-UNet)提升DSC 11.13%、IoU 13.04% - RPHS:对罕见病RP的分割,DSC提升4.24% - RIPS:在小样本场景仍保持3.85%的DSC优势
图3表明: - 仅用30% BV1000标注数据时,MTAMS的DSC达64.37%,优于传统方法100%数据训练结果(64.21%) - 在RPHS上,使用40%数据即可达到传统方法57.32%的性能
图4对比显示: - 使用自生成数据的TAMS相比医疗数据集D6-D10构建的任务,DSC提升14.38% - 相比自然图像数据集FSS-1000,提升11.53% 证实合成数据在类别丰富度和领域适配性上的优势
表IV的消融实验证明: - GSNet使iTAMS在BV1000上的召回率提升4.24% - 在RPHS上精确率提升5.27%
作者指出当前病灶模拟函数的超参数仍需手动调整,未来计划: 1. 引入深度学习优化模拟参数 2. 整合Transformer等新型架构 3. 扩展至更多罕见视网膜病变
本研究为医学图像小样本分割建立了新范式,其任务增强策略对其他数据稀缺的医学AI应用具有重要参考价值。