分享自:

基于对比学习和原型学习的实例级多示例学习框架用于全切片图像分类

期刊:ieee transactions on circuits and systems for video technology

基于对比学习和原型学习的全切片图像分类方法:INS框架的创新研究

作者及发表信息
本研究由复旦大学基础医学院数字医学研究中心的Linhao Qu、Yingfan Ma、Xiaoyuan Luo、Qinhao Guo、Manning Wang及Zhijian Song团队完成,发表于《IEEE Transactions on Circuits and Systems for Video Technology》。研究得到中国国家自然科学基金(项目号82072021)支持,代码已开源(GitHub: https://github.com/miccaiif/ins)。


学术背景
全切片图像(Whole Slide Image, WSI)的自动化分析是病理诊断的重要方向,但其超高分辨率(可达百亿像素)和缺乏细粒度标注的特点,使得传统深度学习方法难以直接应用。多示例学习(Multiple Instance Learning, MIL)是当前WSI弱监督分类的主流框架,将每张WSI视为一个“包”(bag),其分割的小块(patch)为“实例”(instance)。现有MIL方法分为两类:
1. 基于实例的方法:通过伪标签训练实例分类器,但伪标签噪声大;
2. 基于包的方法:通过注意力机制聚合实例特征,但难以识别困难阳性实例(如小肿瘤区域)。

本研究提出INS框架,首次在MIL中结合对比学习(Contrastive Learning)与原型学习(Prototype Learning),旨在同时提升实例级和包级分类性能,并解决现有方法的局限性。


研究方法与流程
1. 问题建模
- 输入:WSI数据集,每张图像划分为无重叠patch(实例),包标签满足“至少一个阳性实例即为阳性包”。
- 目标:在仅包标签监督下,实现实例级和包级分类。

  1. INS框架设计

    • 核心组件
      • 实例级弱监督对比学习(IWSCL):利用负包中的真实阴性实例指导特征空间分离,通过动态嵌入队列(embedding queue)构建家族样本集(family set),优化特征表示。
      • 原型伪标签生成(PPLG):维护阳性和阴性原型向量,通过特征距离生成高质量伪标签,并采用滑动更新策略(α=0.99)稳定训练。
      • 联合训练策略:IWSCL、PPLG与实例分类器协同优化,通过真实阴性实例引导模型方向。
  2. 实验设计

    • 数据集
      • 合成数据:CIFAR-MIL(5%-70%阳性比例);
      • 真实数据:Camelyon16(乳腺癌转移)、TCGA-Lung(肺癌亚型)、宫颈癌内部数据集(淋巴结转移预测等3项临床任务)。
    • 对比方法:11种现有MIL方法,包括MILRNN、ABMIL、DSMIL等。
    • 评估指标:实例和包分类的AUC与准确率。
  3. 技术细节

    • 网络结构:ResNet18编码器+MLP分类器,嵌入队列长度8192,原型维度128。
    • 损失函数:总损失为对比损失(IWSCL)、分类损失(PPLG)和包约束损失的加权和(λ1=1, λ2=0.5)。

主要结果
1. 合成数据实验
- INS在CIFAR-MIL所有阳性比例下均达最优性能(实例AUC 0.9418-0.9720,包AUC 0.9408-1.0),尤其在低阳性比例(5%)下显著优于基线(如ABMIL实例AUC仅0.8485)。

  1. 真实数据实验

    • Camelyon16:实例AUC 0.9583(较第二名WENO提升2.1%),包AUC 0.9016(提升3.8%);
    • TCGA-Lung:包AUC 0.9837(最优);
    • 宫颈癌数据集:淋巴结转移预测任务AUC 0.8677,显著优于现有方法(如TransMIL为0.8126)。
  2. 可解释性分析

    • 在宫颈癌淋巴结转移预测中,INS识别出高风险病理模式“微乳头状结构”(micropapillae),为临床提供新知识。

结论与价值
1. 科学价值
- 提出首个结合对比学习与原型学习的MIL框架,解决了伪标签噪声和困难实例识别问题;
- 通过IWSCL和PPLG的协同优化,实现了弱监督下的高精度实例分类。

  1. 应用价值
    • 在肿瘤诊断、亚型分型、预后预测等任务中表现优异,尤其适用于医生无法直接判读的临床任务(如淋巴结转移预测);
    • 开源代码和可视化工具助力病理学研究。

研究亮点
1. 方法创新
- 首次在MIL中引入实例级弱监督对比学习,有效分离特征空间;
- 原型伪标签生成策略通过动态更新机制减少噪声。

  1. 性能突破

    • 在6项任务中全面超越现有方法,实例分类性能接近全监督模型;
    • 在低阳性比例(5%)下仍保持稳定性能。
  2. 临床意义

    • 发现“微乳头状结构”与淋巴结转移的关联,推动病理模式研究。

其他价值
- 实验涵盖模拟与真实数据,验证了方法的泛化性;
- 针对不同临床需求(如免疫组化标志物预测)提供定制化解决方案。

(注:全文约2000字,涵盖研究全貌及技术细节,符合学术报告规范。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com