这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:
基于单模型深度学习的皮肤病变分类方法在样本不平衡小数据集上的应用
一、研究团队与发表信息
本研究由Peng Yao(中国科学技术大学精密科学仪器安徽省重点实验室)、Shuwei Shen(中国科学技术大学苏州高等研究院)等共同完成,通讯作者为Ronald X. Xu(中国科学技术大学)。合作单位包括美国俄亥俄州立大学医学中心皮肤科(Benjamin Kaffenberger)。论文发表于IEEE Transactions on Medical Imaging(2022年5月,第41卷第5期),标题为《Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion Classification》,DOI编号10.1109/TMI.2021.3136682。
二、学术背景
科学领域:本研究属于医学影像分析与人工智能交叉领域,聚焦皮肤病变的计算机辅助诊断(Computer-Aided Diagnosis, CAD)。
研究动机:尽管深度卷积神经网络(Deep Convolutional Neural Network, DCNN)在皮肤病变分类中表现出色,但公开数据集的小样本量和类别不平衡问题限制了其实际应用。例如,HAM10000数据集仅含10,015张图像,且不同病变类型的样本量差异显著(如黑色素瘤样本仅占5%)。
研究目标:提出一种适用于小规模、不平衡数据集的单模型深度学习方法,通过改进数据增强、损失函数和训练策略,实现高精度分类,并降低计算资源需求,便于在移动设备中部署。
三、研究流程与方法
1. 模型架构选择与验证
- 研究对象:对比了VGG、ResNet、EfficientNet、RegNet等不同复杂度的DCNN模型在4个皮肤病变数据集(ISIC 2018、ISIC 2019、ISIC 2017、7-pt)上的性能。
- 关键方法:
- 验证了中等复杂度模型(如RegNetY-3.2GFLOPS)在小型数据集上优于大型模型(如EfficientNet-B7)。
- 提出RegNetY-Drop:在RegNetY基础上引入DropBlock(卷积层正则化)和Dropout(全连接层正则化),参数
p=0.1
、块大小s=5
时,分类平衡准确率(Balanced Accuracy, BACC)提升0.002。
2. 改进的数据增强策略
- Modified RandAugment:
- 新增操作:在RandAugment的14种变换基础上,加入样本配对(Sample Pairing)、颜色投射(Color Casting)、高斯噪声(Gauss Noise)等7种操作,形成21种变换的搜索空间。
- 优化机制:将变换分为颜色类(13种)和形状类(8种),交替应用(如
n=2
时,先颜色后形状),概率p=0.7
时BACC达0.860(ISIC 2018)。
- 随机幅度:每种变换的幅度随机生成,优于固定幅度。
3. 多权重新损失函数(MWNL)
- 核心公式:
[ \text{MWNL}(z, y) = -c_y \left(\frac{1}{ny}\right)^\alpha \sum{i=1}^c \text{loss}_i ] - 类别权重:通过超参数
α=1.1
和c_{mel}=2.0
,提升罕见类别(如黑色素瘤)的损失权重。
- 异常样本抑制:当预测概率
p_t < 0.1
时,用常数g*
替代损失值,减少离群样本干扰。
4. 累积学习策略(CLS)
- 两阶段训练:
- 初始阶段(前20轮):标准训练,学习深层特征表示。
- 再平衡阶段(20-60轮):逐步引入类别权重调整,学习率同步衰减,优化分类器。
- 效果:在ISIC 2018上,BACC从0.864(MWNL)提升至0.872(MWNL-CLS)。
5. 实验设计与评估
- 数据集:
| 数据集 | 样本量 | 类别数 | 主要挑战 |
|————–|——–|——–|————————|
| ISIC 2018 | 10,015 | 7 | 样本不平衡、低对比度 |
| 7-pt | 1,011 | 5 | 极少量样本 |
- 评估指标:平衡准确率(BACC)、黑色素瘤灵敏度(Sen-Mel)、平均特异性(Avg-Spec)。
- 硬件:2块NVIDIA GeForce GTX 2080Ti显卡,PyTorch框架。
四、主要结果
模型性能对比:
- RegNetY-3.2GFLOPS在ISIC 2018上BACC达0.858,优于EfficientNet-B2(0.853)。
- 在ISIC 2019(25,331样本)中,RegNetY-8.0GFLOPS表现最佳,验证模型容量与数据量的正相关性。
消融实验:
- Modified RandAugment比原始RandAugment提升BACC 0.005(ISIC 2018)。
- MWNL在α=1.1时,黑色素瘤检测灵敏度从0.772(未加权)提升至0.871(
c_{mel}=2.0
)。
跨数据集验证:
- 在7-pt数据集(仅1,011样本)上,单模型BACC达0.842,超越多数集成方法。
五、结论与价值
科学价值:
1. 首次系统验证了中等复杂度模型在小规模医学图像数据上的优越性,挑战了“模型越大性能越好”的传统认知。
2. 提出的MWNL-CLS联合策略首次同时解决了类别不平衡、分类难度差异和异常样本干扰问题。
应用价值:
- 单模型推理时间仅0.05秒(90模型集成需13.9秒),适合部署于资源受限的移动设备,助力偏远地区皮肤癌筛查。
- 方法可扩展至其他医学影像分类任务(如肺癌结节识别)。
六、研究亮点
- 创新方法:
- Modified RandAugment通过分阶段变换增强数据多样性。
- MWNL首次整合类别权重、分类难度权重和异常抑制机制。
- 性能突破:在ISIC 2018和2019挑战赛中,单模型性能排名前三,超越多数集成方法。
- 开源共享:代码公开于GitHub(https://github.com/yaopengustc/mbit-skin-cancer.git)。
七、其他补充
论文对比了15种损失函数(如Focal Loss、LDAM),发现MWNL在医学图像中更具鲁棒性。此外,作者计划将算法集成至便携式皮肤镜设备,推动低成本筛查方案落地。