本研究的作者包括Adyasha Sahu(印度国立理工学院鲁尔克拉分校电子与通信工程系)、Pradeep Kumar Das(韦洛尔理工学院电子工程学院)和Sukadev Meher(印度国立理工学院鲁尔克拉分校电子与通信工程系)。该研究发表于期刊 Biomedical Signal Processing and Control 2024年第87卷,文章编号105377。
乳腺癌是全球女性死亡的第二大原因,早期准确检测对治疗至关重要。传统的乳腺癌检测依赖人工诊断,存在成本高、耗时长且易出错的问题。近年来,计算机辅助诊断(CAD, Computer-Aided Design)系统结合深度学习技术,显著提升了乳腺癌检测的效率和准确性。然而,医学影像数据集通常规模较小,限制了深度学习模型的性能。为此,本研究提出了一种基于迁移学习(Transfer Learning, TL)的集成分类器,结合多种深度学习模型,以提高小数据集下的乳腺癌检测性能。
研究使用了三种公开数据集:
- Mini-DDSM:包含9684张乳腺X光图像,本研究选取了600张(200正常、200良性、200恶性)。
- BUSI:包含780张超声图像,本研究选取了390张(130正常、130良性、130恶性)。
- BUS2:包含250张超声图像,本研究选取了200张(100良性、100恶性)。
预处理阶段采用拉普拉斯高斯改进高增强滤波(LOG-MHBF, Laplacian of Gaussian-based Modified High-Boosting Filter),通过结合拉普拉斯算子(边缘增强)和高斯滤波(降噪),提升图像质量。具体公式为:
[ P_m(i, j) = Im(i, j) + k \cdot L{gf}(i, j) ]
其中,( L_{gf}(i, j) ) 是拉普拉斯高斯滤波输出,( k=1.5 ),高斯核大小为7×7。
研究提出了一种集成分类器,结合以下三种迁移学习模型:
1. AlexNet:包含5个卷积层和3个全连接层,使用ReLU激活函数和Dropout防止过拟合。
2. ResNet18:通过残差连接(Skip Connection)解决深层网络的梯度消失问题。
3. MobileNetV2:采用深度可分离卷积(Depthwise Separable Convolution)和倒置残差结构(Inverted Residual Bottleneck),显著降低计算复杂度。
集成策略采用多数投票法(Majority Voting),即综合三个模型的预测结果,选择得票最高的类别作为最终输出。
研究分为两个阶段:
1. 异常检测:区分正常与异常(良性+恶性)图像。
2. 恶性检测:在异常图像中区分良性与恶性。
采用10折交叉验证(10-Fold Cross-Validation)评估模型性能,指标包括准确率(Accuracy)、灵敏度(Sensitivity)、特异性(Specificity)、F1分数(F1 Score)和AUC(Area Under Curve)。
与其他迁移学习模型(如VGG19、InceptionV3)相比,本研究的集成方法在各项指标上均表现最优。
本研究为小规模医学影像数据的深度学习应用提供了新思路,未来可扩展至其他癌症的早期检测领域。此外,提出的集成框架可结合稀疏学习(Sparse Learning)或元启发式算法(Meta-Heuristic Algorithms)进一步优化性能。