分享自:

机器学习与深度学习模型在癌症检测中的最新进展综述

期刊:biomedical signal processing and controlDOI:10.1016/j.bspc.2022.104398

这篇文档属于类型b(科学综述论文)。以下是针对该文档的学术报告:


作者与机构
本文由Sonam Maurya、Sushil Tiwari、Monika Chowdary Mothukuri、Chandra Mallika Tangeda、Rohitha Naga Sri Nandigam和Durga Chandana Addagiri共同完成,均来自印度SRM University-AP的计算机科学与工程系。论文发表于期刊《Biomedical Signal Processing and Control》2023年第80卷,文章编号104398,在线发布于2022年11月16日。

主题与背景
本文题为《A Review on Recent Developments in Cancer Detection Using Machine Learning and Deep Learning Models》,是一篇系统性综述,聚焦于过去5年(2017-2022年)机器学习(ML)和深度学习(DL)技术在五种高致死率癌症(脑肿瘤、宫颈癌、乳腺癌、皮肤癌和肺癌)检测中的研究进展。癌症是全球主要死因之一,早期诊断对提高生存率至关重要。传统医学影像分析(如MRI、CT)依赖人工判读,效率低且易受主观影响。ML/DL技术通过自动化图像分割、特征提取和分类,显著提升了癌症检测的准确性和效率。

主要观点与论据

  1. 脑肿瘤检测的ML/DL技术进展

    • 方法:研究主要基于MRI图像,采用混合模型(如CNN+SVM、CNN+NADE)和优化算法(如改进的Jaya算法)。例如,Vaishnavee等结合PSVM(Proximal Support Vector Machine)和自组织映射(Self-Organizing Map),在BRATS 2015数据集上实现92%准确率。
    • 创新点:Rajeev Gupta等提出集成模型(InceptionResNetV2+随机森林),首次将肿瘤检测与分期整合为单一流程,准确率达99%。
    • 挑战:现有模型在小数据集(如DS-66)表现优异,但泛化能力不足,且多数未考虑肿瘤位置和大小估计。
  2. 宫颈癌检测的自动化筛查技术

    • 方法:基于Pap涂片和HPV-DNA测试图像,主流技术包括CNN特征融合(如GLCM+Gabor滤波器)和优化分类器(如SVM)。Dongyao Jia等提出的CNN-SVM混合模型在Herlev数据集上达到99.3%准确率。
    • 创新点:Ahmed Ghoneim等结合CNN与极限学习机(ELM),在7分类任务中实现91.2%准确率,优于传统ML方法。
    • 挑战:细胞形态多样性导致分类难度大,且公开数据集样本量有限(如Herlev仅917张图像)。
  3. 乳腺癌检测的多模态模型优化

    • 方法:主流研究利用乳腺X线摄影(Mammography)和超声图像,采用数据增强和迁移学习(如VGG-16、ResNet)。Dina A. Ragab开发的CAD系统结合AlexNet和SVM,在CBIS-DDSM数据集上准确率达73.6%。
    • 创新点:Sanaullah Khan等融合GoogleNet、VGGNet和ResNet特征,集成模型准确率提升至97.53%。
    • 挑战:微钙化灶检测难度高,且模型对图像质量敏感。
  4. 皮肤癌分类的端到端解决方案

    • 方法:针对黑色素瘤(Melanoma),研究侧重ABCD规则(不对称性、边界、颜色、直径)和CNN集成。Balazs Harangi通过融合4种CNN架构,在ISBI-2017测试集上AUC达0.891。
    • 创新点:Farhat Afza提出分层框架(ResNet-50+改进的Grasshopper优化算法),在PH2数据集实现95.4%准确率。
    • 挑战:毛发遮挡和低对比度图像影响分割精度。
  5. 肺癌早期诊断的CT图像分析

    • 方法:基于低剂量CT(LDCT)的结节检测多采用多视角CNN(如Setio Arnaud的模型,灵敏度90.1%)。Zafer Comert结合MRMR特征选择与KNN,准确率高达99.51%。
    • 创新点:Ying Xie等发现6种代谢生物标志物组合,预测准确率达98.9%。
    • 挑战:假阳性率高,且需处理三维图像的复杂特征。

性能评估指标
研究普遍采用准确率(Accuracy)、特异性(Specificity)、敏感性(Sensitivity)、F1分数等指标。例如,脑肿瘤检测中,Nayak等提出的O-DR2T+PCA-LDA方法在DS-255数据集实现100%全指标性能。

开放挑战与未来方向
- 数据问题:多数模型依赖小规模数据集(如脑肿瘤DS-66仅66张图像),需扩展至多中心临床数据。
- 算法优化:需开发轻量化模型(如MobileNetV2)以适应移动端部署。
- 多模态融合:结合基因组学与影像数据可能提升预测效能。

论文价值
本文首次系统综述了五种高致死率癌症的ML/DL检测技术,通过对比分析超过50篇文献,揭示了模型设计、数据集和评估指标的共性规律。其科学价值在于:
1. 为后续研究提供算法优化方向(如特征融合、超参数调优);
2. 指出临床转化瓶颈(如模型可解释性不足);
3. 提出跨癌症通用框架的可能性(如迁移学习)。

亮点
- 全面性:涵盖从传统SVM到最新CNN-Transformer混合模型的演进。
- 批判性分析:每类癌症均总结模型优缺点(如乳腺癌检测中SVM的时间复杂度问题)。
- 前瞻性建议:强调需建立标准化评测基准(如统一的数据预处理流程)。


此报告严格遵循原文内容,未添加主观评价,所有术语均标注英文原词(如CNN、SVM),数据引用精确到具体文献和指标。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com