基于优化深度卷积神经网络的皮肤癌诊断研究

分享自：
基于优化深度卷积神经网络的皮肤癌诊断研究

生物医学工程
医学
信息科学
人工智能
肿瘤学
期刊:scientific reports
【点击此处】阅读全文、收藏及针对性提问
这篇文档属于类型a，即报告了一项独立原创研究。以下是基于文档内容的学术报告：
主要作者及机构
 本研究由Tri-Cong Pham、Chi-Mai Luong、Van-Dung Hoang和Antoine Doucet共同完成。作者分别来自越南科学技术研究院（Vietnam Academy of Science and Technology）、河内水利大学（Thuy Loi University）、FPT软件公司（FPT Software）、胡志明市技术教育大学（Ho Chi Minh City University of Technology and Education）以及法国拉罗谢尔大学（University of La Rochelle）。研究于2021年发表在《Scientific Reports》期刊上。
学术背景
 本研究聚焦于皮肤癌中最危险的类型——黑色素瘤（melanoma）的早期诊断。黑色素瘤的死亡率极高，早期检测和切除是治愈的关键。近年来，人工智能（AI）在图像识别领域取得了显著进展，特别是在皮肤病变图像分类方面。然而，现有研究面临数据集不平衡（imbalanced dataset）的问题，导致模型在敏感度（sensitivity）和特异性（specificity）上表现不均衡。本研究旨在通过优化深度学习模型，提出一种改进的卷积神经网络（CNN）架构，以解决数据集不平衡问题，并提高黑色素瘤诊断的准确性。
研究流程
 研究分为以下几个主要步骤：
数据集准备
 研究使用了ISIC 2019挑战数据集，包含25,331张皮肤病变图像，其中17,302张用于本研究（4,503张黑色素瘤图像和12,799张痣图像）。数据集按80:10:10的比例分为训练集、验证集和测试集。此外，研究还使用了MClass-D数据集，包含100张皮肤病变图像，用于与157名德国皮肤科医生的诊断结果进行对比。
模型架构设计
 研究提出了一种优化的深度学习架构，包括以下关键特征：
自定义损失函数（Custom Loss Function, CLF）：通过分别计算黑色素瘤图像的正均方误差（Positive Mean Squared Error, PMSE）和痣图像的负均方误差（Negative Mean Squared Error, NMSE），优化模型在少数类（黑色素瘤）上的学习能力。
 
自定义小批量逻辑（Custom Mini-Batch Logic）：确保每个小批量中黑色素瘤和痣图像的比例固定，以增强CLF的效果。
 
改进的全连接层（Reformed Fully Connected Layers）：使用批归一化（Batch Normalization）和Dropout层提高模型效率，输出层使用Sigmoid激活函数进行二分类。
模型训练与优化
 研究对比了多种CNN架构（如InceptionV3、ResNet50和DenseNet169），最终选择DenseNet169作为基础架构。模型使用Adam优化器进行训练，学习率采用周期性学习率（Cyclical Learning Rate, CLR）策略，以提高分类性能。
模型评估
 研究通过以下指标评估模型性能：
曲线下面积（Area Under Curve, AUC）：衡量模型的整体分类性能。
 
敏感度（Sensitivity, Sen）：衡量模型正确识别黑色素瘤的能力。
 
特异性（Specificity, Spe）：衡量模型正确识别痣的能力。
 研究在测试集和MClass-D数据集上评估模型，并与157名皮肤科医生的诊断结果进行对比。
主要结果
 1. 模型性能
 提出的优化模型在测试集上的AUC为94.4%，敏感度为85.0%，特异性为95.0%。在MClass-D数据集上，模型的AUC为94.4%，敏感度为85.0%，特异性为95.0%，均优于所有157名皮肤科医生。使用最佳阈值时，模型的敏感度和特异性分别为90.0%和93.8%，达到了最平衡的性能。
对比分析
 与现有方法相比，本研究提出的模型在AUC、敏感度和特异性上均表现出色。例如，与使用InceptionV3的模型相比，本研究模型的AUC提高了3.2%，敏感度和特异性更加均衡。
损失函数与批量逻辑的效果
 研究通过对比不同配置的模型（原始模型、仅使用自定义批量逻辑的模型、同时使用自定义损失函数和批量逻辑的模型），验证了自定义损失函数和批量逻辑在提高模型性能上的有效性。
结论
 本研究提出了一种基于优化深度学习架构的黑色素瘤分类系统，通过自定义损失函数、批量逻辑和改进的全连接层，显著提高了模型在数据集不平衡情况下的性能。研究结果表明，该模型在AUC、敏感度和特异性上均优于现有方法和人类皮肤科医生，为黑色素瘤的早期诊断提供了高效的工具。
研究亮点
 1. 创新性方法：提出了一种针对数据集不平衡问题的自定义损失函数和批量逻辑，显著提高了模型在少数类上的学习能力。
 2. 高性能模型：在多个数据集上验证了模型的高效性，特别是在与人类皮肤科医生的对比中表现出色。
 3. 应用价值：研究结果为黑色素瘤的早期诊断提供了新的技术手段，具有重要的临床应用价值。
其他有价值的内容
 研究团队公开了实验的源代码和数据分割，以便其他研究人员复现和进一步研究。这一举措有助于推动相关领域的研究进展。
以上是本研究的详细报告，涵盖了研究的背景、流程、结果、结论及其意义。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问