分享自:

基于可解释人工智能的深度学习方法用于皮肤病变分类

期刊:IEEE AccessDOI:10.1109/access.2022.3217217

深度学习结合可解释性人工智能在皮肤病变分类中的应用研究综述

研究背景与简介

本文题为《A Deep Learning Approach Based on Explainable Artificial Intelligence for Skin Lesion Classification》,由Natasha Nigar、Muhammad Umar、Muhammad Kashif Shahzad、Shahid Islam及Douhadji Abalo等研究者联合发表,研究所属机构包括巴基斯坦工程与技术大学(UET)、美国Tekhqs公司、巴基斯坦电力信息技术公司及多哥洛美大学,发表于2022年《IEEE Access》期刊。这项研究的主要目标是通过结合深度学习与可解释性人工智能(XAI),开发一种准确且具有可解释性的皮肤病变分类模型,以协助皮肤科医生早期诊断皮肤癌。

皮肤癌是美国最常见的癌症类型之一,每年超过500万人确诊。由于皮肤病变在早期阶段往往具有相似性,医生诊断容易受到主观偏差的影响,而深度学习技术因其在图像处理和数据分析方面的优越性被广泛应用于此类任务。然而,传统的深度学习模型多被视为“黑箱”,其预测结果难以解释,从而阻碍了模型在临床实践中的应用。本文提出了一种基于可解释性人工智能的皮肤病变分类方法,旨在提高模型的透明度和可信度。


研究方法与技术流程

本研究采用了以下技术与步骤:

1. 数据集

研究使用了ISIC 2019公开数据集,其中包含25,331张RGB皮肤病变图像,分为8类病变:黑色素痣(Nevus)、黑色素瘤(Melanoma)、良性角化病(Benign Keratosis)、基底细胞癌(Basal Cell Carcinoma)、鳞状细胞癌(Squamous Cell Carcinoma)、血管病变(Vascular Lesion)、皮肤纤维瘤(Dermatofibroma)及日光性角化病(Actinic Keratosis)。数据分布极不均衡,这增加了分类任务的复杂性。

2. 图像预处理

为了提高模型性能,图像在输入深度学习模型前进行了多项预处理: - 图像裁剪与重采样:提取感兴趣区域(ROI),去除冗余背景。 - 零填充与调整大小:将所有图像调整为224×224的统一分辨率,确保模型输入一致性。 - 数据增强:通过旋转、翻转、裁剪等方式扩展训练数据,以减少过拟合并提高模型泛化能力。

3. 深度学习模型

研究采用了ResNet-18深度学习模型作为分类器,并结合迁移学习技术,从预训练模型中提取特征以减少对大规模训练数据的依赖。ResNet的残差结构(Residual Block)有效缓解了深度网络中的梯度消失问题,从而提升了模型的训练效果。

4. 可解释性增强

为了克服“黑箱”问题,研究引入了LIME(Local Interpretable Model-Agnostic Explanations)框架,该框架通过局部代理模型(例如线性回归)生成模型预测的可解释性图示,帮助研究者理解模型为何做出特定预测。

5. 实验环境

实验在NVIDIA GeForce GTX 1650 GPU及Intel i5处理器平台上进行,采用Python编程语言,整个模型训练过程耗时约24小时。


实验结果与分析

1. 性能指标

研究通过分类准确率(Accuracy)、精确率(Precision)、召回率(Recall)及F1得分(F1 Score)来评估模型性能。在包含数据增强的实验中,ResNet-18模型的主要性能指标如下: - 分类准确率:94.47% - 精确率:93.57% - 召回率:94.01% - F1得分:94.45%

2. 与其他方法的对比

相比于采用传统深度学习方法(如VGG16、Inception V3)或未进行可解释性增强的研究,本研究方法在分类准确性和解释性上均取得显著提升。例如,ResNet-18在ISIC 2019数据集上的表现优于Inception V3,且通过LIME框架生成的可视化结果为医生提供了重要的诊断参考依据。

3. 可视化与可信度分析

实验还生成了混淆矩阵和预测示例图,其中混淆矩阵显示各病变类别的预测正确率均较高。同时,LIME生成的局部解释图清晰展示了模型关注的图像区域,进一步增强了模型的可信度。


研究结论与意义

本研究提出的基于深度学习和可解释性人工智能的皮肤病变分类方法显著提高了分类准确性,同时通过透明的预测过程提升了模型的临床适用性。具体意义包括: 1. 科学价值:将深度学习技术与可解释性框架结合,为皮肤癌早期诊断提供了一种有效工具。 2. 临床应用:模型的高准确率和可解释性有助于减轻医生工作负担,提高诊断效率。 3. 社会影响:通过智能手机应用或医院诊断终端,这一技术可以推广到临床实践,为公众健康带来实际利益。


未来工作

尽管本研究取得了显著进展,仍存在一些限制与改进空间: 1. 数据集扩展:未来可通过增加更多样化的皮肤病变图像及健康皮肤样本,提高模型的泛化能力。 2. 模型优化:结合更多先进的深度学习架构(如Transformer)可能进一步提升分类性能。 3. 多模态集成:将影像数据与文本描述或患者病史结合,开发多模态诊断系统,提升诊断全面性。

通过上述改进,研究有望为皮肤癌及其他皮肤病的早期检测与诊断提供更加高效、可信和智能的解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com