利用遗传算法快速自动优化用于图像分类的卷积神经网络结构

分享自：
利用遗传算法快速自动优化用于图像分类的卷积神经网络结构

期刊:IEEE Congress on Evolutionary ComputationDOI:10.1109/cec.2019.8790197
关于“Fast Automatic Optimization of CNN Architectures for Image Classification Using Genetic Algorithm”的学术报告
研究作者及发表背景
本文研究的主要作者包括 Ali Bakhshi、Nasimul Noman、Zhiyong Chen、Mohsen Zamani 和 Stephan Chalup，这些学者均隶属于澳大利亚的 The University of Newcastle 的 School of Electrical Engineering and Computing。该研究成果发表在 2019 年 IEEE Congress on Evolutionary Computation (CEC) 的会议论文集中，会议于2019年6月10日至13日在新西兰惠灵顿举行。文章可通过 DOI 链接: http://dx.doi.org/10.1109/CEC.2019.8790197 访问。
研究的学术背景
卷积神经网络（Convolutional Neural Networks，CNNs）是深度学习领域的重要模型，其在图像分类等任务中表现尤为突出。CNN 的性能通常高度依赖于其网络架构和超参数配置。传统的 CNN 模型（如 LeNet、AlexNet 等）由经验丰富的研究人员手动设计，这一过程既耗时又对领域知识要求极高。而面对新问题时，如何快速优化 CNN 的架构和超参数，成为一种挑战。
为解决这一问题，研究人员尝试引入进化算法（Evolutionary Algorithm，EA）。作为一种基于种群的优化方法，进化算法已被证明在网络模型的自动设计中有很大的潜力。尤其是遗传算法（Genetic Algorithm，GA）因其强大的搜索能力，广泛用于确定网络架构、权重和超参数等。然而，针对深度神经网络（Deep Neural Network，DNN）的拓扑和权重同时优化一直被认为是一个难点，研究集中于分类与目标检测中的深度架构演化。
本文作者提出了一种快速自动化优化模型——Fast-CNN，采用遗传算法探索 CNN 的架构空间及超参数组合，可高效生成适合给定图像分类任务（如 CIFAR-10 数据集）的 CNN 模型，并有助于跨平台的泛化能力研究。
研究流程详解
为了实现实验目标，研究过程可以分为以下几个主要步骤：
1. 遗传算法框架设计（Fast-CNN 方法的提出）研究提出了 Fast-CNN，这是一种遗传算法模型，用于搜索最优 CNN 架构与超参数组合： - 初始种群生成：通过从搜索空间中随机选择基因创建初始种群。每个个体均代表一个具有特定架构和超参数组合的 CNN 模型。 - 适应度评估：利用 CIFAR-10 数据集的训练部分训练每个 CNN 模型，并在验证集中评估分类准确率作为适应度分数（Fitness Score）。 - 代际演化机制：通过精英选择、随机选择及后代生成来实现种群演化。每代个体根据其适应度分数排序，然后以一定比例保留适应度高的个体（精英）。部分低性能的个体也以随机概率保留下来以防止过早收敛。 - 交叉与变异操作：从父代中随机选择两个个体进行交叉操作生成子代，并以一定概率对个体超参数（如学习率、权重衰减率等）进行突变操作。
2. 超参数编码设计及 CNN 构建规则CNN 模型的构建遵循以下规则： - 每个个体的基因编码包括五个超参数：学习率（Learning Rate）、权重衰减因子（Weight Decay Factor）、动量（Momentum）、网络层数（Number of Layers）及特征映射数（Number of Feature Maps）。 - 每个卷积块随机选择特征映射数；池化层（Pooling Layer）和卷积层（Convolutional Layer）交替出现。 - 每层卷积后添加批归一化（Batch Normalization）和 ReLU 激活函数，并最终以全连接层结束。
所有网络在训练时均使用固定的随机梯度下降（Stochastic Gradient Descent，SGD）优化器，训练 50 个 epoch。
3. 评估实验设计为评估优化架构的性能，选用 CIFAR-10 和 CIFAR-100 数据集进行实验： - CIFAR-10 数据集包含 10 个类别，共 6 万张 32×32 的彩色图像。 - CIFAR-100 同样是 CIFAR 数据集的一部分，分为 100 个类别。 实验包括： 1. 搜索最优 CNN 模型。 2. 通过更高 epochs（350 epoch）进一步训练以提升分类准确率。 3. 迁移学习评估：对进化出的最佳 CNN 模型进行跨数据集泛化能力评估。
研究的核心结果
1. Fast-CNN 的性能评估作者列出了 Fast-CNN 进化出的五个顶级个体的网络超参数（表 II），其具体架构如图 3 所示： - 模型按卷积层、池化层交替堆叠而成，包含全连接层及 ReLU 激活。 - 最佳模型在 CIFAR-10 上的分类准确率达到 94.70%，在 CIFAR-100 上达到 75.63%。
2. 跟其它算法的比较Fast-CNN 的性能与其他设计方法（手动设计，半自动设计，全自动设计）进行了比较（表 III）： - 手动设计模型：Fast-CNN 在 CIFAR-10 上的表现优于 VGG16、VGG19 和 ResNet101 等经典模型，并仅在 CIFAR-100 数据集上稍逊于 DenseNet。 - 半自动方法：与 Genetic CNN 和 Block-QNN-S 的模型比较时，Fast-CNN 的 GPU 资源消耗显著减少，且分类准确率仅略低或相当。 - 全自动方法：Fast-CNN 模型的分类准确率与 Large-Scale Evolution、NAS 等方法相当或更优，但速度快至少 2 倍。
3. 迁移学习结果在迁移学习测试中，所进化的模型在没有重新设计的情况下仍然有效。这证明了 Fast-CNN 在数据集变化情况下的表现具有一定的鲁棒性和泛化能力。
研究价值与意义
本文的贡献主要体现在以下几点： 1. 科学价值：提出一种高效的进化算法框架，可自动优化 CNN 架构和超参数，减少人工干预，并提高搜索效率。 2. 应用价值：Fast-CNN 提供快速设计和优化 CNN 架构的方法，适合在资源有限且需要快速迭代的场景中应用。 3. 技术创新：首次提出适用于 CNN 架构优化的遗传算法组合策略，显著缩短计算时间。
研究亮点
实用性：适配性强，成功在 CIFAR-10 和 CIFAR-100 数据集上泛化。
高效性：相较其它全自动深度学习架构设计算法，Fast-CNN 在 GPU 资源消耗上占优。
自动化设计：无需手动调整，减少了经验门槛，大幅度降低了深度网络设计的时间成本。
总结 本文通过 Fast-CNN 提供了一种自动化、高效的 CNN 设计方法，其方法论为图像分类等领域的深度网络优化提供了新的视角，并展示了算法在计算时间和分类精度方面的显著优势。研究的成果不仅为 CNN 的架构优化提供了技术创新，同时也拓展了遗传算法和深度学习领域的交叉研究边界。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问