粒子群优化在图像分类深度卷积神经网络中的演化应用

分享自：
粒子群优化在图像分类深度卷积神经网络中的演化应用

期刊:springer nature singapore pte ltd. 2020DOI:10.1007/978-981-15-3685-4_6
基于PSO的演化深度卷积神经网络用于图像分类的单目标及多目标方法综述本文档是学术论文，标题为“Particle Swarm Optimization for Evolving Deep Convolutional Neural Networks for Image Classification: Single- and Multi-objective Approaches”，作者为Bin Wang、Bing Xue以及Mengjie Zhang，隶属于Victoria University of Wellington（新西兰惠灵顿维多利亚大学）工程与计算科学学院。本论文发表于由Springer Nature Singapore出版的《Deep Neural Evolution》文集中。
学术背景深度卷积神经网络（Convolutional Neural Networks, CNNs）被广泛视为解决图像分类问题的最有效方法之一。然而，目前的CNN结构主要依赖人类专家的手动设计，这不但耗时巨大，还需要对问题领域及CNN原理具备高度专业知识。同时，固定的CNN架构并不能满足各类任务的需求，每一个特定任务需要特定的架构调整，这极大地增加了设计和优化CNN的工作量。
近年来，为了减轻手动设计CNN架构的复杂性，进化计算（Evolutionary Computation, EC）被用来实现CNN架构的自动化设计。例如，谷歌提出的“Large-scale Evolution of Image Classifiers (LEIC)”方法通过遗传算法（Genetic Algorithm, GA）自动演化CNN。然而，由于高计算成本，这些方法在大规模数据集上的学习速度通常较慢，难以实际应用。
针对这些挑战，本文探索了另一种进化计算方法——粒子群优化（Particle Swarm Optimization, PSO），并提出了利用PSO演化CNN架构的新方法，强调自动化设计和高效运行。论文还进一步扩展PSO，研究了包括分类准确率和计算成本在内的多目标优化问题。
研究目标论文的主要目标分为两个方面：
开发PSO方法实现CNN架构的自动化设计：
提出一种新的粒子编码策略，用于有效编码CNN层的配置。
打破传统PSO固定粒子长度的限制，设计一种伪变量长度编码方案，通过引入“Disabled Layer”伪装无效层。
通过使用代理数据集（Surrogate Dataset）显著加速进化学习过程。
开发多目标优化方法以平衡分类精度与推理延迟：
改善CNN的参数调优能力，特别是DenseNet架构中的各类超参数，包括每个Dense Block的增长率和层数。
设计PSO算法寻找最佳的Pareto前沿解集，让工业用户能够在分类性能和硬件资源之间找到最适合的解决方案。
研究方法与流程单目标优化方法（IPPSO）粒子编码策略： 标准粒子编码方法难以适应可变性的CNN架构。论文提出了一种新的IP编码策略，受到网络协议IP地址的启发，通过用二进制字符表示CNN层的属性（如卷积层的过滤器大小、特征图数量等），并通过伪变量长度设计实现架构的灵活编码。
伪变量长度实现： 引入名为“Disabled Layer”的占位层以解决PSO粒子长度固定的问题。IP地址的子网方式（CIDR表示法）被用来区分不同CNN层的类型（如卷积层、池化层、全连接层和被禁用层）。
进化过程及适应度评估： PSO算法的进化包括初始化种群、速度与位置更新、适应度评估以及解码等步骤。适应度评估中，CNN通过代理数据集部分训练后被批量测试，其平均分类准确率用于作为适应度值。
更新与选解： 采用传统PSO更新公式，但对每个粒子的粒子加速系数进行逐字节控制。此外，通过解码获得粒子的最佳个体。
多目标优化方法（MOCNN）优化目标： 设定分类精度和浮点计算量（Flops）为两个优化目标。PSO算法旨在同时最大化分类精度和最小化计算量。
新编码策略： 以DenseNet为例，研究对象为每个Dense Block的层数和增长率。通过固定块数，将DenseNet超参数编码为一个固定长度的向量。
种群初始化及适应度评估： 随机生成初始种群，结合随机数生成器，根据DenseNet的参数范围生成粒子的位置，并使用Adam优化器对CNN进行训练测试，其精度和Flops分别作为两个适应度。
OMOPSO方法： 使用OMOPSO算法进行Pareto最优解的搜索。OMOPSO结合拥挤距离排序和ε-Pareto支配机制，确保解集的多样性和优越性。
实验设计与结果论文分别对单目标优化方法（IPPSO）与多目标优化方法（MOCNN）进行了实验：
单目标优化实验：
使用MNIST Basic（MB）、MNIST Rotated Digits with Background Images（MRDBI）和Convex Sets（CS）三种基准数据集对IPPSO方法进行了验证。
IPPSO在MRDBI上取得了最优分类效果（33.0%误差率），在MB和CS上表现也非常接近最优。
多目标优化实验：
在CIFAR-10数据集上对MOCNN方法进行了实验，Pareto前沿解表明分类精度与计算量之间存在显著的冲突，并通过调整种群大小和代数，验证了种群越大，Pareto解的性能覆盖越优。
对比DenseNet： MOCNN实验显示，在分类精度上（95.51%）优于DenseNet-121（94.77%），且计算成本更低。
研究价值与总结这项研究为自动化CNN架构设计提供了新的方法和工具：
从理论和实践上证明了PSO方法的高效性与灵活性。目前使用GA方法进行CNN架构设计的局限性，可以通过PSO灵活可变长度的设计得以缓解。
多目标优化的加入使得神经网络的工业应用更加现实，用户可以根据自身需求选择合适的Pareto非支配解。
创新性的编码方式和优化策略为后续自动化机器学习（AutoML）任务奠定了重要研究基础，同时提供了一种通用化的进化优化方式。
总结而言，论文证明了进化计算，尤其是PSO方法，在实现CNN架构自动化设计中的潜力，并为未来更多自动化设计方案的提出展示了研究方向。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问