分享自:

基于图的编码用于进化卷积神经网络架构设计

期刊:IEEE Congress on Evolutionary ComputationDOI:10.1109/cec.2019.8790093

这篇文献是关于卷积神经网络(CNN)架构设计中的一种图基编码方法的研究,具体是在进化卷积神经网络(evolutionary convolutional neural networks, EC-CNN)设计中的应用。该研究由William Irwin-Harris、Yanan Sun、Bing Xue和Mengjie Zhang四位学者共同完成,发表于2019年6月的《IEEE Congress on Evolutionary Computation》会议上。该文献的目的是提出一种新的编码策略,用于生成和优化CNN架构,从而解决传统手动设计和现有自动化方法中的一些局限性。

一、研究背景

卷积神经网络(CNN)是近年来在图像分类任务中取得显著成绩的深度学习模型之一。CNN的设计对于其性能至关重要,但手动设计CNN架构通常需要专家的深厚背景知识,并且通常伴随着大量的试错过程。因此,自动化CNN架构设计逐渐成为深度学习研究的一个重要方向。尤其是,基于进化算法(evolutionary algorithms, EA)的方法成为自动化架构搜索的一种有效手段。进化深度学习(evolutionary deep learning)通过应用进化计算方法来自动搜索网络架构,而CNN的编码方式是进化算法中至关重要的一部分。

传统的进化CNN方法中存在一些限制。例如,一些编码方法要求架构的最大深度必须事先定义,且架构的连接结构也受到限制。这些限制减少了搜索空间的灵活性,并使得这些方法在实际应用中效果有限。因此,研究者们提出了新的图形编码方法,旨在解决这些问题,允许更加灵活且深度无限制的架构设计。

二、研究方法

本研究提出了一种基于有向无环图(Directed Acyclic Graph, DAG)表示法的CNN编码策略。这种编码方法旨在通过最小化对搜索空间的限制,允许进化算法生成任意结构和深度的CNN架构。

  1. 编码策略的设计: 研究者设计的CNN编码方法基于有向无环图(DAG),该图中的每个节点代表CNN中的一个操作或构建模块。通过这种编码方式,可以更加灵活地表达不同类型的CNN架构。与传统的编码方法相比,这种方法更具通用性,能够表示任意连接结构和深度的CNN架构。每个节点的类型包括卷积操作(conv)、最大池化(max)、平均池化(average)、加法操作(sum)、连接操作(concat)以及输入数据(input)。此外,卷积节点还具有特征图(feature map)属性,用于指定卷积层输出的通道数。

  2. 随机生成CNN架构: 该方法的另一个重要部分是用于生成CNN架构的算法。研究者通过随机选择不同的层次结构及节点类型,生成200个CNN架构。为了验证这些架构的有效性,研究者使用了CIFAR-10数据集的10%训练数据(4500个样本)进行初步训练。经过初步训练后,研究者从中挑选出表现最好的三个架构,并使用完整的50,000个训练样本进行了再次训练。

  3. 数据处理与实验设置: 研究中的数据处理包括对CIFAR-10数据集的处理。CIFAR-10是一个包含60,000张32×32像素图像的标准数据集,分为10个类别。研究者在初步实验中使用了4500个训练样本和500个验证样本,采用分层抽样方法确保每个类别的样本分布均匀。训练过程中使用了标准的随机梯度下降(SGD)优化器,并采用了适当的学习率衰减和数据增强方法来避免过拟合。

  4. 算法与分析: 为了进一步提高实验效率并解决可能的计算瓶颈,研究者采用了GPU加速计算。实验中使用了两张GTX 1080 Ti显卡进行架构搜索,所用的总计算时间约为1.33个GPU天。研究者还通过表格和图形展示了不同CNN架构的精度、参数数量以及所需的计算时间,进一步验证了该方法在计算资源和精度方面的有效性。

三、研究结果

通过随机搜索,研究者得到了200个CNN架构,并对它们进行了评估。结果表明,尽管由于采用了较小的训练数据集和简单的随机搜索方法,所得到的精度较传统手动设计的CNN架构有所逊色,但仍然取得了令人鼓舞的结果。具体来说,在训练过程中,最好的三个CNN架构在全数据集上的测试精度分别为92.45%、92.57%和90.98%。

与传统的手动设计架构和其他自动化方法相比,研究者提出的编码策略虽然精度稍低,但计算资源消耗大大减少,显示出了该方法的计算效率。此外,生成的CNN架构在参数数量方面表现出较好的多样性,能够在保证较小参数量的同时,仍保持较高的分类精度。

四、研究结论

这项研究提出的图基编码方法在CNN架构设计中具有重要的科学价值和应用潜力。首先,基于有向无环图的编码方式使得CNN架构的表示更加灵活,能够克服传统方法中深度和连接结构的限制。其次,该方法通过随机搜索展示了较高的计算效率,并能够在相对较小的训练数据集和简单的搜索算法下取得不错的精度。

尽管如此,研究者也指出,由于随机搜索的简易性和训练数据的限制,未来的研究可以进一步改进,采用更为复杂的进化算法(如交叉和变异操作),以提高CNN架构的性能和泛化能力。研究者计划在未来的工作中进一步优化该编码方法,并尝试与进化深度学习算法相结合,以进一步提升CNN架构的精度和多样性。

五、研究亮点

本研究的亮点在于其提出了一种新的CNN架构编码方式,使得进化算法可以更有效地搜索到适用于特定数据集的架构。与现有方法相比,这种编码方式减少了对架构深度和连接方式的限制,具有更大的灵活性。此外,尽管使用了简单的随机搜索方法,研究仍然展示了令人满意的分类精度,证明了这种编码策略在进化深度学习中的潜力。

该方法的成功应用为未来自动化CNN架构设计提供了新的思路,尤其是在需要低计算资源的情况下,可以为其他研究提供借鉴。未来,如果能够结合更复杂的进化搜索算法,可能会进一步提升该方法的精度和应用范围。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com