分享自:

面向图像识别的光学衍射神经网络研究

期刊:河北工业大学硕士学位论文

面向图像识别的光学衍射神经网络研究学术报告

作者及机构信息

本研究的作者为河北工业大学计算机技术领域的硕士研究生于亚泽,指导教师为郎利影教授(Prof. Lang Liying)。该研究作为硕士学位论文完成,并于2023年5月提交。研究获得了国家自然科学基金青年项目(62205100)的资助。

学术背景与研究动机

本研究属于人工智能与光学交叉领域,聚焦于光学神经网络(Optical Neural Network, ONN)的实现。随着人工智能技术的快速发展,传统电子神经网络面临计算能耗高、硬件限制明显等问题。集成电路受制于登纳德缩放定律失效和纳米级电流泄露问题,导致性能提升与能耗增加不成正比。在此背景下,研究者将目光转向光学计算,利用光子传输的并行性、高带宽和低能耗特性,探索新型神经网络实现方式。

研究以图像识别这一重要应用场景为切入点,针对卷积神经网络(Convolutional Neural Network, CNN)的光学实现展开。传统光电混合神经网络存在光电转换瓶颈,而全光神经网络又难以实现卷积操作。本研究旨在开发一种全光层面的光学衍射卷积神经网络(Optical Diffraction Convolutional Neural Network, ODCNN),解决现有技术的关键缺陷。

研究方法与工作流程

1. 光学衍射卷积神经网络(ODCNN)的构建

研究首先从理论层面分析了光场空间衍射传播机制,基于菲涅尔衍射积分公式建立了衍射传播的数学模型。通过数学推导,将衍射仿真模型与神经网络中的矩阵运算相关联,为光学实现奠定理论基础。

在硬件架构上,研究采用模块化设计思路: - 光学卷积层:采用4𝑓透镜阵列系统实现。该系统由两个同焦凸透镜组成,通过在傅里叶平面进行空间调制,实现了光学卷积操作。具体而言,输入光场经过第一个透镜进行傅里叶变换,在频谱面通过掩模版(对应卷积核)调制后,再由第二个透镜进行逆傅里叶变换完成卷积运算。 - 光学全连接层:采用深度衍射网络(Diffractive Deep Neural Network, D2NN)实现。该结构由多个3D打印的相位掩模顺序级联而成,每个掩模上的小网格作为光学神经元,通过衍射波实现全连接。通过调整网格的相位参数,可实现对连接权重的精确控制。

研究在MNIST、Fashion-MNIST和CIFAR-10三个标准图像数据集上验证了ODCNN的性能。实验结果显示,相较于基准电子神经网络,该光学架构在分类准确率上有所提升,证明了全光实现的有效性。

2. 完备光学卷积神经网络(COCNN)的优化

针对ODCNN存在的卷积结果冗余和非线性拟合能力不足问题,研究进一步引入了两个关键模块:

光学池化层: 采用缩小透镜阵列系统实现下采样功能。该系统通过间隔采样保留关键特征,同时去除冗余信息。实验证明,这种光学实现方式在不破坏图像特征的情况下,有效降低了数据维度,提高了运算效率。

光学非线性激活层: 创新性地采用数字微镜阵列(Digital Micromirror Device, DMD)与图像传感器的联合工作机制实现。具体原理是:数字微镜根据传感器检测的光强阈值,有选择地反射或丢弃像素信息,实现了类似ReLU函数的稀疏激活效果。通过遗传算法优化,确定了最佳激活阈值参数。

在性能验证方面,研究将COCNN与多种先进光学神经网络进行了对比实验。结果显示,在相同数据集上,COCNN展现出更优的分类性能,特别是在处理复杂图像特征时表现出更强的泛化能力。

主要研究成果

  1. 理论创新

    • 建立了衍射传播与神经网络运算的数学关联,推导出光场调制与矩阵乘法的等效关系
    • 提出了光学卷积的4𝑓系统实现方法,通过傅里叶空间调制完成卷积运算
    • 开发了基于衍射效应的全连接层光学实现方案
  2. 技术创新

    • 首创了全光实现的卷积神经网络架构ODCNN
    • 开发了光学池化层的透镜阵列实现方案
    • 发明了基于DMD的非线性光学激活模块
  3. 性能验证

    • 在MNIST数据集上达到98.78%的分类准确率
    • 在Fashion-MNIST和CIFAR-10数据集上均表现出优于对比模型的性能
    • 证明了光学实现相比电子神经网络在能耗和计算速度上的潜在优势

研究结论与价值

本研究的主要科学价值体现在: 1. 提出并验证了全光实现卷积神经网络的可行性,为突破传统电子计算的瓶颈提供了新思路 2. 开发的ODCNN和COCNN架构兼具理论创新性和工程可实现性 3. 光学池化和非线性激活模块的创新设计,解决了光学神经网络结构不完善的关键问题

在应用价值方面: 1. 为低功耗、高并行的图像处理系统开发奠定了基础 2. 在医疗影像分析、遥感图像处理等需要实时处理的领域具有应用前景 3. 为下一代光学计算芯片的设计提供了理论和技术支持

研究亮点

  1. 方法创新性

    • 首次实现全光层面的卷积神经网络
    • 开发了完整的光学CNN架构,包含卷积、池化、全连接和非线性激活等全部关键组件
  2. 技术突破

    • 解决了光学实现中的卷积操作难题
    • 创新性地将DMD应用于光学非线性激活
  3. 性能优势

    • 在多个标准数据集上验证了优于电子神经网络和现有光学神经网络的性能
    • 展现出在计算速度和能耗方面的潜在优势

未来展望

研究者指出,未来工作可在以下方向展开: 1. 探索更复杂的光学神经网络架构,如残差连接等先进结构的光学实现 2. 优化光学元件的制备工艺,提高系统的集成度和稳定性 3. 研究适用于光学神经网络的特有训练算法 4. 拓展在三维图像处理、实时视频分析等更复杂场景的应用

该研究为光学神经网络领域做出了重要贡献,其创新性的理论框架和技术方案,将为人工智能与光子学的交叉融合发展提供新的推动力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com