本研究的作者为河北工业大学计算机技术领域的硕士研究生于亚泽,指导教师为郎利影教授(Prof. Lang Liying)。该研究作为硕士学位论文完成,并于2023年5月提交。研究获得了国家自然科学基金青年项目(62205100)的资助。
本研究属于人工智能与光学交叉领域,聚焦于光学神经网络(Optical Neural Network, ONN)的实现。随着人工智能技术的快速发展,传统电子神经网络面临计算能耗高、硬件限制明显等问题。集成电路受制于登纳德缩放定律失效和纳米级电流泄露问题,导致性能提升与能耗增加不成正比。在此背景下,研究者将目光转向光学计算,利用光子传输的并行性、高带宽和低能耗特性,探索新型神经网络实现方式。
研究以图像识别这一重要应用场景为切入点,针对卷积神经网络(Convolutional Neural Network, CNN)的光学实现展开。传统光电混合神经网络存在光电转换瓶颈,而全光神经网络又难以实现卷积操作。本研究旨在开发一种全光层面的光学衍射卷积神经网络(Optical Diffraction Convolutional Neural Network, ODCNN),解决现有技术的关键缺陷。
研究首先从理论层面分析了光场空间衍射传播机制,基于菲涅尔衍射积分公式建立了衍射传播的数学模型。通过数学推导,将衍射仿真模型与神经网络中的矩阵运算相关联,为光学实现奠定理论基础。
在硬件架构上,研究采用模块化设计思路: - 光学卷积层:采用4𝑓透镜阵列系统实现。该系统由两个同焦凸透镜组成,通过在傅里叶平面进行空间调制,实现了光学卷积操作。具体而言,输入光场经过第一个透镜进行傅里叶变换,在频谱面通过掩模版(对应卷积核)调制后,再由第二个透镜进行逆傅里叶变换完成卷积运算。 - 光学全连接层:采用深度衍射网络(Diffractive Deep Neural Network, D2NN)实现。该结构由多个3D打印的相位掩模顺序级联而成,每个掩模上的小网格作为光学神经元,通过衍射波实现全连接。通过调整网格的相位参数,可实现对连接权重的精确控制。
研究在MNIST、Fashion-MNIST和CIFAR-10三个标准图像数据集上验证了ODCNN的性能。实验结果显示,相较于基准电子神经网络,该光学架构在分类准确率上有所提升,证明了全光实现的有效性。
针对ODCNN存在的卷积结果冗余和非线性拟合能力不足问题,研究进一步引入了两个关键模块:
光学池化层: 采用缩小透镜阵列系统实现下采样功能。该系统通过间隔采样保留关键特征,同时去除冗余信息。实验证明,这种光学实现方式在不破坏图像特征的情况下,有效降低了数据维度,提高了运算效率。
光学非线性激活层: 创新性地采用数字微镜阵列(Digital Micromirror Device, DMD)与图像传感器的联合工作机制实现。具体原理是:数字微镜根据传感器检测的光强阈值,有选择地反射或丢弃像素信息,实现了类似ReLU函数的稀疏激活效果。通过遗传算法优化,确定了最佳激活阈值参数。
在性能验证方面,研究将COCNN与多种先进光学神经网络进行了对比实验。结果显示,在相同数据集上,COCNN展现出更优的分类性能,特别是在处理复杂图像特征时表现出更强的泛化能力。
理论创新:
技术创新:
性能验证:
本研究的主要科学价值体现在: 1. 提出并验证了全光实现卷积神经网络的可行性,为突破传统电子计算的瓶颈提供了新思路 2. 开发的ODCNN和COCNN架构兼具理论创新性和工程可实现性 3. 光学池化和非线性激活模块的创新设计,解决了光学神经网络结构不完善的关键问题
在应用价值方面: 1. 为低功耗、高并行的图像处理系统开发奠定了基础 2. 在医疗影像分析、遥感图像处理等需要实时处理的领域具有应用前景 3. 为下一代光学计算芯片的设计提供了理论和技术支持
方法创新性:
技术突破:
性能优势:
研究者指出,未来工作可在以下方向展开: 1. 探索更复杂的光学神经网络架构,如残差连接等先进结构的光学实现 2. 优化光学元件的制备工艺,提高系统的集成度和稳定性 3. 研究适用于光学神经网络的特有训练算法 4. 拓展在三维图像处理、实时视频分析等更复杂场景的应用
该研究为光学神经网络领域做出了重要贡献,其创新性的理论框架和技术方案,将为人工智能与光子学的交叉融合发展提供新的推动力。