分享自:

基于机器学习的高精度信息网络:结构化光的空间非线性转换

期刊:Laser & Photonics ReviewsDOI:10.1002/lpor.202301225

面向机器学习超精信息网络的结构光空间非线性转换研究学术报告

本研究由来自北京理工大学的张子龙、何玮、赵苏义、高远、王欣、李晓天、王钰琪、马云飞、胡烨彤、赵长明以及来自南洋理工大学的沈毅杰(Yijie Shen)共同完成。该研究以“Spatial nonlinear conversion of structured light for machine learning based ultra-accurate information networks”为题,于2024年发表于学术期刊《Laser & Photonics Reviews》(卷18,文章编号2301225)。

一、 学术背景 本研究隶属于光学通信与结构化光场调控的交叉领域。近年来,为了突破传统自由空间光通信(Free-Space Optical Communication, FSO)的容量瓶颈,利用轨道角动量(Orbital Angular Momentum, OAM)光束等结构化光进行模分复用成为研究热点。结构化光具有无限的理论维度,可通过不同空间模式编码信息,从而极大提升信道容量。然而,随着模式阶数的增加以实现高容量,光束发散加剧、对光学孔径要求增高、在湍流和失准情况下串扰增大等问题日益突出,导致系统准确率急剧下降。这一矛盾成为阻碍结构化光通信走向实际应用的主要挑战。

为解决这一挑战,研究者们探索了多种路径:一是利用厄米-高斯(Hermite-Gaussian, HG)模式、拉盖尔-高斯(Laguerre-Gaussian, LG)模式等高阶本征模;二是使用多个本征模的相干叠加态(Eigenmodes Coherently Superposed States, EMCS)来生成更多低阶简并态以缓解发散问题;三是引入机器学习,特别是卷积神经网络(Convolutional Neural Network, CNN),来识别复杂的光强图案,以降低解码复杂度。然而,在追求更高容量和更高精度的道路上,仍需一种能够同时满足这两个看似矛盾目标的有效方法。

本研究正是在此背景下展开,其核心目标是:提出并验证一种简单的方法,通过结构化光的空间非线性转换(Spatial Nonlinear Conversion, SNC),结合机器学习识别,在低阶模(模式阶数 ≤ 6)条件下实现超高精度(>99.5%)和大容量(>500种模式)的信息传输,并进一步构建可行的点对多点(Point-to-Multipoint, PToMP)广播式信息网络链路,从而为实用化的大规模多用户结构化光信息网络铺平道路。

二、 详细研究流程 本研究工作流程系统而全面,主要包含以下几个相互关联的部分:新型信息载体的设计与理论分析、点对点(Point-to-Point, PToP)高精度传输链路实验验证、基于空间非线性转换的超大容量编码验证、点对多点广播链路的实现与评估。研究对象主要是基于HG模式相干叠加态及其二次谐波生成(Second Harmonic Generation, SHG)转换态的结构化光场。

1. 信息载体的设计与理论论证 首先,研究团队深入比较了HG模式与LG模式作为信息载体的优劣。理论分析表明,在相同模式阶数下,HG模式比LG模式拥有更多的可区分简并图案。这是因为LG模式具有旋转对称性,其叠加态仅随相位差旋转,图案差异小;而HG模式在笛卡尔坐标系下,其叠加态的光强分布随相位差变化显著,可产生更多样化的图案。因此,采用HG-EMCS可以在更低的模式阶数下获得更高的编码容量。研究定义了HG-EMCS的电场表达式,它由三个关键参数决定:组成模的指数(m, n)、相对初始相位差(δφ)和模间的比例系数(α)。通过调节这些参数,可以在低阶(如n ≤ 6)下生成大量(如125种以上)独特的光强分布图案。

其次,研究提出了利用HG-EMCS的空间非线性转换(以SHG为例)来进一步扩展容量。SHG过程使得光场模式阶数翻倍,其远场光强分布相比基频光发生了显著且更丰富的非对称性变化。这使得即使在更小的相位差间隔(如π/8)下,也能产生明显可区分的图案,从而将可用编码模式数量从125种大幅提升至531种。研究通过计算汉明距离量化了模式间的差异,证实SNC态在相同湍流条件下比基频光具有更强的抗串扰能力和更明显的模式区分度。

2. 点对点高精度传输链路实验 实验装置如图7所示。核心设备包括:He-Ne激光器、光束扩束器、数字微镜器件(Digital Micro-mirror Device, DMD)、透镜组、孔径光阑、电荷耦合器件(CCD)相机和计算机。DMD用于加载计算全息图,以生成带有或没有模拟大气湍流扰动的HG-EMCS光束。湍流相位屏基于von Karman模型生成,并通过同一块DMD进行调制,简化了实验步骤。生成的编码光束经过4f成像系统滤波和传输后,由CCD采集光强图像。

编码与传输:研究选取了阶数n≤6的HG-EMCS,设定相位差δφ为0和π/2,比例系数α1=α2,共产生139种模式,选取前125种用于编码。这125种模式对应125级灰度(实际应用于RGB三通道各5级,共125色)的彩色图像信息。作为对比,在相同阶数限制下,LG-EMCS仅能产生40种有效编码模式。

解码与识别:解码核心是一个基于AlexNet架构的CNN。研究收集了每种编码模式在不同湍流条件(无湍流、C_n^2 = 2×10⁻¹⁶ m⁻²/³传输1公里和3公里)下的大量实验样本(每种条件1700个训练样本,200个验证样本)。CNN以227×227像素的光强图像作为输入,经过卷积层、激活函数(ReLU)、池化层和全连接层(含Dropout防止过拟合)进行处理,最终输出模式分类结果。优化器采用带动量的随机梯度下降(SGDM)。

3. 基于空间非线性转换的超大容量验证实验 为了验证SNC态的编码能力,研究进行了专门实验。使用阶数n≤6的两个HG本征模构建EMCS,并设定相位差δφ在0到π之间以π/8为间隔变化,共生成531种SHG复杂结构模式用于编码。这里使用ResNet18作为CNN识别网络,因其更深的网络结构能更好处理更复杂的模式。

实验流程与PToP链路类似,通过DMD生成SHG模式的近场全息图,在远场采集光强图像。在无湍流条件下,网络对验证集的识别准确率达到99.52%,对50组实验数据的识别准确率为99.59%。通过绘制混淆矩阵,直观展示了系统的高精度和低串扰特性。

4. 点对多点广播链路的实现与评估 为了解决PToP链路中光束空间抖动和大接收孔径问题,并实现大角度广播,研究创新性地提出了基于漫反射屏和多CCD的PToMP方案。发射端将结构化光束投射到漫反射屏上,在屏的另一侧,多个CCD相机可以在不同观测角度(最大至70°)同时接收漫反射的光强图案。

关键挑战与解决方案:观测角度变化会导致图像形变,严重影响基于固定角度训练的网络识别精度。例如,使用原始(接近0°观测角)网络识别60°角数据,准确率降至约90%。为解决此问题,研究团队重新收集了在30°、45°、60°等不同观测角度以及不同湍流条件下的125种模式样本,用这些数据重新训练CNN,构建了新的“多角度网络”。

验证:使用新网络后,在不同观测角度(10°至70°,间隔5°)下传输125级彩色图像。结果显示,在无湍流、1公里弱湍流和3公里弱湍流条件下,识别准确率分别稳定在约99%、97%和94%。这证明了该PToMP链路在大观测角度下依然能保持高精度工作。

三、 主要研究结果 1. PToP链路实现高精度图像传输:实验成功传输了50×50像素的彩色图像(校徽和建筑)。在无湍流条件下,校徽图像的误码率仅为0.08%,建筑图像(使用全部125种编码)误码率为0.24%。在模拟弱湍流(C_n^2 = 2×10⁻¹⁶ m⁻²/³,传输1公里和3公里)条件下,识别准确率依然分别高达97.52%和92.80%(校徽图像误码率分别为0.48%和2.92%)。混淆矩阵显示错误分布分散,不影响整体图像观感。这证明了HG-EMCS结合CNN的方法能在弱湍流环境下实现高精度通信。

2. SNC态极大扩展信道容量:实验证实,利用SHG转换态,在同样n≤6的低阶条件下,可将编码模式数量从125种提升至531种,且识别准确率高达99.5%以上,与基频光相当。混淆矩阵显示系统串扰极低。这表明SNC是一种在不牺牲精度前提下,显著提升系统容量的有效途径。

3. PToMP链路实现大角度可靠广播:通过引入漫反射屏和训练多角度CNN网络,研究成功构建了PToMP链路。实验结果表明,新网络能有效克服观测角度带来的图像形变,在高达70°的观测角度范围内,系统在不同湍流强度下均能保持稳定且高的识别准确率(无湍流>99%,1公里湍流>97%,3公里湍流>94%)。这为结构化光在会议室、场馆等场景下的广播通信应用提供了实验依据。

4. 模式编码容量与抗扰特性理论得到验证:通过对比HG与LG模式、基频与SNC态的模式有效数量曲线(图1、图5c)、汉明距离分析(图6h)等理论结果,并与实验识别准确率、误码率相互印证,充分证明了选择HG-EMCS及其SNC态作为信息载体,在提升容量、降低发散、增强抗湍流串扰方面的优越性。

这些结果层层递进,从实现基础的高精度PToP传输,到通过SNC突破容量限制,再到最终解决实际部署中的角度覆盖问题,完整地验证了所提方案的有效性和可行性,并为最终结论提供了坚实的数据支撑。

四、 研究结论与价值 本研究成功提出并实验验证了一种基于结构化光空间非线性转换与机器学习的新型高精度、大容量自由空间光通信方案。核心结论是:通过采用低阶HG模式相干叠加态及其空间非线性转换态作为信息载体,并利用卷积神经网络进行模式识别,可以在有效控制光束发散和系统复杂度的同时,实现超过99.5%的识别精度和超过500个通道的编码容量。此外,所演示的基于漫反射屏的点对多点链路,证明了该技术在宽角度广播场景下的应用潜力。

该研究的科学价值在于:为解决结构化光通信领域长期存在的“高容量”与“高精度”难以兼得的矛盾提供了一个创新且有效的解决方案。它深化了人们对复杂结构光场(特别是非线性转换态)作为高维信息载体的理解,并展示了机器学习在物理层光通信信号处理中的强大能力。

其应用价值显著:该方案系统相对简单(主要基于DMD和CCD),精度高,容量大,且具备向多用户广播扩展的能力,为未来构建实用化的大规模、超精密结构化光信息网络(如室内Li-Fi、卫星间激光通信、保密通信等)奠定了关键技术基础。

五、 研究亮点 1. 创新性的信息载体:首次系统地将HG模式相干叠加态的空间非线性转换(SHG)态引入光通信编码,在低阶模式下实现了编码容量的数量级提升,并理论论证了其抗串扰优势。 2. “机器学习+物理转换”的协同创新:将结构化光的物理维度拓展(非线性转换)与智能信息处理(CNN识别)紧密结合,利用SNC产生更易被机器学习区分的丰富图案特征,同时利用CNN克服SNC图案的识别复杂度,二者相得益彰。 3. 高精度的点对多点广播演示:创造性采用漫反射屏结合多角度数据训练CNN的策略,解决了结构化光广播应用中大视角接收和图像形变识别的难题,实验证明了高达70°观测角度下的可靠通信,展示了强烈的实用化导向。 4. 完整的系统级验证:研究不仅停留在原理或单个环节,而是构建了从编码、信道模拟(湍流)、传输到解码的完整通信链路,并在PToP和PToMP两种典型场景下进行了全面的性能评估,工作系统而扎实。

六、 其他有价值内容 研究还指出,本方案仍有巨大潜力可挖:可通过利用更多的叠加本征模数量(不提高阶数上限)、更精细地调节相位差δφ和比例系数α,来指数级进一步提升容量;通过优化CNN网络结构(如使用更先进的网络)、丰富不同湍流强度下的训练集,可以进一步提升系统在更恶劣环境下的识别精度和鲁棒性。此外,研究提到SNC光束的近场与远场图案差异巨大,此特性可用于增强通信系统的物理层安全性。这些都为后续研究指明了方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com