基于Transformer深度学习的宽带光学监控中光学薄膜制造误差反演策略

分享自：
基于Transformer深度学习的宽带光学监控中光学薄膜制造误差反演策略

人工智能
信息科学
期刊:Optics ExpressDOI:10.1364/oe.551923
【点击此处】阅读全文、收藏及针对性提问
光学薄膜制造误差反演工程中的先进深度学习策略研究报告
本报告旨在介绍一项发表于《Optics Express》期刊上的原创性研究。该研究由同济大学的研究团队完成，针对光学薄膜制造过程中的核心难题——误差反演，提出了一种基于Transformer深度学习框架的创新解决方案。
一、 研究团队与发表信息
本研究的主要作者包括Jianglin Dai, Xiaochuan Ji, Xinshang Niu（通讯作者，邮箱：1810081@tongji.edu.cn）, Hongfei Jiao, Xinbin Cheng, Zhanshan Wang和Jinlong Zhang。所有作者均来自同济大学精密光学工程研究所及教育部先进微结构材料重点实验室。该研究成果以题为《Advanced deep learning-based strategy for optical inversion engineering of optical coatings》的论文形式，于2025年3月10日发表在光学领域知名期刊《Optics Express》第33卷第5期上。
二、 学术背景与研究目标
本研究属于光学工程与人工智能交叉领域，具体聚焦于光学薄膜制造的监控与误差分析。高性能光学元件（如激光器、精密光学仪器中的镜片）的性能极大程度上依赖于其表面镀膜的质量。为了实现薄膜厚度的精确控制，宽带光学监控（Broadband Optical Monitoring, BBOM）技术被广泛应用。该技术通过实时比较沉积过程中的实测光谱与理论设计光谱的差异，来终止每一层的沉积，从而控制每层膜的厚度。
然而，在实际制造过程中，存在多种误差源，包括光谱测量误差、材料折射率误差、快门延迟以及沉积速率波动等。这些误差会导致实际沉积厚度偏离设计值。更重要的是，在BBOM过程中存在一种“自补偿”效应：当前层的厚度误差会自动补偿前面所有层累积的光谱误差。这使得各层的厚度误差相互关联，形成复杂的相关误差。随着薄膜层数的增加，这种相关误差会累积并放大，严重影响最终产品的光谱性能。因此，精确地逆向推导（反演）出制造过程中实际引入的厚度和折射率误差，对于分析工艺问题、优化制造流程、提升成品率至关重要。
传统的反演方法，如顺序算法（S-algorithm）和三角算法（T-algorithm），在处理BBOM中这种复杂的、具有强相关性的误差时面临挑战。它们往往存在多解性、对初始值敏感、计算效率低等问题，尤其是在需要同时反演厚度和折射率等多参数时，其精度和效率会显著下降。
因此，本研究的目标是开发一种全新的、基于深度学习的光学薄膜制造误差反演策略。该策略旨在克服传统方法的局限性，能够快速、准确地从沉积过程中测得的光谱序列中，反演出每一层薄膜的厚度误差和折射率误差，为在线实时监控和离线工艺分析提供强大工具。
三、 详细研究流程与方法
本研究的工作流程系统性地包含了从理论建模、数据生成、模型构建到实验验证的全过程，具体可分为以下几个关键步骤：
第一步：BBOM误差特性分析与快速数据生成模型的建立。 研究首先深入分析了BBOM过程中的误差产生机制与传播规律。核心在于理解“自补偿”效应如何导致层间厚度误差产生复杂的相关性。研究者基于误差扰动分析，推导出了描述第j层厚度误差δd_j与前面所有层误差δd_i之间关系的数学表达式（文中公式5）。该公式明确指出，当前层的误差是前面所有层误差的加权和，权重系数由光谱对厚度的偏导数决定，这从数学上证实了误差的相关性。
为了训练深度学习模型，需要海量的、包含误差关联特性的训练数据。如果完全通过耗时漫长的实际沉积实验或全流程数值模拟来获取数据，成本极高且不现实。为此，本研究的一个关键创新是提出了一个“快速解析模型”。该模型基于上述误差传播公式（及其推导出的数值计算形式，公式6），能够以解析计算的方式，在几分钟内快速生成数十万组模拟的误差序列及其对应的光谱序列。在模拟中，研究者设定了合理的误差参数（如表2所示）：光谱测量误差标准差0.5%，折射率误差标准差1%，快门延迟时间均值0.5秒、标准差0.5秒，沉积速率均值0.3 nm/s、标准差0.1 nm/s。这些参数参考了常见的计算制造模拟设定。该模型不仅能生成最终完成所有层沉积后的光谱，还能生成每一层沉积结束时的瞬时光谱，从而构成一个按时间顺序排列的光谱序列数据集。这为后续利用擅长处理序列数据的Transformer模型奠定了基础。
第二步：基于Transformer的深度学习反演策略设计与模型构建。 针对BBOM误差序列的时序性和强相关性特点，研究团队选择了Transformer作为核心深度学习架构。Transformer凭借其多头注意力（Multi-Head Attention）机制，能够高效地捕捉序列数据中长距离的复杂依赖关系，非常适合处理光谱序列中各层数据间的关联。
研究者设计了一个编码器-解码器（Encoder-Decoder）结构的Transformer网络（如图1所示）。其工作流程如下：当需要反演前i层薄膜的误差时，将沉积完这i层后测得的光谱序列输入编码器模块，编码器将其转换为一组蕴含序列信息的嵌入向量。同时，解码器接收“右移”的、已预测出的前i-1层误差序列（在训练时是真实的误差序列）作为初始输入。编码器的输出（光谱嵌入）和解码器的当前输入（误差嵌入）共同进入解码器的多头注意力层。在该机制中，模型通过计算查询（Query）、键（Key）和值（Value）向量之间的相似度，自动学习并关注光谱序列中对预测当前层误差最关键的部分。解码器中还采用了掩码多头注意力，确保在预测第i层误差时，只能利用前i-1层的信息，防止信息泄露。最终，解码器输出第i层的预测误差（包括厚度误差和折射率误差）。整个网络使用均方误差作为损失函数，采用Adam优化器进行训练。
第三步：针对具体薄膜设计进行模型训练与验证。 为了验证所提方法的有效性，研究者选择了一个具体的薄膜设计作为案例：一个由Ta2O5和SiO2材料构成的12层双波段减反射膜。首先，他们利用前述快速解析模型，生成了10万组训练数据。每组数据包括：一个模拟的光谱序列、一个对应的厚度误差序列和一个折射率误差序列。监控波长范围为500-1050 nm，间隔1 nm。
随后，他们构建并训练了Transformer模型。模型配置了8个注意力头，前馈网络包含2层，每层256个神经元。在Intel Core i7-8750H CPU上，使用学习率1e-4，批量大小64，训练了100个周期。训练结果显示，模型在训练集和测试集上对厚度误差和折射率误差的预测均方误差都很低（训练集：厚度0.2885，折射率0.0541；测试集：厚度0.3277，折射率0.0648），表明模型不仅学习了训练数据的规律，还具有良好的泛化能力。为进一步验证模型是否真正捕捉到了误差间的相关性，研究者计算了真实厚度误差序列与模型预测的厚度误差序列的皮尔逊相关系数矩阵。对比图4中的两个热图可以发现，它们呈现出高度相似的结构，强相关性的色块（如第4与第6层、第6与第8层、第10与第11层）位置完全一致，这强有力地证明训练好的模型成功学习并复现了BBOM过程中固有的层间误差相关特性。
第四步：利用实际沉积数据进行实验验证与性能对比。 理论模型的成功需要实际数据的检验。研究团队使用Veeco离子束溅射镀膜机实际制备了上述设计的双波段减反射膜，并利用其集成的宽带光学监控系统记录了沉积过程中每一层结束时的实测光谱。
他们将实际沉积得到的光谱数据（特别是最后四层的光谱）输入到已训练好的Transformer模型中进行反演，得到了每一层的预测厚度误差和折射率误差。图5(a)展示了模型反演出的误差分布。为了评估其合理性，研究者将反演出的厚度误差模式与快速解析模型统计平均生成的误差模式（图5(b)）进行了对比，发现两者趋势吻合良好，说明反演结果符合理论预期。
最关键的性能指标是光谱拟合精度。研究者利用模型反演出的厚度和折射率误差，重新计算了“反演光谱”，并将其与“实测光谱”以及“理论设计光谱”进行对比（如图6所示）。结果显示，对于误差较大的最后四层（第9至12层），反演光谱与实测光谱高度吻合，最大光谱差异分别仅为0.81%、0.94%、0.43%和0.31%（扣除探测器切换点的异常数据），远优于理论光谱与实测光谱之间的差异。这直接证明了该模型能够非常精确地反演出制造过程中的真实误差。
最后，研究者在计算速度和精度上，将Transformer模型与传统的S算法和T算法进行了横向对比（表3）。在计算时间上，Transformer模型仅需约0.08秒，而S算法和T算法分别需要0.9秒和7.5秒，Transformer展现了近两个数量级的速度优势。在反演精度上（以反演光谱与实测光谱的误差衡量），Transformer模型在所有层上的表现均大幅优于S算法（误差降低超过2倍）；与更先进的T算法相比，Transformer在第10层和第12层表现更优，整体精度相当或略有胜出。这综合表明，本研究提出的方法在保持高精度的同时，实现了计算效率的飞跃。
四、 主要研究结果及其逻辑关联
本研究取得了一系列环环相扣、相互支撑的研究结果： 1. 理论建模结果：成功建立了描述BBOM层间误差相关性的快速解析模型。该模型不仅是高效生成训练数据的基础，其统计平均结果（图5(b)）也为后续验证深度学习反演结果的合理性提供了理论参照。 2. 模型训练结果：成功训练了一个基于Transformer的误差反演模型。低训练/测试损失表明模型学到了从光谱序列到误差序列的复杂映射；相关系数矩阵热图的相似性（图4）则提供了模型已捕获误差相关性的直接证据。这是实现高精度反演的前提。 3. 实验验证结果：在实际镀膜数据上的测试取得了成功。反演出的误差模式与理论统计模式相符（图5），且利用反演误差计算出的光谱与实测光谱几乎完全重合（图6），光谱差异小于1%。这是整个研究最核心、最有力的结果，直接证明了所提方法的有效性和实用性。 4. 性能对比结果：在与传统算法的对比中，Transformer模型在计算速度上具有压倒性优势（0.08秒 vs. 0.9⁄7.5秒），在反演精度上全面超越S算法，并与T算法相当或更优（表3）。这凸显了该方法在精度和效率上的综合优势。
这些结果之间存在清晰的逻辑链条：理论模型为生成数据提供了依据；利用生成数据训练出的深度学习模型具备了捕捉复杂关联的能力；该模型在实际数据上表现出的高精度，最终验证了整个方法体系（从快速数据生成到Transformer反演）的可行性与优越性；性能对比则从客观数据上量化了这种优越性。
五、 研究结论与价值
本研究得出结论：针对宽带光学监控中光学薄膜制造误差反演的难题，所提出的基于Transformer深度学习框架的策略，结合快速解析数据生成模型，能够实现快速、高精度的厚度与折射率误差反演。该方法有效克服了传统反演方法在处理复杂相关误差时面临的多解性、效率低等瓶颈。
该研究的价值体现在以下几个方面： * 科学价值：将前沿的Transformer深度学习架构成功引入光学薄膜制造这一传统工程领域，为解决复杂的物理反演问题提供了新的范式。它展示了深度学习在捕捉和理解复杂物理过程（如误差传播与自补偿）中的强大能力。 * 应用价值： * 在线实时监控：模型推理速度极快（数十毫秒），为在镀膜过程中实时反演误差、实现主动工艺补偿和闭环控制提供了可能。 * 离线工艺诊断：可快速、准确地分析已完成镀膜样品的误差来源，指导工艺参数优化，提升良品率。 * 通用性框架：研究所提出的“快速数据生成+Transformer学习”框架具有普适性，通过调整训练数据，可适用于不同类型、不同层数的光学薄膜误差反演问题。
六、 研究亮点
方法创新性：首次将Transformer模型系统性地应用于光学薄膜制造误差反演工程，利用其多头注意力机制巧妙处理了BBOM中棘手的层间误差相关性。
数据生成策略：提出了一个高效的快速解析模型，能够在几分钟内生成海量、带有关联误差的模拟训练数据，解决了深度学习在工业应用中训练数据获取难、成本高的关键问题。
显著的性能提升：在保证高反演精度（光谱差异%）的同时，将计算时间从秒级缩短至毫秒级，实现了精度与效率的同步突破，为在线应用奠定了基础。
完整的验证链条：研究从理论分析、模拟数据训练、模型能力验证（相关性学习）到最终的实际镀膜实验验证，构成了一个完整、严谨的闭环，结论可靠。
七、 其他有价值的内容
研究还指出了该方法的灵活性与扩展性。本文展示的是“离线反演”，即使用所有12层沉积完成后的完整光谱序列进行反演。但作者强调，所提出的框架同样适用于“在线反演”，只需构建形如[第1层光谱]、[第1,2层光谱]、……、[第1至12层光谱]的变长光谱序列数据集，并训练能够处理变长输入的Transformer网络即可。这意味着该技术可以无缝集成到实时监控系统中。此外，训练好的模型在仅使用CPU资源的情况下就能达到毫秒级推理速度，若部署在小型GPU上，将能更好地满足在线应用的实时性要求。这为工业现场部署铺平了道路。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问