融合自注意力机制与ConvLSTM的多模态GFZTD三维对流层延迟预测模型

分享自：
融合自注意力机制与ConvLSTM的多模态GFZTD三维对流层延迟预测模型

工程学
信息科学
期刊:IEEE Journal of Selected Topics in Applied Earth Observations and Remote SensingDOI:10.1109/JSTARS.2026.3655033
【点击此处】阅读全文、收藏及针对性提问
面向高精度导航与气象应用的天顶对流层延迟新型预测模型GFZTD研究学术报告一、 研究作者、机构及发表信息
本研究的主要作者为武汉大学GNSS研究中心的朱怡欣、沙志敏*、魏鹏志、叶世榕*、夏鹏飞以及哈尔滨工业大学（深圳）的胡芳馨。其中，通讯作者为沙志敏和叶世榕。该研究成果已发表于IEEE期刊*Journal of Selected Topics in Applied Earth Observations and Remote Sensing*，根据引文信息，其最终版本预计于2026年出版，目前在线发布的是作者版本。
二、 研究的学术背景
本研究属于大地测量学与气象学的交叉领域，核心聚焦于全球导航卫星系统（Global Navigation Satellite System， GNSS）信号传播中的关键误差源——对流层延迟的实时高精度建模与预测。
在GNSS信号从卫星传播至接收机的过程中，中性大气层（尤其水汽）会导致信号路径发生弯曲和延迟，即对流层延迟。为简化定位模型，通常使用映射函数将路径上的总延迟投影至天顶方向，得到天顶对流层延迟（Zenith Tropospheric Delay， ZTD）。ZTD是影响GNSS导航定位精度（特别是精密单点定位PPP和实时动态RTK）的主要误差源之一，高精度的ZTD先验信息能显著提升定位的精度与收敛速度。此外，ZTD与水汽含量密切相关，因此也是监测和预报极端天气、进行气候研究的关键参数。因此，建立一个实时、高精度的对流层延迟模型具有重要的科学意义和广泛的应用前景。
传统的ZTD建模方法主要包括依赖实测气象参数的经验公式、基于球谐函数的全球气象网格模型，以及利用历史再分析数据（如ERA5）构建的考虑周期性变化的全球经验网格模型。然而，这些方法或难以获取实时数据，或精度有限（约3.7-4 cm），尤其在复杂地形和极端天气条件下表现不佳，难以准确反映ZTD的实时变化。近年来，随着机器学习技术的发展，卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等已被应用于ZTD时间序列建模，达到了厘米级精度。但现有基于深度学习的方法多将网格数据插值到站点进行时间序列预测，只能获得特定站点的ZTD值，空间覆盖有限。
针对以上挑战，本研究旨在实现从离散站点预测到连续三维空间场预测的跨越。研究团队创新性地将三维ZTD网格数据的建模与预测问题，转化为二维灰度图像序列的时空预测问题。他们提出了一个名为GFZTD（Gray Figure-based Zenith Tropospheric Delay prediction）的新型深度学习模型，该模型融合了多模态数据，旨在生成高时空分辨率的近实时三维ZTD网格产品，以满足高精度定位和气象应用的需求。
三、 详细研究流程
本研究的工作流程系统且复杂，主要包含数据预处理、模型训练、预测与精度评估三个核心部分，具体步骤如下：
1. 数据预处理与校正 * 研究区域与数据源：研究区域选定为中国东南部及邻近海域（101°E–124°E， 16°N–34°N）。该区域地形多样，受亚热带季风影响，水汽变化显著，对ZTD建模挑战巨大。研究收集了2023年全年、时间分辨率为1小时的三类数据：用于训练和验证的ERA5再分析网格数据、用于实时预测输入的全球预报系统（Global Forecast System， GFS）预报网格数据，以及用于校正GFS数据的中国地壳运动观测网络（CMONOC）GNSS站的近实时ZTD数据。此外，还使用了维也纳映射函数3（Vienna Mapping Functions 3， VMF3）提供的IGS站后处理ZTD产品作为独立验证的真值。 * 三维ZTD计算与网格化：首先，利用ERA5和GFS数据集提供的各压力层的位势高度、气压、温度和比湿等气象参数，通过公式计算干、湿折射率，然后沿椭球高方向积分，得到每个网格点的ZTD值。考虑到高空水汽含量骤减，建模高度限制在4公里以下。研究将ERA5（37层）和GFS（31层）的原始气压层数据，插值到10个非均匀高度层（Uniform Height Layers， UHLs）：0， 0.1， 0.2， 0.4， 0.6， 1， 1.5， 2， 3， 4 km，并在水平方向将网格分辨率统一插值到0.1°×0.1°。 * ZTD灰度图像生成：对于每个UHL，将研究区域内该高度层的所有ZTD网格值，通过线性变换映射到0-65535的灰度值，从而将二维ZTD场转换为一幅128×128像素的灰度图像。全年每个小时、每个高度层都会生成一张这样的图像，构成用于模型训练的时空序列。 * 基于GNSS ZTD的GFS网格数据校正：由于GFS是预报数据，存在误差。本研究利用延迟仅数分钟的近实时GNSS ZTD对GFS预报值进行校正。具体步骤包括：① 在每个GNSS站处，利用周围网格点的GFS ZTD三维数据，通过分段函数拟合得到该站ZTD随高度的剖面曲线；② 计算该站高度处的ZTD校正量（dZTD），并按比例传递到目标高度层；③ 对于目标网格点，搜索其周围500公里内的GNSS站，采用反距离加权法计算该网格点在各高度层的dZTD，将其加到原始的GFS ZTD值上，得到校正后的ZTD网格场，并同样转换为灰度图像，记为ZTD_GFS_GNSS_corr，作为GFZTD模型的输入。
2. GFZTD模型训练 * 模型原理与结构：GFZTD模型是一个专门为ZTD灰度图像序列预测设计的深度学习架构，其核心创新在于融合了多种机制。模型基本结构基于编码器-解码器框架，并包含一个独特的偏置层（BiasLayer）用于学习GFS与ERA5数据间的系统误差。其核心组件包括： * 时间序列编码机制：结合了位置编码和时间编码（月、周、日、时），增强了模型对时序信息的表征能力，提升了在不同时间数据集上的泛化能力。 * SA-ConvLSTM模块：这是模型的核心预测单元。它巧妙地将卷积长短期记忆网络（Convolutional LSTM， ConvLSTM） 与自注意力机制（Self-Attention， SA） 相结合。ConvLSTM通过卷积操作捕捉局部空间特征，并利用LSTM的门控机制处理时间依赖关系。自注意力机制则能捕获序列内部的全局依赖关系。本研究进一步采用了带有记忆单元的自注意力模块（Self-Attention Memory， SAM），该模块不仅能对当前隐藏状态进行自注意力计算，还能与来自上一时间步的记忆单元交互，从而聚合全局的时空信息，增强了对长程依赖关系的建模能力。 * 多高度层独立训练：由于不同高度层ZTD变化特性不同，研究为上述10个UHL分别独立训练了10个GFZTD模型。 * 数据集划分与超参数设置：将2023年数据按季节切片为四个子集（1-3月，4-6月，7-9月，10-12月）。每个子集中，前两个月的数据用于训练和验证（共5832张图像，训练集与验证集比例3:1），第三个月的数据用于测试和预测。模型输入是连续12个小时的ZTD_GFS_GNSS_corr灰度图像序列，输出是预测的下一个时刻（第13小时）的ZTD灰度图像，其标签是对应时刻的ERA5 ZTD灰度图像。模型采用均方误差（MSE）作为损失函数，使用Adam优化器，并设置了学习率衰减策略。
3. ZTD预测与精度评估 * 预测流程：对于目标预测时刻t，获取t-11至t时刻的、经GNSS校正后的GFS ZTD灰度图像序列，输入训练好的对应高度层的GFZTD模型，即可输出预测的t时刻ZTD灰度图像。将该图像反向映射回ZTD值，即得到该高度层0.1°×0.1°分辨率的ZTD网格预测场。对所有10个高度层重复此过程，即合成完整的三维ZTD网格产品。 * 精度评估方法：研究从两个维度进行 rigorous 评估： * 网格尺度评估：以高精度的ERA5再分析数据作为“地面真值”，在整个研究区域的所有网格点上，将GFZTD的预测结果与原始的GFS预报值、以及广泛使用的GPT3经验模型计算值进行对比。评价指标包括平均绝对误差（MAE）、均方根误差（RMSE）和确定系数（R²）。 * 站点尺度评估：以VMF3提供的IGS站后处理ZTD产品作为独立真值，将GFZTD三维网格结果插值到这些验证站的位置和高度，得到站点ZTD预测值，再与GFS和GPT3在站点的结果进行比较，以检验模型在实际站点上的适用性。
四、 主要研究结果
1. 模型训练与验证性能： 在各自高度层的验证集上，GFZTD模型表现出优异的预测性能。随着高度增加，ZTD的变异性减小，模型的预测误差（RMSE， MAE）呈现显著的指数衰减趋势，这与实际情况相符。在所有高度层上，预测结果与ERA5真值之间的确定系数R²均保持在0.9左右的高水平，表明模型具有极强的解释和预测能力。
2. 网格尺度预测精度（以ERA5为真值）： * 整体精度：GFZTD模型的三维ZTD网格预测结果与ERA5数据具有最高的一致性。其整体RMSE为1.35厘米，相较于GFS预报的1.84厘米和GPT3模型的4.66厘米，分别提升了26.5%和71.0%。特别值得注意的是，在误差极值控制上，GFZTD将GFS的最大RMSE从36.31厘米大幅降低至9.72厘米，提升幅度达73.2%，证明了该模型在抑制区域极端预测误差方面的卓越能力。 * 垂直方向精度：在垂直方向上，GFZTD在1公里及以下高度层对GFS的校正效果尤为显著。在0公里层（最难预测），GFZTD的RMSE为1.76厘米，相比GFS的2.92厘米和GPT3的4.13厘米，分别提升了39.7%和57.4%。在1公里以上，GFZTD精度略优于或与GFS相当，但仍远优于GPT3模型。分季节统计显示，模型在冬季预测效果最佳，夏季由于水汽活动旺盛误差稍大，但所有季节、所有高度层的RMSE最大值仅为2.19厘米（夏季0公里层），体现了良好的时空普适性。 * 水平方向精度：聚焦于0公里层的水平空间分布。GFS在四川、云南等多山、地形复杂区域以及台湾地区存在明显的区域性预报误差（RMSE较大，图中显示为橙色或红色区域），尤其是在夏季。相比之下，GFZTD模型的预测结果在整个区域表现出高度的空间稳健性，RMSE普遍稳定在1-2厘米左右（图中显示为蓝色），且有效纠正了GFS在上述复杂地区的预测偏差，图中不再出现大面积高误差区域。
3. 站点尺度预测精度（以VMF3为真值）： 使用9个IGS站的独立数据验证表明，将GFZTD三维网格结果插值到站点高度的方法是可行且高效的。GFZTD在站点上的预测精度显著优于GFS和GPT3。在TWTF等GFS预报表现异常差的站点，GFZTD起到了显著的修正作用。整体上，GFZTD在所有验证站的平均RMSE为1.49厘米，相比GFS的1.80厘米和GPT3的5.15厘米，分别提升了13.1%和69.4%。
五、 研究结论与价值
本研究成功构建了基于灰度图像序列预测的GFZTD模型，实现了对区域三维天顶对流层延迟的高精度、近实时预测。该模型能够生成水平分辨率0.1°、时间分辨率1小时、垂直方向灵活可调的高精度三维ZTD网格产品。
其科学价值与应用价值主要体现在：1）方法论创新：首次将ZTD三维场预测转化为图像序列预测问题，并设计了融合ConvLSTM、自注意力机制和时间编码的深度学习框架，为大地测量领域的时空序列建模提供了新思路。2）精度显著提升：模型产品精度显著优于主流预报数据（GFS）和经验模型（GPT3），尤其在复杂地形区域展现了优异的修正能力和空间稳健性。3）应用前景广阔：生成的近实时高精度ZTD产品可作为PPP/RTK中的对流层延迟约束，加速收敛并提升在复杂环境下的定位精度；可作为数值天气预报（NWP）系统的同化数据源，改进天气预报；也可直接用于大气水汽反演和强降水监测等气象研究。
六、 研究亮点
思路新颖：创造性地将大气延迟网格数据视为“天气云图”，利用图像预测技术解决ZTD三维场预测问题，实现了从“站点预测”到“空间场预测”的范式转变。
模型先进：自主研发的GFZTD模型深度融合了ConvLSTM的局部时空特征提取能力、自注意力机制（特别是SAM模块）的全局长程依赖捕获能力以及时间编码机制，构成了一个强大的时空序列预测器。
多模态数据融合策略：提出了有效的多模态数据融合方案，将GFS预报场的图像模态与GNSS站点的时序模态相结合，利用GNSS近实时数据校正预报场，再通过深度学习模型进一步优化，充分发挥了不同数据源的优势。
系统全面的验证：不仅使用再分析数据（ERA5）从网格尺度评估，还利用独立的、精度更高的后处理产品（VMF3）从站点尺度进行交叉验证，结论坚实可靠。
实用性强：研究成果直接输出为即用的三维网格产品，时空分辨率高，且经过验证在复杂环境下表现稳健，具备直接应用于工程和业务系统的潜力。
七、 其他有价值的内容
研究团队在文中展望了未来的工作方向，包括：改进多源信息融合方法、修正模型边界条件误差、探索基于Transformer架构的长期预测模型、将应用拓展至可降水量（PWV）估计、以及研究将GFZTD输出与NWP同化系统耦合等。这些方向将进一步扩展模型的预报时效和应用范围，提升其在大地测量和气象学领域的实用价值。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问