基于地理卷积神经网络加权回归与张量样条函数的大陆地区天顶对流层延迟模型

分享自：
基于地理卷积神经网络加权回归与张量样条函数的大陆地区天顶对流层延迟模型

工程学
信息科学
期刊:GPS SolutionsDOI:10.1007/s10291-024-01751-2
【点击此处】阅读全文、收藏及针对性提问
关于“基于地理卷积神经网络加权回归与张量样条函数的大陆天顶对流层延迟模型”研究的学术报告
本文聚焦于全球导航卫星系统（GNSS）气象学及高精度定位领域，由武汉大学人工智能研究院、GNSS研究中心、测绘遥感信息工程国家重点实验室等多个单位的彭志伟、胡芳馨、夏鹏飞、叶世榕、沙志敏、刘建辉共同完成。该研究成果以题为“Zenith tropospheric delay model in mainland China based on geographically convolutional neural network weighted regression and tensor spline function”的原创研究论文形式，于2024年9月25日在线发表于国际学术期刊《GPS Solutions》（2024年第28卷第206期）。
一、 学术背景与研究目的
全球导航卫星系统（GNSS）技术已从定位服务延伸至气象、气候变化监测等多个领域。其中，由GNSS数据反演获得的天顶对流层延迟（ZTD）是GNSS对流层研究中至关重要的参数。ZTD反映了信号传播路径上的大气总效应，对实现高精度精密单点定位（PPP）和提高数值天气预报精度具有关键作用。
然而，当前GNSS数据的实际应用中面临一系列挑战：地面GNSS站点数量有限且分布不均；站点观测数据可能因各种原因出现缺失；高时空分辨率的ZTD数据获取困难。为应对这些挑战，以往研究主要采用两类方法：一是空间插值法，如反距离权重插值（IDW）、克里金插值等，直接从已知站点ZTD推算未知站点ZTD，但往往忽略了影响ZTD的关键气象因素；二是基于气象再分析数据（如ERA5）或全球气压温度模型（如GPT系列模型）进行计算，前者数据量大、存在延迟，后者在复杂地形或区域尺度上的估算精度仍有待提高。此外，一些研究开始引入机器学习方法进行ZTD时间序列预测，但对空间位置信息的考虑不够充分。
针对现有方法的局限性，本研究旨在开发一种新型的高精度ZTD估算模型。该模型的核心目标是仅利用目标站点的地理位置信息（经度、纬度、高程）和易于获取的地表气象参数（温度、气压），即可实现对目标站点ZTD的精确估计，从而克服对密集GNSS站点网络的依赖和复杂气象数据的需求。为实现这一目标，研究团队提出并验证了一种融合了地理卷积神经网络加权回归（GCNNWR）与张量样条函数（TSF）的创新模型——GCNNWR-TSF。
二、 研究流程与方法详述
本研究流程严谨，涵盖了数据准备、相关性分析、模型构建与训练、多场景精度评估以及模型应用验证等多个环节。
第一环节：数据准备与预处理。 研究区域为中国大陆。GNSS站点观测数据来自中国地壳运动观测网络（CMONOC），共250个站点，时间分辨率为30秒/历元。为获取与GNSS站点对应的气象数据，研究团队利用空间分辨率为0.25°×0.25°的ERA5再分析数据，通过插值得到了每个GNSS站点位置的小时级温度和气压数据。ZTD数据同样从CMONOC获取。为确保模型训练的普适性和评估的客观性，研究从2022年中每月随机选取一天（共12天），并选取每日两个代表性时刻（UTC 00:00和12:00）作为实验验证时间点。随后，将全部250个站点按照随机、均匀分布的原则划分为训练集（70%，用于模型构建）和测试集（30%，用于模型评估与对比）。
第二环节：变量相关性分析。 在构建模型前，研究首先定量分析了ZTD与站点高程、温度、气压三个关键因子之间的关系。采用了两种方法：1) 皮尔逊相关性分析：计算了12个时间点上各变量与ZTD的线性相关系数。结果表明，ZTD与高程呈强负相关，与气压呈强正相关，且这两种关系在不同时间和季节下非常稳定。ZTD与温度呈正相关，但表现出明显的时空异质性：在UTC 00:00（对应北京时间08:00）的相关性高于UTC 12:00（对应北京时间20:00）；夏季相关性最高，春秋次之，冬季最低。2) 地理探测器分析：用于探测变量的空间分异性。计算了各因子对ZTD空间差异的解释力（q统计量）。结果显示，高程和气压对ZTD的空间解释能力始终保持在高水平，而温度的解释能力则受季节变化影响较大，夏季最强。这一分析为后续模型将高程、气压和温度作为核心输入变量提供了理论依据。
第三环节：模型构建与算法核心。 本研究构建并对比了六种模型，其中GCNNWR-TSF是提出的新模型。 1. 对比模型：包括两种传统空间插值模型（IDW, Kriging），两种全球模型（HGPT2, GPT3），以及作为新模型基石的GCNNWR模型。 2. 核心创新模型——GCNNWR-TSF：该模型是一个两阶段融合模型。 * 第一阶段：GCNNWR估计。GCNNWR模型是对地理加权回归（GWR）的优化。传统GWR在估计每个位置参数时，严重依赖于该位置周围样本点的分布质量。GCNNWR的创新之处在于，它首先构建一个覆盖整个研究区域的全局空间邻近网格（GSPG），然后利用一个专门设计的空间加权卷积神经网络（SWCNN）从GSPG中学习并生成空间权重矩阵。这使得模型表征空间邻近关系的能力独立于样本点的具体分布，从而提升了全局估计的稳健性。模型的输入是站点的经纬度、高程、温度和气压，输出是ZTD估计值。 * 第二阶段：TSF残差优化。研究发现，像GCNNWR这类地理加权回归模型的残差具有空间自相关性。为了提高精度，本研究没有使用常见的克里金法进行残差插值，而是引入了张量样条函数（TSF）。TSF是一种基于径向基函数的插值方法，以其高计算效率、强大的拟合能力以及能够保持原始数据凸性特征而著称，即使在数据点分布不均的情况下也能表现良好。具体步骤是：利用TSF对训练集站点上GCNNWR模型的估计残差进行空间插值计算，从而得到测试集站点位置的残差估计值。最后，将GCNNWR对测试站点的ZTD估计值加上TSF插值得到的残差修正项，即得到最终优化的ZTD值（公式：Y_gcnnwr-tsf = Y_gcnnwr + Res_tsf）。
第四环节：多维度精度评估与对比。 研究没有简单地给出整体精度，而是从多个维度深入评估了六种模型的性能，使用均方根误差（RMSE）、平均绝对误差（MAE）、确定系数（R²）和偏差（Bias）作为评价指标。 1. 整体精度对比：在测试集上，六种模型的精度排序为：IDW < Kriging < HGPT2 < GPT3 < GCNNWR < GCNNWR-TSF。GCNNWR-TSF模型显著优于其他所有模型。具体提升比例为（以MAE/RMSE计）：相比IDW提升75.3%/75.4%，相比Kriging提升72.7%/73.5%，相比HGPT2提升34.4%/30.2%，相比GPT3提升27.6%/25.0%，相比GCNNWR自身也提升了8.7%/6.3%。 2. 不同时刻适用性：在UTC 00:00，所有模型的精度普遍优于12:00，这可能与00:00时大气状况更稳定有关。GCNNWR-TSF在00:00表现最佳，MAE和RMSE分别达到2.0厘米和2.9厘米。 3. 不同季节适用性：GCNNWR-TSF在春、夏、秋、冬四季均保持最高精度。值得注意的是，在冬季，GCNNWR模型的精度略逊于HGPT2，但经过TSF残差修正后的GCNNWR-TSF模型仍能保持最优（MAE 1.8厘米，RMSE 2.6厘米），证明了残差修正环节的有效性和必要性。 4. 不同高程适用性：将测试站点按高程分为<100米、100-1000米、>1000米三组。结果显示，传统插值模型在高海拔地区（>1000米）表现很差（MAE >10厘米），GPT系列模型有所改善，而GCNNWR-TSF在所有高程区间均表现优异，特别是在高海拔地区，MAE和RMSE分别低至1.9厘米和2.6厘米，展现出极强的适应能力。 5. 不同地形适用性：在四川盆地、华北平原、青藏高原、东南丘陵四种典型地形中，GCNNWR-TSF均表现最佳。在地形平坦的华北平原精度最高（MAE 1.5厘米），在地形复杂的青藏高原也保持了很高的估算能力。
第五环节：模型应用验证——在精密单点定位（PPP）中的效果。 为验证GCNNWR-TSF模型产出的ZTD数据的实用价值，研究将其作为先验约束信息引入到PPP解算中。实验选取了代表四季的四个测试日，对测试集中的站点进行PPP解算。结果表明，使用GCNNWR-TSF提供的ZTD作为外部约束，能够平均缩短PPP在U方向（高程方向）的收敛时间达6.68%，在某些日期（如第105天和第246天）收敛时间提升超过10%。这直接证明了该模型不仅具有高精度估算能力，其产出结果还能有效提升GNSS高精度定位应用的效率。
三、 主要研究结果
本研究获得了一系列系统的、具有说服力的结果： 1. 变量关系量化结果：明确了ZTD与高程、气压存在强而稳定的负相关和正相关关系，与温度存在显著时空异质性的正相关关系。这从线性与空间分异两个层面深化了对ZTD影响因子的认识。 2. 模型优越性证明结果：通过全面、多维度的对比实验，以详实的误差数据（MAE, RMSE）证明，新提出的GCNNWR-TSF模型在估算中国大陆区域ZTD时，其精度显著优于传统的空间插值方法（IDW, Kriging）和广泛使用的全球经验模型（HGPT2, GPT3），也优于未进行残差优化的GCNNWR模型。这是本研究最核心的实证结果。 3. 模型稳健性验证结果：模型在不同时间（UTC 00:00 vs 12:00）、不同季节、不同海拔高度、不同地形环境下均表现出优异的和稳定的估算精度，尤其是在传统模型表现较差的冬季和高海拔地区依然保持领先，证明了其强大的稳健性和泛化能力。 4. 实际应用价值体现结果：将模型输出的ZTD应用于PPP，能有效缩短定位收敛时间，平均提升6.68%。这一结果将模型的学术价值延伸到了实际工程应用中，形成了从“模型创新”到“精度验证”再到“应用增效”的完整逻辑闭环。
四、 研究结论与价值
本研究成功开发并验证了一种新型的、高精度的区域天顶对流层延迟估算模型——GCNNWR-TSF。该模型仅需输入站点的地理位置和地表温压数据，即可实现对中国大陆范围内任意目标点ZTC的高精度估计。
其科学价值在于：1) 方法创新：首次将地理卷积神经网络加权回归（GCNNWR）与张量样条函数（TSF）残差修正相结合，为处理具有强烈空间异质性和非平稳性的地理数据（如ZTD）建模提供了新的、更有效的技术框架。2) 认知深化：通过细致的相关性分析，深化了对ZTD与各影响因子（特别是温度）之间复杂时空关系的理解。
其应用价值在于：1) 提升数据可用性：可在GNSS站点稀疏或数据缺失区域，提供高精度的ZTD数据，增强GNSS气象学产品和服务的空间覆盖与分辨率。2) 服务高精度定位：所提供的高精度ZTD先验信息，能够加速PPP等定位技术的收敛，提升导航定位服务的效率和可靠性。3) 简化数据需求：模型仅需易于获取的站点坐标和地表气象参数，降低了对复杂垂直气象廓线数据或密集GNSS网络的依赖，更便于业务化推广。
五、 研究亮点
创新性的模型融合：研究提出的GCNNWR-TSF模型是核心亮点。它巧妙地结合了GCNNWR在空间非平稳性建模上的优势和TSF在高精度曲面拟合与残差修正上的特长，实现了“主模型估计+残差空间优化”的协同增效，显著提升了最终精度。
系统严谨的评估体系：研究并未停留在整体精度对比，而是构建了一个极其系统、多维度的模型评估体系，涵盖了时间、季节、高程、地形等多种场景，全面、深入地展示了模型的性能与优势，论证非常扎实。
从理论到应用的完整链条：研究不仅完成了新模型的构建与验证，还进一步将其输出结果应用于PPP实践，验证了其实际应用价值，完成了从方法论研究到解决实际问题的完整闭环，增强了研究的说服力和实用性。
对残差处理的重视与创新：研究敏锐地认识到地理加权回归类模型残差的空间自相关性，并创新性地选用TSF而非常见的Kriging进行修正，这一选择基于对方法特性的深入理解，是提升模型精度的关键步骤。
六、 其他有价值内容
本研究在实施细节上也有值得借鉴之处。例如，在构建GCNNWR模型时，通过反复实验比较，将全局空间邻近网格（GSPG）的分辨率设置为0.1°×0.1°，体现了对模型参数优化的细致工作。此外，研究公开了所使用的全部数据来源（CMONOC, ERA5）和部分模型（HGPT2）的代码链接，保证了研究的可重复性。团队也明确了实验的硬件和软件配置（Python, ArcGIS, MATLAB等），为其他研究者复现或借鉴此工作提供了便利。最后，论文中对GCNNWR和TSF算法的原理进行了清晰的公式化阐述，增强了论文的理论深度。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问