关于利用机器学习模型预测GNSS天顶对流层延迟的学术研究报告
一、 研究作者、机构与发表信息
本研究由加纳矿业与技术大学测绘工程系的 Appau, K. J.(通讯作者)、Yakubu, I. 和 Ziggah, Y. Y. 共同完成。研究成果以论文形式发表于 International Journal of Geoinformatics 期刊,具体为2025年8月出版的第21卷第8期。论文标题为“Prediction of Zenith Tropospheric Delay in GNSS Application Using Machine Learning Models”。论文的DOI编号为 https://doi.org/10.52939/ijg.v21i8.4371。
二、 研究学术背景
本研究隶属于大地测量学与卫星导航气象学的交叉领域,核心科学问题聚焦于全球导航卫星系统(Global Navigation Satellite System, GNSS)信号传播过程中的关键误差源——天顶对流层延迟(Zenith Tropospheric Delay, ZTD)的高精度预测。
GNSS信号在穿过中性大气层(主要是对流层)时,会受到温度、气压和水汽含量的影响而发生延迟,即对流层延迟。其中,在接收机天顶方向上的总延迟称为ZTD,它可分解为约占90%的、相对稳定的天顶静力学延迟(Zenith Hydrostatic Delay, ZHD)和变化剧烈的天顶湿延迟(Zenith Wet Delay, ZWD)。ZTD是影响GNSS高精度定位(如精密单点定位)和大气水汽反演精度的主要误差之一,在低纬度热带地区,由于高温、高湿、气压多变,其影响尤为显著。传统上,ZTD的估计主要依赖三类模型:数值天气模型(如ECMWF)、基于数学方程的解析模型(如Saastamoinen模型)以及基于历史数据的经验模型(如GPT系列)。然而,这些传统模型通常采用单一函数进行建模和曲线拟合,难以精确捕捉ZTD复杂且非线性的时空变化规律。
近年来,机器学习(Machine Learning, ML)模型在近似非线性函数方面展现出强大能力,已被广泛应用于ZTD预测,并取得了稳健的效果。常用的方法包括人工神经网络(Artificial Neural Network, ANN)、反向传播神经网络(Back-Propagation Neural Network, BPNN)、长短期记忆网络(Long Short-Term Memory, LSTM)和多层感知器神经网络(Multilayer Perceptron Neural Network, MLPNN)等。然而,传统深度学习模型如LSTM和MLP存在数据效率低、超参数敏感、可解释性差以及容易过拟合等局限性。集成方法如随机森林(Random Forest, RF)和极端梯度提升(eXtreme Gradient Boosting, XGBoost)虽然强大,但缺乏固有的时间序列建模能力且模型透明度不足。
在此背景下,一种基于Kolmogorov–Arnold表示定理的新型神经网络架构——Kolmogorov–Arnold网络(KAN)应运而生。KAN通过可学习的样条基单变量函数组合来逼近多元函数,具有参数效率高、可解释性强的潜在优势,已在多个科学回归任务中展现出媲美甚至超越传统多层感知器(MLP)的性能。
因此,本研究旨在首次将KAN模型引入ZTD预测领域,并在加纳的热带气候条件下,系统评估其性能。研究选取了四种广泛使用的机器学习模型(LSTM、MLPNN、XGBoost、RF)作为基准,通过对比分析,旨在验证KAN在GNSS气象建模中的适用性、优势及潜力,以期为热带地区GNSS高精度定位和大气建模提供更优的解决方案。
三、 详细研究流程
本研究的工作流程系统而完整,主要包括以下几个关键步骤:
1. 研究区域与数据采集: 研究区域为西非国家加纳。研究选取了加纳境内四个由加纳特许测量师协会运营的GNSS连续运行参考站(Continuously Operating Reference Station, CORS)作为数据源,站点分别为阿克拉(Accra)、霍城(Ho)、库马西(Kumasi)和阿基姆奥达(Akim Oda)。数据覆盖时段为2020年至2022年。
数据集由两部分构成: * GNSS观测数据: 来自各CORS站的双频接收机,包含RINEX格式的伪距和载波相位观测文件以及导航文件。使用双频观测可有效消除电离层延迟的影响。 * 气象数据: 从加纳气象局获取各站点附近的气象参数,包括气压(单位:hPa)、温度(单位:°C)和相对湿度(单位:%)。
2. ZTD真值获取(数据预处理与目标值计算): 这是构建监督学习模型的关键步骤。研究采用PRIDE PPPAR软件,基于精密单点定位模糊度固定(Precise Point Positioning with Ambiguity Resolution, PPPAR)方法,处理GNSS观测数据以估算高精度的ZTD值。处理策略包括使用IGS最终精密星历和钟差产品、采用Saastamoinen模型(配合气压修正)估计ZHD、利用气象数据估计ZWD、使用VMF3映射函数、进行潮汐改正和天线相位中心改正等。最终,软件以30秒的时间分辨率输出每个历元的ZTD值。为了获得每日的代表值,研究将所有历元(每日2880个)的ZTD值进行算术平均,得到日均ZTD,作为机器学习模型预测的目标变量(输出)。
3. 特征工程与数据集构建: 模型的输入变量(特征)包括两类: * 气象参数: 气压(P)、温度(T)、相对湿度(RH)。 * 地理空间特征: 测站纬度(φ)和椭球高(h)。 输出变量为日均ZTD(单位:米)。 为确保数据变异性一致并加速模型收敛,所有输入和输出数据均使用最小-最大值归一化方法缩放到[-1, 1]区间。 为评估模型在时间序列上的泛化能力,研究采用按时间顺序分割数据集的方法:2020年至2021年的数据(约占总数据70%)用于模型训练,2022年的数据(约占总数据30%)则单独用于模型测试。
4. 机器学习模型构建与训练: 本研究共构建并比较了五种机器学习模型: * Kolmogorov–Arnold网络(KAN): 基于Kolmogorov–Arnold表示定理,使用可学习的样条激活函数替代传统MLP中的固定线性权重和节点激活函数。本研究采用3层KAN结构,使用Adam优化器,以均方误差(MSE)为损失函数,训练1000个epoch。 * 长短期记忆网络(LSTM): 用于捕捉时间依赖性的循环神经网络变体。模型包含一个128神经元的LSTM层(采用最后输出模式),后接一个64神经元的全连接层,使用Swish激活函数,同样采用Adam优化器训练1000个epoch。 * 多层感知器神经网络(MLPNN): 经典的前馈神经网络。本研究采用3个隐藏层(神经元数分别为8、4、2),使用Levenberg–Marquardt反向传播算法进行训练,训练目标为1000 epoch或性能达到1e-7。 * 随机森林(RF): 集成学习方法。使用MATLAB的TreeBagger实现,构建了300棵决策树,采用均方误差作为分裂准则,并启用了袋外预测和代理分裂。 * 极端梯度提升(XGBoost): 梯度提升框架。使用Python实现,设置了300棵树,最大深度为5,学习率为0.05。
除XGBoost在Python中实现外,其余模型均在MATLAB R2024a环境中开发。
5. 模型性能评估: 采用三种标准统计指标在测试集上评估各模型的预测精度、一致性和解释力: * 均方根误差(Root Mean Square Error, RMSE): 反映预测误差的总体水平,对较大误差更敏感。 * 平均绝对误差(Mean Absolute Error, MAE): 反映预测误差的平均绝对大小,更直观。 * 决定系数(Coefficient of Determination, R²): 反映模型对目标变量方差的解释比例,越接近1说明拟合越好。
四、 主要研究结果
1. 模型预测的日变化趋势: 通过绘制2022年各站点观测ZTD与各模型预测ZTD的日变化序列图发现,所有模型均能较好地捕捉ZTD的时序变化模式,与观测值保持了较高的一致性。其中,KAN和LSTM模型在所有站点都表现出强大的泛化能力,能够有效跟踪高频波动和季节性趋势。集成模型XGBoost和RF也取得了具有竞争力的结果,但在大气变化剧烈的时段,其预测与观测值的吻合度略有下降。特别是在库马西站,由于大气变率更为显著,所有模型的预测精度均出现轻微下降,但KAN和LSTM仍保持了相对较好的性能。
2. 模型性能定量比较: 各模型在四个CORS站测试集上的性能指标汇总如下(数值为近似范围或典型值): * KAN模型: 表现最佳且最稳定。在所有四个站点,其测试RMSE均约为10毫米(10.0-10.2 mm),测试MAE约为8.1毫米,测试R²介于0.975至0.977之间。这表明KAN能够以极高的精度和一致性预测ZTD。 * LSTM与MLPNN模型: 性能仅次于KAN,且表现相当。测试RMSE在10.4至10.9毫米之间,测试R²平均值约为0.974。这验证了LSTM处理时序数据和MLPNN处理非线性回归问题的有效性。 * XGBoost模型: 性能稍逊于前三种神经网络模型。测试RMSE范围为11.6至12.1毫米,测试R²在0.966至0.970之间。结果表明,尽管XGBoost在处理结构化表格数据方面很强,但缺乏对ZTD这种时间依赖现象的原生建模机制。 * 随机森林模型: 在五种模型中表现最弱。其测试RMSE最高达到了19.6毫米(库马西站),测试R²最低降至0.902。这与其他文献中关于集成树模型在处理连续时间动态时泛化能力可能受限的观察一致。
3. 与现有文献的对比分析: 研究将本模型结果与以往文献中报道的多种ZTD/ZWD预测模型进行了对比。例如,有研究在65个南极站使用LSTM-RBF混合模型,RMSE范围为6.4-32.8毫米;在美国使用卷积LSTM模型进行6小时ZWD预报,RMSE约为11.5毫米;在欧洲使用Informer-LSTM混合模型预测ZTD,RMSE为19.1毫米;使用MLP模型在欧洲进行短期ZTD预测,RMSE为20-30毫米;使用XGBoost预测全球ZWD,RMSE为10.1-16.2毫米;使用随机森林预测全球ZWD,RMSE为24-31毫米。 对比显示,本研究中性能最佳的KAN模型(~10 mm RMSE)达到了与当前先进模型相当甚至更优的精度水平。更重要的是,KAN是在参数更少、结构更紧凑、且理论上更具可解释性的前提下实现这一性能的,这突显了其在资源有限或需要模型透明度的应用场景中的独特价值。
五、 研究结论与价值
本研究成功地将包括新型KAN在内的多种机器学习模型应用于加纳热带地区GNSS天顶对流层延迟的预测。主要结论如下:
研究的科学价值与应用价值: * 科学价值: 首次将新兴的、具有高可解释性潜力的Kolmogorov–Arnold网络引入GNSS气象学的ZTD预测任务,并通过严格的实验验证了其相对于多种成熟模型的优越性。这为地球物理领域复杂非线性现象的建模提供了一种新的、高效的神经网络工具选择。 * 应用价值: 研究结果表明,KAN等先进机器学习模型能够显著提升热带地区ZTD的预测精度,这对于改进该地区GNSS精密定位(如地质灾害监测、测绘工程)的精度至关重要。同时,高精度的ZTD数据也是反演大气可降水量、研究水汽循环和极端天气事件的重要输入,有助于提升热带地区的气象监测和天气预报能力。
六、 研究亮点
七、 其他有价值内容
研究在结论部分坦诚地指出了本工作的一个关键局限性:地理泛化能力的未知性。由于所有训练和验证数据均来自加纳(赤道低纬度地区),所开发的模型完全基于热带气候条件进行训练。因此,这些模型可能无法有效推广到气象动力学截然不同的其他区域,例如副热带高压区或副极地区。这提醒使用者,在将此类数据驱动的机器学习模型应用于新区域时,必须进行重新训练或严格的区域性验证。作者强调,机器学习应被视为强大的数值工具而非具有物理基础的科学模型,其预测严重依赖于训练数据的质量和代表性,在科学解释中需谨慎对待这一局限性。
此外,作者对未来研究方向提出了建议,例如考虑集成地表覆盖类型、植被指数等额外的空间元数据,以改进模型对局地陆-气相互作用的响应能力,特别是在非均质或半城市地形中。