关于高太阳活动期间基于CNN-GRU神经网络模型的GNSS-VTEC预测研究的学术报告
本研究报告基于2025年发表于《科学报告》(Scientific Reports)期刊的一篇学术论文,题为“gnss–vtec prediction based on cnn–gru neural network model during high solar activities”。该研究由来自南京信息工程大学近地空间环境特征与效应国家重点实验室以及天都-南信大深空探测实验室的研究团队完成,主要作者包括T. Y. Yang, J. Y. Lu(通讯作者),Y. Y. Yang, Y. H. Hao, M. Wang, J. Y. Li 和 G. C. Wei。
一、 研究的学术背景
本研究隶属于空间物理与空间天气学领域,具体聚焦于电离层物理与卫星导航技术交叉的实用性问题。电离层是地球上空60至1000公里高度被太阳辐射电离的区域,其中包含的大量自由电子会影响无线电波的传播。总电子含量(Total Electron Content, TEC)是表征电离层电离程度的一个关键物理参数,以TECU为单位(1 TECU = 10^16 电子/平方米)。全球导航卫星系统(Global Navigation Satellite System, GNSS)信号穿过电离层时会产生延迟,其大小与信号路径上的垂直总电子含量(GNSS-VTEC)直接相关。因此,准确预测VTEC对于提高卫星导航定位、授时精度以及保障短波通信系统正常运行具有重大的理论和实践意义。
长期以来,电离层TEC预测主要依赖经验模型(如国际参考电离层IRI模型、Nequick模型)和基于数学统计的非经验模型。然而,这些模型在高太阳活动期间,由于电离层变化剧烈且复杂,其预测性能往往显著下降。近年来,随着人工智能技术的发展,基于神经网络等机器学习方法的TEC预测模型展现出巨大潜力。但先前的研究大多集中在太阳活动相对较低的年份,针对高太阳活动时期的TEC预测研究仍然匮乏。高太阳活动期意味着太阳黑子数和F10.7指数升高,导致电离层电子密度增加,TEC值更大且变化更复杂,这使得预测任务极具挑战性。
基于上述背景,本研究旨在填补这一研究空白。研究团队选择在中国海南三亚(一个低纬度GNSS观测站)获取数据,目标是在高太阳活动期间,利用先进的神经网络模型实现对GNSS-VTEC的精确预测。他们特别关注门控循环单元(Gated Recurrent Unit, GRU)神经网络,因为已有研究表明在低太阳活动年份,GRU的表现优于长短期记忆网络(LSTM)和多层感知机(MLP)。为此,他们在GRU的基础上进行增强,构建了一个结合卷积神经网络(Convolutional Neural Network, CNN)和GRU的混合模型(CNN-GRU),以期利用CNN卓越的局部特征提取能力来进一步提升预测精度,并与支持向量机(SVM)、IRI-2020、Nequick2等模型进行性能对比。
二、 详细的研究工作流程
本研究工作流程严谨,涵盖了数据准备、模型构建、训练验证和综合评估等多个环节。
1. 数据获取与预处理: * 研究对象与数据源: 研究使用的GNSS-VTEC观测数据来源于位于中国海南三亚的一个GNSS-TEC与闪烁监测站(地理坐标:18.3°N, 109.6°E)。原始数据为来自GPS、北斗、伽利略、GLONASS等多个系统的斜向TEC(STEC)数据,时间跨度为2017年9月至2023年8月。 * 数据校准: 为了解决观测数据中可能存在的负值(夜间误差)和差分码偏差(DCB)等问题,研究采用了中国科学院(CAS)提供的全球电离层地图(GIM)对观测数据进行校准。具体方法是利用GIM数据确定夜间最小TEC,并与同日观测数据的最小TEC对齐,从而对观测数据进行标准化和校正,最终得到可靠的、时间分辨率为1小时的GNSS-VTEC数据。 * 特征参数选择: 为了训练模型,研究不仅使用了VTEC时间序列本身,还选取了影响电离层TEC的多种关键参数作为模型输入特征。这些参数包括: * 太阳活动参数: 太阳黑子数(SSN)、10.7厘米太阳射电流量(F10.7指数),这些数据来自NASA的OMNIWeb数据库。 * 地磁活动参数: Kp指数和Dst指数,同样来自OMNIWeb。 * 中性大气密度: 考虑到中性大气密度的变化会影响电离过程,研究引入了这一参数。由于直接观测数据稀缺,他们使用NRLMSIS 2.1大气模型,计算了测站上空500公里高度(基于电离层薄壳假设)的总质量密度。相关F10.7和Ap指数数据通过PyMSIS Python接口从Celestrak获取。 * 时间周期性成分: 为了表征TEC的日变化和年变化,研究将年积日(DOY)和世界时(Hour)转换成正弦和余弦分量(即Dns, Dnc, Hrs, Hrc),以便进行连续的数值趋势分析。 * 数据集划分: 用于模型训练和测试的数据具体为2018年至2022年(涵盖高太阳活动期,尤其是2022年)的完整数据用于训练,采用五折交叉验证进行验证;而2023年1月至8月的数据则用于最终测试,以评估模型在未知数据上的性能。
2. 模型构建与算法设计: * 基准与对比模型: 研究选择了多种模型进行对比,包括两个广泛使用的经验模型(IRI-2020和Nequick2),一个传统的机器学习模型(支持向量机SVM),以及两个神经网络模型(GRU和本研究提出的CNN-GRU)。 * CNN-GRU混合模型(核心创新): 这是本研究提出的新型预测模型。其结构框架包括输入层、两个一维卷积层(1D-CNN)、一个最大池化层、一个GRU层和一个全连接输出层。 * 输入: 模型输入包括VTEC时间序列以及前述的8个特征参数(KP, F10.7, SSN, Dns, Dnc, Hrs, Hrc, 中性大气密度),共9个特征。 * CNN部分: 两个一维卷积层负责从输入数据中提取局部特征。卷积操作通过多个滤波器捕捉数据中的短期模式、趋势和波动。使用ReLU作为激活函数。随后的最大池化层对特征图进行下采样,在保留关键信息的同时降低数据维度和计算复杂度,并增强模型的平移不变性和鲁棒性。 * GRU部分: 经CNN提取和池化后的特征序列被送入GRU层。GRU通过其内部的更新门和重置门机制,专门用于捕捉和记忆时间序列中的长期依赖关系。 * 输出: 最后,全连接层将GRU输出的特征向量映射为最终的VTEC预测值。 * 模型实现与评估指标: 研究使用了一系列统计学指标来全面评估模型的预测性能,包括均方根误差(RMSE)、预测效率(PE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和决定系数(R²)。这些指标分别从误差幅度、拟合优度、偏差比例等多个角度量化模型预测值与实际观测值之间的差异。
3. 实验与评估流程: * 预测任务设置: 研究主要进行了两种预测:1小时提前预测和长达24小时的滚动预测,以检验模型的短期和中期预报能力。 * 系统性对比分析: 研究不仅比较了各模型在整体测试集上的平均性能,还深入分析了模型性能在不同维度上的表现: * 时序维度: 分析不同预测提前时间(1-24小时)下各模型RMSE的变化趋势。 * 日变化维度: 比较各模型在不同世界时(一天24小时)内的预测TEC值和RMSE。 * 月变化维度: 比较各模型在不同月份(1月至8月)的预测性能和误差。 * 空间天气事件维度: 专门选取了发生在测试期间的小型、中型和极端地磁暴事件,详细对比各模型在这些扰动条件下的预测表现和响应能力。
三、 主要研究结果
研究结果通过系统的图表和数据分析,清晰地展示了所提CNN-GRU模型的优越性。
1. 整体预测性能对比(1小时提前预测): 在测试集(2023年1-8月)上,五个模型的性能呈现出明显梯度。两个经验模型表现最差:IRI-2020的RMSE为9.38 TECU,Nequick2为12.12 TECU。三个机器学习模型显著优于经验模型,其中SVM的RMSE为5.16 TECU。两个神经网络模型表现更佳,基础GRU模型的RMSE为4.51 TECU,而CNN-GRU混合模型取得了最佳性能,RMSE最低,为4.28 TECU。在其他指标上,CNN-GRU同样领先(MAE:3.19 TECU, PE:0.84, MAPE:8.69%, R²:0.97)。残差分布图显示,CNN-GRU的预测误差分布更集中,接近正态分布,且平均绝对偏差最小。
2. 多步长预测性能: 在长达24小时的滚动预测中,所有模型的RMSE都随预测提前时间的增加而上升,并在约9小时后增长趋缓。在整个24小时预测范围内,CNN-GRU始终保持最低的平均RMSE(6.94 TECU),优于GRU(7.50 TECU)和SVM(7.72 TECU)。特别是在5-6小时提前预测时,CNN-GRU相对于其他两个模型的优势尤为明显。
3. 日变化与月变化分析: * 日变化: 观测TEC在白天(约12:00-18:00 UT)出现峰值。Nequick2模型在白天严重高估TEC值,IRI-2020也存在高估。三个机器学习模型都能较好地捕捉日变化趋势。误差分析显示,所有模型的RMSE在白天较高,呈现“双峰”结构(峰值约在10:00和13:00),这与电离层中午“咬蚀”和午后增强等复杂物理现象有关,增加了预测难度。CNN-GRU在全天各时次的误差整体上最为稳定且较低。 * 月变化: 观测TEC在3月达到最大值,7月为最小值。CNN-GRU、GRU和SVM都成功捕捉到了这一季节性特征。而Nequick2未能表现出正确的月变化趋势,IRI-2020虽然趋势接近,但峰值出现时间滞后一个月,且在3、4月的预测值明显偏低。在月度误差方面,CNN-GRU的RMSE相对较低且变化更为稳定。
4. 地磁扰动期间的预测性能(关键检验): 这是检验模型鲁棒性和实用性的重要环节。研究选取了2023年发生的三次地磁暴事件进行案例分析。 * 小型磁暴(2023年2月21-26日): 在此期间,IRI-2020和Nequick2的预测值与观测值偏差较大。三个机器学习模型的表现远优于经验模型,其中CNN-GRU的RMSE最低(4.45 TECU),优于GRU(5.07 TECU)和SVM(5.35 TECU)。CNN-GRU的预测曲线与观测值贴合最紧密。 * 中型磁暴(2023年8月3-8日): Nequick2对地磁活动响应不足,预测值持续偏高,RMSE达10.50 TECU。IRI-2020的RMSE为9.26 TECU。而三个机器学习模型均能对磁暴引起的TEC下降做出响应,其中CNN-GRU表现最佳(RMSE=3.69 TECU),GRU次之(3.72 TECU),SVM稍差(4.61 TECU)。 * 极端磁暴(2023年4月23-24日): 在此强烈扰动下,经验模型的预测严重偏离,RMSE很高(IRI-2020:11.96 TECU, Nequick2:13.51 TECU)。机器学习模型的预测性能也有所下降,但相对好很多(CNN-GRU:5.23 TECU, GRU:5.79 TECU, SVM:5.36 TECU)。在磁暴发生前,模型能较好地预测“中午咬蚀”和“日落增强”现象;在磁暴发生时,模型对TEC的急剧下降有一定响应,但预测精度有损失,其中CNN-GRU的表现相对最好。
这些结果层层递进,从整体到细节,从平静条件到极端事件,充分验证了CNN-GRU模型在高太阳活动时期预测VTEC的准确性、稳定性和鲁棒性。结果直接支撑了论文的核心结论,即所提出的混合模型显著优于现有的主流经验模型和单一神经网络模型。
四、 研究结论与价值
本研究的核心结论是:针对高太阳活动期间的电离层VTEC预测,所构建的CNN-GRU混合神经网络模型表现出卓越的性能。该模型不仅显著超越了IRI-2020和Nequick2等传统经验模型,也优于支持向量机(SVM)和标准的GRU神经网络模型。CNN层有效提取了输入数据的局部特征和空间模式,GRU层则很好地建模了时间序列的长期依赖关系,两者结合使模型能够更精准地捕捉电离层TEC复杂的时空变化特性,即使在具有挑战性的地磁暴期间也能保持相对稳定和优秀的预测能力。
这项研究的价值体现在多个层面: * 科学价值: 它成功地将深度学习中的特征提取(CNN)与序列建模(GRU)技术有机结合,为电离层这种高度非线性、受多种因素驱动的复杂系统的建模提供了新的、有效的解决方案。研究证实了在高太阳活动这一困难场景下,数据驱动的人工智能方法相比基于物理或统计的经验模型具有明显优势。 * 应用价值: 精确的VTEC预测可直接用于提升GNSS单频接收机的电离层延迟改正精度,对于卫星导航、定位、授时服务具有重要的实际意义。尤其是在空间天气事件(如地磁暴)期间,能够提供更可靠的电离层修正信息,有助于保障航空、航天、通信等关键基础设施的稳定运行。研究选取中国低纬度站点的数据,其结果对改善中国及周边区域的电离层建模和空间天气服务具有参考价值。 * 方法论贡献: 研究提供了一套完整的工作流程,包括数据预处理(GIM校准、多源特征融合)、混合模型构建、以及多维度的系统性评估方法,为后续相关研究提供了可借鉴的范例。
五、 研究亮点
六、 其他有价值的内容
论文最后指出了当前研究的局限性,主要是受限于可用观测数据的时间长度(2017-2023年),这可能影响模型的泛化能力并带来过拟合风险。作者展望未来,随着观测数据的持续积累,尤其是在高太阳活动年份的数据增加,模型的训练和性能有望得到进一步改善。同时,作者也提出了未来的研究方向,包括收集不同纬度站点的数据以构建更具普适性的模型,以及尝试对区域TEC进行建模和预测,从而助力人工智能模型对特殊电离层状态的识别与预报。这些思考为该领域的后续工作指明了有价值的路径。