全球海面风速反演的混合CNN-Transformer网络与加权MSE损失方法研究
作者及发表信息
本研究由加拿大纽芬兰纪念大学(Memorial University of Newfoundland)的Xin Qiao(IEEE学生会员)、南京信息工程大学的Qingyun Yan(IEEE会员)及纽芬兰纪念大学的Weimin Huang(IEEE高级会员)合作完成,发表于2025年的《IEEE Transactions on Geoscience and Remote Sensing》(卷63,文章编号4207013)。研究得到加拿大自然科学与工程研究理事会(NSERC)的资助。
学术背景
科学领域与问题背景
全球导航卫星系统反射测量技术(GNSS-R, Global Navigation Satellite System Reflectometry)是一种低成本、广覆盖且不受降水影响的海洋风速监测手段,其通过接收海面反射的GNSS信号生成延迟多普勒图(DDM, Delay-Doppler Map)来反演风速。传统方法依赖卷积神经网络(CNN),但CNN的固定卷积核限制了全局特征提取能力,且现有研究在数据分布不平衡(低风速过拟合、高风速低估)时表现不佳。
研究目标
本研究提出一种混合CNN-Transformer网络(CTN)结合加权均方误差(MSE, Mean Square Error)损失函数的方法,旨在:
1. 通过Transformer分支增强全局特征提取能力;
2. 设计加权MSE损失以缓解数据不平衡问题,提升高风速反演精度。
研究方法与流程
1. 混合CTN架构
- 局部特征提取:采用双分支CNN结构,包含两个卷积块(3×3卷积核+批归一化+ReLU激活函数),输出经平均池化降维。
- 全局特征提取:基于Transformer编码器,将DDM分割为不重叠的Patch嵌入,通过多头自注意力机制(MHSA, Multi-Head Self-Attention)捕获长程依赖关系。
- 特征融合模块:动态加权融合局部与全局特征,通过点卷积层(PWConv)和Sigmoid函数生成权重系数,避免简单相加或拼接的局限性。
2. 加权MSE损失函数
- 根据风速区间样本量动态分配权重:低风速(<15 m/s)权重0.1,高风速(≥15 m/s)权重0.9,以强化模型对稀疏高风速样本的学习。
3. 数据与实验设置
- 数据源:使用CYGNSS(Cyclone GNSS)L1 v3.1数据(2023年全年),以ECMWF ERA5再分析数据和NDBC浮标数据为基准。
- 预处理:剔除低质量样本(如信噪比SNR、散射面积无效等),按时间划分训练集(1-5月)、验证集(5-7月)和测试集(8-12月)。
- 评估指标:均方根误差(RMSD)、偏差(Bias)和相关系数(CC)。
主要结果
1. 特征提取与融合效果
- 消融实验:纯CNN模型(CTN-L)在全局风速上RMSD为1.447 m/s,而纯Transformer模型(CTN-G)为1.419 m/s,但CTN-L在高风速(>15 m/s)表现更优(RMSD 5.015 m/s vs. 5.102 m/s)。混合CTN融合两者优势,整体RMSD降至1.417 m/s,高风速RMSD为4.952 m/s。
- 特征融合模块:相比直接相加(CTN-add)或拼接(CTN-concat),专用融合模块将高风速RMSD进一步降低至4.952 m/s(提升1%)。
2. 加权MSE的贡献
- 高风速区间RMSD从4.952 m/s显著降至3.945 m/s(改进20.3%),偏差从-4.454 m/s改善至-3.119 m/s,验证了加权策略的有效性。
3. 对比实验
- 相较于MLP(MHL-NN)、CNN(CYGNSSNet)和纯Transformer(DDM-Former)模型,CTN在整体测试集上RMSD最低(1.417 m/s),且在高风速区间优于其他方法(如DDM-Former的RMSD为5.424 m/s)。
结论与价值
科学价值
1. 方法创新:首次将Transformer引入GNSS-R风速反演,解决了CNN的全局特征提取瓶颈;
2. 工程意义:加权MSE损失为不平衡数据建模提供了新思路,尤其适用于台风等极端天气监测。
应用前景
- 可集成至业务化天气预报系统,提升海上风电场运维和航海安全预警的精度。
研究亮点
1. 混合架构设计:CNN-Transformer双分支协同提取局部-全局特征,弥补了单一模型的局限性;
2. 动态加权损失:通过逆样本频率加权,显著提升高风速反演性能;
3. 多源数据验证:结合ERA5再分析数据和NDBC浮标实测数据,增强了结论的普适性。
未来方向
- 引入物理模型修正GNSS-R信号在高风速下的饱和效应;
- 探索数据增强技术生成合成高风速样本,进一步优化数据平衡性。
(全文约2000字)