本文由马志峰1、张浩1、刘劼2共同撰写,分别来自哈尔滨工业大学计算机科学与技术学院和哈尔滨工业大学(深圳)国际人工智能研究院。该综述论文发表于《计算机工程与科学》2023年10月第45卷第10期,题为《基于深度学习的短临降水预报综述》。论文系统性地回顾了深度学习在短临降水预报领域的应用,并展望了未来的研究方向。
短临降水预报是指对未来0~2小时内的降水进行高分辨率预测,是天气预报领域的重要任务之一。传统的数值天气预报(Numerical Weather Prediction, NWP)方法虽然在大尺度天气预报中表现良好,但在短临降水预报中存在计算成本高、预测精度低等问题。近年来,随着深度学习技术的快速发展,尤其是卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)的广泛应用,短临降水预报的研究取得了显著进展。本文将短临降水预报视为基于雷达回波图的时空序列预测问题,并详细探讨了相关模型、数据集、评估指标及损失函数。
首先,论文阐明了短临降水预报的重要性及其应用场景。短临降水预报不仅在航空、农业、海洋管理等领域具有重要应用,还在极端天气事件的预警中发挥着关键作用。传统的NWP方法虽然在大尺度天气预报中表现良好,但在短临预报中存在初始条件依赖性强、计算成本高等问题。相比之下,基于雷达回波图的光流法(Optical Flow Method)虽然计算效率高,但在短期预测中精度不足。深度学习技术的引入为解决这些问题提供了新的思路。
其次,论文给出了短临降水预报问题的数学定义。通常情况下,短临降水预报基于雷达回波图进行,雷达每隔5~7分钟扫描一次,生成一幅雷达回波图。给定一段连续的雷达回波序列,模型需要预测未来时刻的回波序列。论文将这一问题形式化为一个时空序列预测问题,并通过随机梯度下降算法(Stochastic Gradient Descent, SGD)来优化模型参数。
接着,论文全面总结了常见的短临降水预报模型,并将其分为确定性模型和随机生成模型两大类。确定性模型主要包括基于CNN的模型(如UNet)和基于RNN的模型(如ConvLSTM),以及两者的混合模型。随机生成模型则主要包括生成对抗网络(Generative Adversarial Network, GAN)和变分自编码器(Variational Auto-Encoder, VAE)及其混合模型。论文详细讨论了各类模型的优缺点,并指出确定性模型虽然在计算效率和预测精度上表现良好,但难以应对未来的不确定性;而随机生成模型通过生成多种可能的未来帧,能够更好地应对不确定性,但训练过程较为复杂且不稳定。
此外,论文还介绍了多个国家和地区的开源雷达数据集,包括HKO-7、DWD-12、Shanghai、Brazil等,并讨论了这些数据集的优缺点。这些数据集为短临降水预报研究提供了丰富的数据支持,但不同数据集在时间分辨率、空间覆盖范围等方面存在差异,研究者需要根据具体任务选择合适的数据集。
在评估指标方面,论文介绍了常用的度量指标,如均方误差(Mean Squared Error, MSE)、平均绝对误差(Mean Absolute Error, MAE)等,并讨论了这些指标在短临降水预报中的适用性。此外,论文还详细分析了不同模型中所使用的损失函数,如L1损失、L2损失、对抗损失(Adversarial Loss)等,并指出损失函数的选择对模型性能有重要影响。
最后,论文展望了短临降水预报未来的研究方向,包括多尺度模型、时空上下文模型、解耦模型、多模态模型以及迁移学习模型等。多尺度模型通过在不同尺度上提取特征,能够有效降低显存占用并提高预测精度;时空上下文模型通过捕捉时间和空间维度上的依赖关系,能够更好地建模复杂的时空动力学;解耦模型通过将高维数据分解为低维表示,简化了问题的复杂性;多模态模型通过融合多种数据源(如雷达、卫星、地面观测等),能够更全面地反映大气物理过程;迁移学习模型则通过将预训练模型的知识迁移到目标任务中,能够在小样本情况下获得较高的预测精度。
本文的贡献在于系统性地总结了短临降水预报领域的研究进展,并对相关模型、数据集、评估指标及损失函数进行了全面分析。论文不仅为研究者提供了丰富的研究资源,还为未来的研究指明了方向。短临降水预报作为一个跨学科的研究领域,涉及气象学、地理学、计算机视觉和人工智能等多个学科,本文的综述为该领域的进一步发展提供了重要的理论支持和实践指导。
本文通过详细的文献综述和系统性的分析,全面总结了深度学习在短临降水预报中的应用,并提出了未来的研究方向。论文的研究成果不仅具有重要的学术价值,还为实际应用中的短临降水预报提供了有力的技术支持。