气象学家

https://arxiv.org/pdf/2606.02508

Figure 1: Location of SYNOP stations

近年来,人工智能驱动的气象预报模型迅速崛起,以华为盘古天气、Google DeepMind GraphCast、NVIDIA FourCastNet等为代表的数据驱动模型,在确定性预报中已展现出与欧洲中期天气预报中心(ECMWF)物理模式IFS相当的预报技巧,且计算成本极低。面对这一挑战,ECMWF率先开发了人工智能预报系统(AIFS),其确定性版本(AIFS Single)于2025年2月投入业务运行,而51成员的集合概率版本(AIFS-CRPS)于2025年7月正式上线,与被视为"黄金标准"的物理模式IFS并行运行。
AIFS的核心优势在于速度——其预报生成速度比传统数值预报快约十倍,能耗降低约千倍。然而,数据驱动模型能否真正替代物理模式,仍需严格的系统性评估。本文正是基于这一背景,首次对AIFS-CRPS集合预报的后处理效果进行深入研究,填补了该领域的空白。
研究选取2025年7月1日至11月30日(共153天)的业务预报数据,覆盖全球9246个SYNOP地面观测站。对比对象包括:
所有预报均为12UTC起报,预报时效覆盖24小时至360小时(15天),每24小时一个时效点。观测数据为10分钟平均的10米风速。质量控制后,仅保留缺测率不超过5%的站点。
研究采用两种经典的后处理技术进行集合校准:
截断正态分布EMOS(参数化方法)
基于Thorarinsdottir和Gneiting(2010)的方法,假设预测分布为左截断于零的正态分布,位置参数μ和尺度参数σ通过集合均值和方差的线性函数表达:
参数通过最小化连续分级概率评分(CRPS)进行估计,采用60天滑动训练窗口和局部训练策略(每个站点独立建模)。
非交叉分位数回归QR(非参数化方法)
参考Bremnes(2019)的方法,对风速的对数变换值进行建模,以集合的10%、50%、90%分位数为预测变量,采用三次样条函数。通过引入非交叉约束和L2惩罚项避免分位数交叉和过拟合。由于参数较多,采用基于k-means的半局部训练策略(100个聚类)。
在未经过后处理的情况下,IFS的预报技巧全面压倒AIFS-CRPS:
值得注意的是,两者的原始集合预报在短时效甚至不如气候态预报,这与Baran等人(2021)在欧洲和亚洲的研究发现一致。
后处理彻底改变了竞争格局:
整体技巧提升
EMOS和QR两种方法均显著降低了CRPS和MAE,使后处理预报在11天时效内均显著优于气候态(图2b、3b)。对于短时效(1-4天),EMOS表现优于QR;但随着时效延长,两者差距缩小。
IFS与AIFS的差距大幅缩小
这是本文最关键的发现有图4显示:
分位数层面的差异
图5和图6展示了不同分位数的技巧评分:
校准性与锐度
图8显示,后处理显著改善了原始集合的欠离散问题:
附录中的空间分析(图9、表1)揭示了一个复杂图景:
总体而言,不存在稳定的空间模式表明某一类预报系统持续占优。超过70%的站点在后处理后IFS与AIFS的差异不显著。
IFS(9km)与AIFS(30km)的水平分辨率差异可能是原始预报技巧差距的部分原因。然而,经过后处理后,这一差距几乎被抹平,说明:
EMOS与QR的对比体现了参数化与非参数化方法的经典权衡:
作者指出本研究的局限性并指明方向:
这项研究以严谨的数据和系统的方法,首次量化了AIFS-CRPS集合预报在后处理条件下的真实表现。核心结论清晰而有力:未经后处理的AI预报仍逊于物理模式,但经过适当的后处理校准,AI与物理模式的差距已缩小至业务可接受的范围内。这并非宣告AI预报的"胜利",而是揭示了"AI+统计后处理"组合路径的可行性。
对于气象业务机构而言,这一发现具有重要实践意义:在计算资源受限或需要快速响应的场景下,经过后处理的AIFS预报可作为IFS的有效补充甚至替代。而对于AI气象模型的开发者,研究则提示——原始预报技巧并非唯一标尺,如何设计原生支持概率校准的AI架构,可能是下一代模型的突破方向。
本文解读如有偏差欢迎联系小编,感谢!
END
声明:欢迎转载、转发。气象学家转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。