首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI预报追上物理模式?ECMWF首次官方后处理对比给出答案

AI预报追上物理模式?ECMWF首次官方后处理对比给出答案

作者头像
气象学家
发布2026-06-08 14:50:56
发布2026-06-08 14:50:56
160
举报
文章被收录于专栏:气象学家气象学家

气象学家

AI与物理天气预报的对比研究:ECMWF IFS与AIFS-CRPS 10米风速集合预报的系统评估

https://arxiv.org/pdf/2606.02508
https://arxiv.org/pdf/2606.02508

https://arxiv.org/pdf/2606.02508

Figure 1: Location of SYNOP stations
Figure 1: Location of SYNOP stations

Figure 1: Location of SYNOP stations


研究背景与动机

近年来,人工智能驱动的气象预报模型迅速崛起,以华为盘古天气、Google DeepMind GraphCast、NVIDIA FourCastNet等为代表的数据驱动模型,在确定性预报中已展现出与欧洲中期天气预报中心(ECMWF)物理模式IFS相当的预报技巧,且计算成本极低。面对这一挑战,ECMWF率先开发了人工智能预报系统(AIFS),其确定性版本(AIFS Single)于2025年2月投入业务运行,而51成员的集合概率版本(AIFS-CRPS)于2025年7月正式上线,与被视为"黄金标准"的物理模式IFS并行运行。

AIFS的核心优势在于速度——其预报生成速度比传统数值预报快约十倍,能耗降低约千倍。然而,数据驱动模型能否真正替代物理模式,仍需严格的系统性评估。本文正是基于这一背景,首次对AIFS-CRPS集合预报的后处理效果进行深入研究,填补了该领域的空白。


数据与方法

评估数据

研究选取2025年7月1日至11月30日(共153天)的业务预报数据,覆盖全球9246个SYNOP地面观测站。对比对象包括:

  • IFS集合预报:CY49R1版本,51成员,水平分辨率约9km(TCO1279),137个垂直模式层
  • AIFS-CRPS集合预报:AIFS ENS v1版本,50成员,水平分辨率约30km,13个垂直模式层

所有预报均为12UTC起报,预报时效覆盖24小时至360小时(15天),每24小时一个时效点。观测数据为10分钟平均的10米风速。质量控制后,仅保留缺测率不超过5%的站点。

后处理方法

研究采用两种经典的后处理技术进行集合校准:

截断正态分布EMOS(参数化方法)

基于Thorarinsdottir和Gneiting(2010)的方法,假设预测分布为左截断于零的正态分布,位置参数μ和尺度参数σ通过集合均值和方差的线性函数表达:

  • μ = a + b²·f̄
  • σ² = c² + d²·S²

参数通过最小化连续分级概率评分(CRPS)进行估计,采用60天滑动训练窗口和局部训练策略(每个站点独立建模)。

非交叉分位数回归QR(非参数化方法)

参考Bremnes(2019)的方法,对风速的对数变换值进行建模,以集合的10%、50%、90%分位数为预测变量,采用三次样条函数。通过引入非交叉约束和L2惩罚项避免分位数交叉和过拟合。由于参数较多,采用基于k-means的半局部训练策略(100个聚类)。

验证指标
  • CRPS:连续分级概率评分,衡量概率预报的整体准确性
  • MAE:平均绝对误差,评估中位数点预报精度
  • QSS/CRPSS/MAES:相对于气候态预报的技巧评分
  • 可靠性指数(RI):基于Talagrand图量化集合离散度
  • 覆盖率与区间宽度:评估概率预报的校准性与锐度

核心结果

原始预报:IFS显著优于AIFS

在未经过后处理的情况下,IFS的预报技巧全面压倒AIFS-CRPS:

  • CRPS:IFS的原始集合预报在所有预报时效上均显著优于AIFS,优势几乎恒定(图2a)
  • MAE:IFS中位数预报的误差同样显著更低(图3a)
  • 离散度:两者均存在明显的欠离散问题(U型Talagrand图),但IFS的可靠性指数(RI)始终优于AIFS(图7)

值得注意的是,两者的原始集合预报在短时效甚至不如气候态预报,这与Baran等人(2021)在欧洲和亚洲的研究发现一致。

后处理后的戏剧性转变

后处理彻底改变了竞争格局:

整体技巧提升

EMOS和QR两种方法均显著降低了CRPS和MAE,使后处理预报在11天时效内均显著优于气候态(图2b、3b)。对于短时效(1-4天),EMOS表现优于QR;但随着时效延长,两者差距缩小。

IFS与AIFS的差距大幅缩小

这是本文最关键的发现有图4显示:

  • 原始AIFS相对于IFS的CRPSS约为-4%,MAES约为-3%
  • 经过EMOS或QR后处理后,两者差距急剧缩小至约-2%以内
  • 在5-12天时效区间,后处理的AIFS与IFS差异不再显著
  • 仅在短时效(1-4天)和个别长时效(14-15天),IFS仍保持微弱但显著的优势

分位数层面的差异

图5和图6展示了不同分位数的技巧评分:

  • 低分位数(5%、10%):QR显著优于EMOS,AIFS的QR后处理甚至在部分时效追平IFS
  • 中高分位数(75%、90%、95%):EMOS在短时效占优,但QR在长时效反超
  • 极端分位数:后处理后的AIFS在95%分位数上表现尤为突出,与IFS的差异在多数时效不显著

校准性与锐度

图8显示,后处理显著改善了原始集合的欠离散问题:

  • 原始IFS和AIFS的覆盖率随时效增加而上升(因离散度增大),但始终低于理想的96.08%
  • 后处理后的覆盖率稳定在85%左右,且IFS与AIFS几乎无差异
  • 原始IFS在10天后的区间宽度甚至超过气候态,说明其过度保守;后处理则恢复了合理的锐度

空间分布特征

附录中的空间分析(图9、表1)揭示了一个复杂图景:

  • 北半球中高纬(20°N-90°N):原始IFS占优的站点比例最高(约35%),后处理后差距大幅缩小;QR后处理的IFS在短时效仍占优,但AIFS在部分时效反超
  • 南半球中高纬(20°S-90°S):后处理后AIFS的EMOS和QR甚至在部分时效占优
  • 热带地区(20°S-20°N):后处理的AIFS表现优于IFS,这与Lang等人(2026)的纬度分层结果形成有趣对比

总体而言,不存在稳定的空间模式表明某一类预报系统持续占优。超过70%的站点在后处理后IFS与AIFS的差异不显著。


讨论与启示

分辨率差异的影响

IFS(9km)与AIFS(30km)的水平分辨率差异可能是原始预报技巧差距的部分原因。然而,经过后处理后,这一差距几乎被抹平,说明:

  1. 统计后处理能够有效补偿模式分辨率带来的信息损失
  2. AIFS在低分辨率下学到的统计关系,经过校准后足以支撑高质量的概率预报
  3. 对于业务应用而言,后处理是弥合AI模式与物理模式差距的关键桥梁
后处理方法的权衡

EMOS与QR的对比体现了参数化与非参数化方法的经典权衡:

  • EMOS:参数少,支持局部训练,短时效表现更优,但假设截断正态分布可能限制极端值预报
  • QR:灵活性强,无需分布假设,低分位数和极端事件预报更优,但需要半局部训练,计算成本更高
对未来研究的展望

作者指出本研究的局限性并指明方向:

  • 时间覆盖:仅5个月数据,未涵盖完整季节循环,需更长期评估
  • 变量拓展:需验证100米风速、太阳辐射等新能源关键变量,以及体感温度、风灾指数等衍生产品
  • 先进方法:可尝试深度学习后处理(如DRN、非交叉分位数回归神经网络),利用更多预测变量和时空信息
  • 模式升级:2026年5月IFS升级至Cycle 50r1、AIFS ENS升级至v2,新版本对比亟待开展

结语

这项研究以严谨的数据和系统的方法,首次量化了AIFS-CRPS集合预报在后处理条件下的真实表现。核心结论清晰而有力:未经后处理的AI预报仍逊于物理模式,但经过适当的后处理校准,AI与物理模式的差距已缩小至业务可接受的范围内。这并非宣告AI预报的"胜利",而是揭示了"AI+统计后处理"组合路径的可行性。

对于气象业务机构而言,这一发现具有重要实践意义:在计算资源受限或需要快速响应的场景下,经过后处理的AIFS预报可作为IFS的有效补充甚至替代。而对于AI气象模型的开发者,研究则提示——原始预报技巧并非唯一标尺,如何设计原生支持概率校准的AI架构,可能是下一代模型的突破方向。


本文解读如有偏差欢迎联系小编,感谢!

END

声明:欢迎转载、转发。气象学家转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 气象学家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • AI与物理天气预报的对比研究:ECMWF IFS与AIFS-CRPS 10米风速集合预报的系统评估
    • 研究背景与动机
    • 数据与方法
    • 核心结果
    • 空间分布特征
    • 讨论与启示
    • 结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档