AI预报追上物理模式？ECMWF首次官方后处理对比给出答案

气象学家

发布于 2026-06-08 14:50:56

160

文章被收录于专栏：气象学家气象学家

气象学家

AI与物理天气预报的对比研究：ECMWF IFS与AIFS-CRPS 10米风速集合预报的系统评估

https://arxiv.org/pdf/2606.02508

Figure 1: Location of SYNOP stations

研究背景与动机

近年来，人工智能驱动的气象预报模型迅速崛起，以华为盘古天气、Google DeepMind GraphCast、NVIDIA FourCastNet等为代表的数据驱动模型，在确定性预报中已展现出与欧洲中期天气预报中心（ECMWF）物理模式IFS相当的预报技巧，且计算成本极低。面对这一挑战，ECMWF率先开发了人工智能预报系统（AIFS），其确定性版本（AIFS Single）于2025年2月投入业务运行，而51成员的集合概率版本（AIFS-CRPS）于2025年7月正式上线，与被视为"黄金标准"的物理模式IFS并行运行。

AIFS的核心优势在于速度——其预报生成速度比传统数值预报快约十倍，能耗降低约千倍。然而，数据驱动模型能否真正替代物理模式，仍需严格的系统性评估。本文正是基于这一背景，首次对AIFS-CRPS集合预报的后处理效果进行深入研究，填补了该领域的空白。

数据与方法

评估数据

研究选取2025年7月1日至11月30日（共153天）的业务预报数据，覆盖全球9246个SYNOP地面观测站。对比对象包括：

IFS集合预报：CY49R1版本，51成员，水平分辨率约9km（TCO1279），137个垂直模式层
AIFS-CRPS集合预报：AIFS ENS v1版本，50成员，水平分辨率约30km，13个垂直模式层

所有预报均为12UTC起报，预报时效覆盖24小时至360小时（15天），每24小时一个时效点。观测数据为10分钟平均的10米风速。质量控制后，仅保留缺测率不超过5%的站点。

后处理方法

研究采用两种经典的后处理技术进行集合校准：

截断正态分布EMOS（参数化方法）

基于Thorarinsdottir和Gneiting（2010）的方法，假设预测分布为左截断于零的正态分布，位置参数μ和尺度参数σ通过集合均值和方差的线性函数表达：

μ = a + b²·f̄
σ² = c² + d²·S²

参数通过最小化连续分级概率评分（CRPS）进行估计，采用60天滑动训练窗口和局部训练策略（每个站点独立建模）。

非交叉分位数回归QR（非参数化方法）

参考Bremnes（2019）的方法，对风速的对数变换值进行建模，以集合的10%、50%、90%分位数为预测变量，采用三次样条函数。通过引入非交叉约束和L2惩罚项避免分位数交叉和过拟合。由于参数较多，采用基于k-means的半局部训练策略（100个聚类）。

验证指标

CRPS：连续分级概率评分，衡量概率预报的整体准确性
MAE：平均绝对误差，评估中位数点预报精度
QSS/CRPSS/MAES：相对于气候态预报的技巧评分
可靠性指数（RI）：基于Talagrand图量化集合离散度
覆盖率与区间宽度：评估概率预报的校准性与锐度

核心结果

原始预报：IFS显著优于AIFS

在未经过后处理的情况下，IFS的预报技巧全面压倒AIFS-CRPS：

CRPS：IFS的原始集合预报在所有预报时效上均显著优于AIFS，优势几乎恒定（图2a）
MAE：IFS中位数预报的误差同样显著更低（图3a）
离散度：两者均存在明显的欠离散问题（U型Talagrand图），但IFS的可靠性指数（RI）始终优于AIFS（图7）

值得注意的是，两者的原始集合预报在短时效甚至不如气候态预报，这与Baran等人（2021）在欧洲和亚洲的研究发现一致。

后处理后的戏剧性转变

后处理彻底改变了竞争格局：

整体技巧提升

EMOS和QR两种方法均显著降低了CRPS和MAE，使后处理预报在11天时效内均显著优于气候态（图2b、3b）。对于短时效（1-4天），EMOS表现优于QR；但随着时效延长，两者差距缩小。

IFS与AIFS的差距大幅缩小

这是本文最关键的发现有图4显示：

原始AIFS相对于IFS的CRPSS约为-4%，MAES约为-3%
经过EMOS或QR后处理后，两者差距急剧缩小至约-2%以内
在5-12天时效区间，后处理的AIFS与IFS差异不再显著
仅在短时效（1-4天）和个别长时效（14-15天），IFS仍保持微弱但显著的优势

分位数层面的差异

图5和图6展示了不同分位数的技巧评分：

低分位数（5%、10%）：QR显著优于EMOS，AIFS的QR后处理甚至在部分时效追平IFS
中高分位数（75%、90%、95%）：EMOS在短时效占优，但QR在长时效反超
极端分位数：后处理后的AIFS在95%分位数上表现尤为突出，与IFS的差异在多数时效不显著

校准性与锐度

图8显示，后处理显著改善了原始集合的欠离散问题：

原始IFS和AIFS的覆盖率随时效增加而上升（因离散度增大），但始终低于理想的96.08%
后处理后的覆盖率稳定在85%左右，且IFS与AIFS几乎无差异
原始IFS在10天后的区间宽度甚至超过气候态，说明其过度保守；后处理则恢复了合理的锐度

空间分布特征

附录中的空间分析（图9、表1）揭示了一个复杂图景：

北半球中高纬（20°N-90°N）：原始IFS占优的站点比例最高（约35%），后处理后差距大幅缩小；QR后处理的IFS在短时效仍占优，但AIFS在部分时效反超
南半球中高纬（20°S-90°S）：后处理后AIFS的EMOS和QR甚至在部分时效占优
热带地区（20°S-20°N）：后处理的AIFS表现优于IFS，这与Lang等人（2026）的纬度分层结果形成有趣对比

总体而言，不存在稳定的空间模式表明某一类预报系统持续占优。超过70%的站点在后处理后IFS与AIFS的差异不显著。

讨论与启示

分辨率差异的影响

IFS（9km）与AIFS（30km）的水平分辨率差异可能是原始预报技巧差距的部分原因。然而，经过后处理后，这一差距几乎被抹平，说明：

统计后处理能够有效补偿模式分辨率带来的信息损失
AIFS在低分辨率下学到的统计关系，经过校准后足以支撑高质量的概率预报
对于业务应用而言，后处理是弥合AI模式与物理模式差距的关键桥梁

后处理方法的权衡

EMOS与QR的对比体现了参数化与非参数化方法的经典权衡：

EMOS：参数少，支持局部训练，短时效表现更优，但假设截断正态分布可能限制极端值预报
QR：灵活性强，无需分布假设，低分位数和极端事件预报更优，但需要半局部训练，计算成本更高

对未来研究的展望

作者指出本研究的局限性并指明方向：

时间覆盖：仅5个月数据，未涵盖完整季节循环，需更长期评估
变量拓展：需验证100米风速、太阳辐射等新能源关键变量，以及体感温度、风灾指数等衍生产品
先进方法：可尝试深度学习后处理（如DRN、非交叉分位数回归神经网络），利用更多预测变量和时空信息
模式升级：2026年5月IFS升级至Cycle 50r1、AIFS ENS升级至v2，新版本对比亟待开展

结语

这项研究以严谨的数据和系统的方法，首次量化了AIFS-CRPS集合预报在后处理条件下的真实表现。核心结论清晰而有力：未经后处理的AI预报仍逊于物理模式，但经过适当的后处理校准，AI与物理模式的差距已缩小至业务可接受的范围内。这并非宣告AI预报的"胜利"，而是揭示了"AI+统计后处理"组合路径的可行性。

对于气象业务机构而言，这一发现具有重要实践意义：在计算资源受限或需要快速响应的场景下，经过后处理的AIFS预报可作为IFS的有效补充甚至替代。而对于AI气象模型的开发者，研究则提示——原始预报技巧并非唯一标尺，如何设计原生支持概率校准的AI架构，可能是下一代模型的突破方向。

本文解读如有偏差欢迎联系小编，感谢！

END

声明：欢迎转载、转发。气象学家转载信息旨在传播交流，其内容由作者负责，不代表本号观点。文中部分图片来源于网络，如涉及内容、版权和其他问题，请联系小编处理。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-07，如有侵权请联系 cloudcommunity@tencent.com 删除

变量