
过去十年里,数值天气预报(NWP,Numerical Weather Prediction)模型的能力不断提升,无论是美国国家环境预报中心的 National Centers for Environmental Prediction GFS,还是欧洲的 European Centre for Medium-Range Weather Forecasts IFS,以及近年来兴起的AI全球模式,都已经能够较好地描述大尺度天气过程。然而,对于实际业务应用而言,用户真正关心的并不是模式场本身,而是最终落地到某个地点、某个风电场、某个光伏电站、某个机场或某个城市的天气结果。
现实中,即使是全球最先进的数值模式,依然存在系统性误差。例如:
因此,现代气象业务系统中,AI误差订正已经逐渐成为数值模式之后最重要的一环。
从商业价值角度看,一个优秀的AI订正系统带来的收益,往往远远大于将模式分辨率从9km提高到3km。
因为模式升级可能需要数十倍计算资源,而AI订正只需要少量GPU即可运行。
真正的商业气象系统几乎都会部署误差订正模块。
AI订正并不是重新做天气预报。
它的本质是学习:
模式预报值 → 实际观测值
之间的映射关系。
例如:
GFS预报:
对应观测:
AI学习到:
在当前天气背景下:
从而自动修正预报结果。
数学上可以表示为:
Observed = Forecast + Bias
AI实际上是在学习Bias。
完整架构一般包括:
GFS/ECMWF
│
▼
预报数据下载
│
▼
GRIB2解码
│
▼
特征工程
│
▼
AI订正模型
│
▼
后处理
│
▼
API服务
│
▼
WebGIS展示
商业系统通常采用:
模式层
↓
AI订正层
↓
行业应用层
例如:
ECMWF
↓
AI温度订正
↓
新能源功率预测
AI效果的上限取决于数据质量。
经验上:
70%工作量都在数据准备阶段。
需要保存历史模式预报。
例如:
2023-01-01 00Z
2023-01-01 12Z
...
2025-12-31 12Z
变量包括:
常见来源:
至少保留:
2~3年
历史数据。
必须有真实观测。
例如:
自动站:
温度
湿度
风速
风向
降水
来源:
观测质量直接决定模型效果。
这是很多项目失败的原因。
例如:
GFS 00Z
+24h
对应:
第二天00Z观测
不能匹配错误。
否则模型学到的是噪声。
误差订正最关键的部分之一。
很多项目失败不是模型不行。
而是特征太差。
模式原始值:
T2M
RH
U10
V10
Rain
Cloud
Month
Day
Hour
例如:
7月
14时
误差规律和:
1月
02时
完全不同。
站点:
纬度
经度
海拔
坡度
坡向
尤其山区非常重要。
使用DEM计算:
Elevation
Slope
Aspect
Terrain Ruggedness
很多温度偏差来自地形。
不要只使用站点最近格点。
建议:
5×5
9×9
13×13
邻域窗口。
例如:
T2M surrounding
Rain surrounding
这样可以学习天气系统结构。
推荐:
XGBoost
原因:
很多业务系统仍然采用:
XGBoost
作为主力模型。
输入:
100维特征
输出:
温度偏差
LightGBM
LightGBM
优点:
训练快
内存小
百万样本级别非常合适。
深度学习
例如:
输入
↓
Dense
↓
Dense
↓
Bias
适合站点订正。
适合时间序列。
输入:
过去7天
学习误差演变规律。
近年来效果较好。
输入:
模式序列
输出:
未来误差
很多单位已经不满足于站点订正。
而是直接订正整个二维天气场。
例如:
1000×1000
格点温度场。
推荐首选。
结构:
Encoder
↓
Bottleneck
↓
Decoder
输入:
GFS场
输出:
订正场
非常适合:
近年来主流方案。
特点:
很多AI气象论文采用类似结构。
降水是最难的变量。
因为:
90%时间不下雨
数据极不平衡。
分类+回归
第一步:
是否降水
第二步:
降水量
分级训练
例如:
0mm
0~10mm
10~25mm
25~50mm
50mm+
分别训练。
效果明显提升。
Quantile Loss
预测:
P10
P50
P90
形成概率预报。
现代业务越来越重视概率。
例如:
GFS Ensemble
31成员
ECMWF Ensemble
51成员
AI输入:
均值
标准差
极值
偏度
输出:
概率分布
可以生成:
降雨概率
大风概率
高温概率
不要只训练一次。
建议:
每天更新
例如:
最近2年数据
滚动训练。
分别训练:
春
夏
秋
冬
通常优于全年模型。
按气候区划分。
例如:
平原
山区
沿海
高原
分别训练。
效果显著提升。
生产系统建议:
Docker
+
FastAPI
+
Redis
+
PostgreSQL
架构。
数据流程:
定时下载GFS
↓
GRIB解析
↓
特征生成
↓
AI推理
↓
结果入库
↓
API服务
推理耗时:
XGBoost:
几十万站点
<1分钟
深度学习:
RTX4090
几秒到几十秒
即可完成全国尺度推理。
必须建立自动验证平台。
核心指标:
MAE
平均绝对误差
RMSE
均方根误差
Bias
系统偏差
TS
Threat Score
ETS
Equitable Threat Score
FAR
False Alarm Ratio
POD
Probability of Detection
MAE
RMSE
风向误差
每天自动生成:
模式原始结果
VS
AI订正结果
对比报告。
如果AI不能持续提升指标,就应停止上线。
如果目标是科研验证,一个简单的XGBoost系统已经足够。
如果目标是商业化运营,推荐按照以下路线迭代:
第一阶段:
GFS
+
XGBoost
+
站点订正
3个月内即可落地。
第二阶段:
ECMWF
+
LightGBM
+
集合预报
形成稳定业务产品。
第三阶段:
AI空间场订正
+
概率预报
+
新能源功率预测
进入行业应用层。
第四阶段:
多模式融合
(GFS+ECMWF+AI模式)
+
Transformer订正
+
实时在线学习
形成完整智能预报平台。
从工程实践角度看,AI误差订正并不是一个遥不可及的科研课题,而是目前最容易落地、投资回报率最高的气象AI方向之一。相比重新训练一个全球天气模型,误差订正所需的数据量、算力和研发投入都低得多,却往往能够带来10%~40%的预报误差改善。
对于一个中小团队而言,最现实的路径并不是直接研发新的天气大模型,而是围绕GFS、ECMWF以及新一代AI天气模式构建“模式预报→AI订正→行业决策”的业务链条。只要拥有持续积累的历史预报数据和高质量观测数据,配合成熟的机器学习框架,就完全有能力在数月内搭建出具备实际业务价值的AI天气预报误差订正系统,并进一步向新能源、电力调度、航空气象、保险气象和精细化城市服务等高价值场景延伸。
END
声明:欢迎转载、转发。气象学家转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。