FourCastNet 3(FCN3)是 NVIDIA Earth-2 中最新的 AI 全球天气预报系统。FCN3 首次完美地结合了概率预测能力、计算效率、频谱保真度、集合校准和次季节时间尺度上的稳定性。其中期预报精度与 GenCast 等领先的机器学习模型相当,超过了欧洲中期天气预报中心集合预报系统(IFS-ENS)等传统数值天气预报系统。
在单个 NVIDIA Hopper Tensor Core GPU 上,以 0.25° 空间分辨率和 6 小时时间分辨率运行一次 60 天的 FCN3 预测仅需不到 4 分钟,速度比 GenCast 快 8 倍,比 IFS-ENS 快 60 倍。
该系统还具有出色的校准能力和频谱保真度,即使在 60 天的延长预测期内,集合成员仍能保持真实的频谱特性。FCN3 标志着大型集合数据驱动天气预报实现了从中期到次季节尺度的重大飞跃。
FCN3 架构
FourCastNet 3 采用完全卷积的球面神经算子架构,基于球面信号处理基元。与基于球面傅里叶神经算子的 FourCastNet 2 不同,FCN3 同时使用局部球面卷积和谱卷积。
这些卷积通过 Morlet 小波进行参数化,并在离散-连续群卷积框架中构建。该方法可生成各向异性的局部滤波器,能精确捕捉局部大气现象,同时通过 NVIDIA CUDA 中的自定义实现保证计算效率。
FCN3 通过一个潜在噪声变量在每个预测步骤引入随机性,该变量的演化由球面上的扩散过程控制。这种隐马尔可夫模型的设计能够高效地一步生成集合成员,相比基于扩散模型的方法,这是一大关键优势。FCN3 作为一个集合进行联合训练,最小化一个复合损失函数,该函数结合了空间和谱域中的连续分级概率评分(CRPS)。这种方法确保了 FCN3 能够学习底层随机大气过程中正确的空间相关性。
扩展机器学习模型对于获得有竞争力的预测能力通常至关重要,但扩展的效应在数据驱动的天气模型中尚未得到充分研究。FCN3 在计算规模上树立了新标杆,借鉴传统数值天气建模中的区域分解,我们引入了一种新颖的模型并行范式。
该方法通过将模型拆分到多个设备上,不仅能在训练期间将更大的模型装入显存,还降低了每个设备的磁盘 I/O。为此,卷积等空间操作使用 NVIDIA 集合通信库(NCCL)以分布式方式实现。利用该技术,FCN3 在多达 1024 个 GPU 上进行了训练,同时采用区域、批次和集合并行。
FourCastNet 3 的预测能力超越最好的基于物理的集合模型 IFS-ENS,并与 Gencast 相当。在单个 NVIDIA Hopper Tensor GPU 上,FCN3 在一分钟内即可生成时间分辨率为 6 小时、空间分辨率为 0.25° 的 15 天预测,速度比 Gencast 快 8 倍,比 IFS-ENS 快 60 倍。
FourCastNet 3 的概率集合展示的离散度-技巧比始终接近 1,这表明预测校准良好,预测的不确定性与观测到的大气变率高度吻合。排序直方图和其他诊断结果证实,集合成员可与真实观测互换,证实了 FCN3 预测的可靠性和可信度。
最关键的是,FCN3 保留了所有尺度的大气频谱特征,即使在长达 60 天的延长预测期内,也能精确再现能量级联和真实天气模式的清晰度。与许多随时间推移会模糊高频特征或退化为噪声伪影的机器学习模型不同,FCN3 保持了稳定、物理真实的频谱,能够在次季节范围内提供准确、清晰且物理一致的预测。
展示了这一点,该图描绘了 FCN3 对 2020 年 2 月 11 日开始的 500 hPa 暴风强度的预测,此时正值风暴丹尼斯(Storm Dennis)登陆欧洲前夕。FCN3 准确地捕捉了暴风强度的量级及其在不同长度尺度上的变率,体现在相应预测的角功率谱密度与真实值高度一致。这一优势在 30 天(720 小时)或更长时间的推演中依然保持。
FourCastNet 3 对 2020 年 2 月 11 日 0000 UTC 开始的丹尼斯风暴的预测。该图展示了 850 hPa 气压层的风速和 500 hPa 位势高度的等高线。
开始使用 FourCastNet 3
完全训练好的 FourCastNet 3 检查点可在 NVIDIA NGC 上获取。
使用 Earth2Studio 运行 FCN3 推理非常简便。
为使 FCN3 达到最佳性能,建议安装启用了自定义 CUDA 扩展的 torch-harmonics,并在推理期间使用 bf16 格式的自动混合精度(这是 Earth2Studio 中的默认设置)。如果想运行自定义的 FCN3 推理或自行训练,可以在 makani 中找到相关代码。
使用 Earth2Studio 脚本生成的 FourCastNet 3 96 小时预测时效结果。该运行在 2024 年 9 月 24 日 0000 UTC 启动。上排分别展示了集合成员 2 的大气可降水量(tcwv)场和 10 米纬向风速(u10m)场。下排显示了所有四个集合成员在这两个场的标准差。
全部0条评论
快来发表一下你的评论吧 !