突破!清华钱班毕业生毕恺峰发表华为首篇《Nature》正刊

您所在的位置:网站首页 天气预报进阶体系 突破!清华钱班毕业生毕恺峰发表华为首篇《Nature》正刊

突破!清华钱班毕业生毕恺峰发表华为首篇《Nature》正刊

2024-07-02 20:39:59| 来源: 网络整理| 查看: 265

今日,国际顶级学术期刊《自然》(Nature)杂志正刊登载了华为云盘古大模型研发团队的研究成果 ——《三维神经网络用于精准中期全球天气预报》(Accurate medium-range global weather forecasting with 3D neural networks)。

论文第一作者为清华大学钱学森力学班2016级学生毕恺峰。

数据显示,这是近年首篇由中国科技公司作为唯一署名单位,在《自然》正刊发表的论文。

华为云盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速1万倍以上。

《自然》杂志对其给予高度评价:华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。

天气预报不准确的情况,在我们的日常生活中不少见。想要完全准确预测出天气,为什么这么难?

首先,这是由气象本身的特性决定的。所有天气都是由大气运动引起,后者涉及到太阳辐射、空气对流等诸多物理过程,还有大气圈、冰冻圈、生物圈、岩石圈、水圈这5大圈层在共同作用。大气运动处在实时变化中,各种各样的因素都无时无刻不影响着未来我们所感知到的天气。

面对如此复杂的天气系统,人类目前主要的预测方法是“数值天气预报”。

上世纪20年代以来,特别是近三十年,随着算力的迅速发展,传统的数值天气预报在每日天气预报、极端灾害预警、气候变化预测等领域取得了巨大的成功。

但是,随着算力增长的趋缓和物理模型的逐渐复杂化,这一方式的瓶颈日益突出。

即使在科技高速发展的今天,天气的复杂性、物理模型的不完备、算力的限制,这些都仍制约我们对天气的进一步认知。

研究者们开始挖掘新的气象预报范式如使用深度学习方法预测未来天气。AI预报的出现,给天气预报带来了全新可能。

AI擅长处理重复任务、拟合未知数据关系。它不需要像科学家那样熟知大气运动中的物理原理,只要用深度学习的方法了解各种气象数据中的关系,就能完成天气预报的任务。

但是,在中长期气象预测上,AI预测的精度却明显落后于数值预报方法。

2022年,英伟达推出AI预报模型——FourCastNet,该模型首次把预报水平分辨率提升到了和数值预报相比拟的水平。但FourCastNet预测5天天气时,位势预测的均方根误差为484.5,即使使用100个模型进行集成预报,其均方根误差依然高达462.5,远高于欧洲气象中心的数值预报系统operational IFS报告的333.7。

可以说AI在天气预报上的使用,仍处于初阶阶段。英国皇家学会发表的一项研究也表明,将深度学习应用于气象数据分析的研究还处在起步阶段,难以判断AI究竟能否取代传统的数值预报方法。

华为云团队研发出的新AI预报模型,让AI天气预报迎来了新的转机。

           华为云研发团队于2年前开始这方面的研究。他们发现,在数值方法应用最广泛的领域如中长期预报中,现有的AI预报方法精度仍然显著低于数值预报方法,并受到可解释性欠缺,极端天气预测不准等问题的制约。

           研发团队发现,造成AI气象预报模型的精度不足主要有两个原因:

          第一,现有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据;

          第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。

研究显示,盘古气象大模型提供的Z500五天预报均方根误差为296.7,显著低于之前最好的数值预报方法(均方根误差:333.7)和AI方法(均方根误差:462.5)。

保持精度的同时,盘古气象大模型也有着无可比拟的预测速度。在一张V100显卡上只需要1.4秒就能完成24小时的全球气象预报,相比传统数值预报提速10000倍以上。

这一成果的背后,汇聚着研发人员对AI模型的多次训练。

华为云的研发人员让盘古大模型进行丰富的数据学习,內容包括43年(1979-2021年)的全球实况气象数据,涵盖了垂直高度上的13个不同气压层,每层中有温度、湿度、位势、经度、纬度五种气象要素,以及地球表面的海平面气压、风速等四种气象要素。

此外,过往的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据。为此,华为云研发团队提出了采用适应地球坐标系统的3D Earth-Specific Transformer方法,也就是在原本的每一个视觉transformer模块中新引入和纬度、高度相关的绝对位置编码,从而更好地处理复杂的3D气象数据。

AI方法预报中长期气象需要多次迭代模型才能得到预报结果,但在迭代的过程中会不断积累误差。比如若将盘古气象预报的1小时模型迭代168次,预报误差就会明显上升。

为了解决这个问题,研究人员训练了4个不同预报间隔的模型,分别为1小时间隔、3小时间隔、6小时间隔、24小时间隔。这样拆分成各个不同的时间段模型分散训练,就能减少单个模型迭代的次数,从而减少迭代误差。

在多次钻研、训练之下,盘古气象大模型首次在中长期气象预报上超过了传统数值方法。它强大的预报精度与速度,将为气象预报结合人工智能方法创造无限可能。

目前,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等多项信息,可以直接应用于多个气象研究细分场景。

特别是,在极端天气的预测上,盘古气象大模型有着出色的表现。

在预测台风“马鞍”的轨迹和登陆时间,盘古气象大模型准确率达90%,远超行业平均水平;在今年5月台风“玛娃”的路径预报中,中央气象局表示,华为云盘古大模型提前五天预报出台风将在台湾岛东部海域转向的路径。

欧洲中期天气预报中心的对比数据也显示,在预测2022年芬兰寒潮的时候,盘古气象大模型比欧洲中期天气预报中心更快预测出温度下降趋势,提前预测出寒潮的可能。

在刚刚结束的第19届世界气象大会上,欧洲中期天气预报中心主任弗洛伦斯·哈比耶展示了华为云盘古气象大模型与欧洲中期天气预报中心的实时运行检验对比情况,前者惊人的预报能力令现场参会人员惊叹如今人工智能技术的发展。

弗洛伦斯·哈比耶评价道:“人工智能技术为发展中国家提供了重要机遇,因为它不再需要大规模的超算资源,还为提升全球预报能力提供了难得的机遇。”

华为轮值董事长胡厚崑也在人工智能大会上表达了对盘古大模型的期许,他认为人工智能的发展,关键要“走深向实”,赋能产业升级。当前阶段,在人工智能领域,华为有两个着力点:第一,打造强有力的算力底座,支撑中国人工智能产业的发展。第二,从通用大模型到行业大模型,让人工智能服务好千行百业,服务好科学研究。“我们希望,AI for Science,能为科学家,科学工作者带来更多新思路、新方法、新工具,也为我们产业输入新的动力。”

一个具有前瞻性的天气预报AI模型的诞生,不仅能让我们更深入了解那喜怒无常的天气,减少因天气的变化莫测而带来的灾害,同时它也将给各行各业带来新变化,让人们切实感受到“精准预报天气”带来的便利。

论文作者:

毕恺峰,2020年本科毕业于清华大学钱学森力学班,现在是华为云主任工程师,感兴趣的研究方向包括计算机视觉,自然语言处理,AI for science。

钱学森力学班开创了以“学生-问题-导师”三要素匹配汇聚为核心抓手、以“进阶研究-精深学习”为辅的人才培养模式,设有从大一至大四、循序渐进的研究性学习环节。其中,“高年级学生研究员计划”(Senior Undergraduate Research Fellowship, 简称“SURF”)是钱学森力学班专为大四学生开设的科研创新实践平台,资助学生在全球顶尖高校、研究机构及顶尖科技企业开展研学实践。2019年,SURF项目与华为建立深入合作,华为每年面向钱学森力学班发布挑战性课题。

毕恺峰在大四时期,通过SURF项目进入华为实习,被华为的问题点燃,找到了热爱的研究方向,出色的完成了课题研究,并在本科毕业后被华为破格录用。入职半年内,因表现突出,连升两级。



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭