|
无论是对人们的日常生活,还是对整个国民经济的运行,气象都在发挥着越来越重要的作用。而作为高性能计算应用的重要领域之一,气象的信息化建设一直是整个社会关注的焦点。
相信北京的人们仍对05年8月份
的9号台风“麦莎”印象深刻。当时气象预报显示,“麦莎”登陆北京,其降雨强度和范围都将是近几年来最强的。然而实际情况却让专家跌破眼镜,不仅其没有按“预定时间”进京,并且脾气也没有气象专家所说的那样“暴”。预报的偏差让气象部门陷入了尴尬。随后,有关方面表示预报结果受到资料的质量、计算机水平等多方面因素的影响。
高性能计算为平台
事实上,信息技术已经应用到天气预报工作的方方面面,比如气象信息的监测、生成、分发等。中国气象局预测减灾司副司长王邦中曾说:“对于高性能计算机在天气预报过程中的作用,用几个‘非常’来形容都没问题。”
国家气象信息中心孙婧曾表示,用数值计算的方法来制作预报是今后气象预报业务发展的主流方向,也是现代化气象预报业务的基础。数值预报(NWP)的发展与计算机性能的提高有着密切联系,为了提高预报的准确性,要求数值预报模式具有较高的分辨率、较细的物理过程以及预报时效等,而这些都依赖于计算机技术的发展。而从中国气象局数值预报的发展进程来看,高性能计算机系统是数值预报系统基础平台,每一次数值预报水平和能力的提升都有与之匹配的高性能计算机系统的支撑。
气象注定与高性能计算相依相存。作为我国高性能领域的前行者,曙光公司在气象行业中有着广泛经验,拥有多种应用层次的成功案例。曙光公司技术支持中心副总经理曹振南表示:“从最早依靠人工预报,到50年代美国提出人工与计算机结合,再到80年代NWP的大规模应用,高性能计算与气象的结合越来越紧密。一方面是气象的复杂需求为高性能提出了更高挑战,另一方面,高性能的高速发展为气象提供了更强的计算性能,使其可以走向更深的应用。用气象行业专业人士的说法就是,气象对于高性能的需求是没有止境的。”
提高预报精度
就我国气象的信息化建设来说,一方面要应用卫星、雷达、风廓线仪和自动观测站等一系列新的探测工具,获取观测实时数据;另一方面通过数值模式,对天气变化过程进行深入的模拟研究和预报试验。自然对于高性能计算的依赖性更强。
曹振南分析道:“气象行业中对于高性能计算机的要求很高,主要体现在三个方面,首先,气象预报有着惊人的计算量,其必须在规定时间内将各个观测点传输来的实时数据进行分析、计算。而且,伴随人们对气象预测精度所提出的越来越高的要求,气象预报精度的范围从以往的几百公里缩小到了几公里,这就更加提高了计算模型的运算量。其次,在高速的运算过程中,各个CPU之间的通讯量也非常巨大,非常密集,次数很多,整个系统需要有高性能的通讯网络。第三,气象预测具有实时性的特点,整个预测系统需要定时定点运行,无需人工干预,具有良好的管理控制性能和可靠性,比如说今天7-8点作预报,那就要求机器一定要在这个时间段之前成功完成任务。”
正如石油行业的信息架构一样,气象也要将很多因素数字化。这不仅需要以上硬件平台的支持,还需要相关应用软件的运行。“要将气象预报更加精确,就要提高分辨率;要采用更接近于真实大气复杂的物理过程。而要达到这两个条件,同样条件下气象的网格密度每提高一倍,相关计算量就要提高十六倍。
此外,还有应用软件的配合,以前只是单一模式进行计算然后预报,现在不同的程序和软件进行不同侧重点的研究,各个气象研究单位采用混合模式,各取所长,进一步提高预报精度。”曹振南补充道。
走向地市级应用
在曙光看来,气象的信息系统可以分为两类,一是传统气象行业的系统;二是特色化的像海洋、环保、军队特色化的预报系统。而从用户本身来分,也可以分为研究型系统和业务化系统。其中,后者超过了前者增长。“两年前曙光做的天气预报系统还是用于山西、西藏、四川等省级规模的气象部门,而随着政府扶植力度的加大与气象行业技术水平的提升,很多系统已经深入到了经济基础比较好的地市及地市以下的区域。如包头、鄂尔多斯等,甚至上海闵行区等都有自己的气象需求。”曹振南表示:“为此,曙光推出了一系列的解决方案。”
仔细分析曙光新做的武汉暴雨所、苏州气象局、宁波气象局的项目,不难发现“特色”成为新的需求点。
在武汉暴雨所的项目中,由于用户研发了AREM软件是基于某小型机而开发的,所以将AREM从小机移植到曙光集群中就成为不得不面对的挑战。曙光反复努力,最终为用户确立了适合科研化的混合集群系统,将AREM等模式进行了很好的移植。
宁波气象局由于之前使用的是PC CORSS,计算能力比较差,为了提升计算能力,保证应用软件如MM5在平台上的实测性,最终采用了曙光4000A。为了保证用户的需求,曙光特别降低了整个系统的峰值,把更多的钱和资源放在了提高整个应用模式性能方面,采用了AMD架构的胖节点的高性能计算集群系统,网络用了Infiniband。
对于这个项目,曹振南认为,节点数越多的时候,每一个节点CPU越多,而对用户来说,减少网络规模对性能提升至关重要。“节点数不是很多的时候,要性能非常好。节点数特别多的时候,特别是像气象通讯特别密集的应用来说,尽量增加某一个节点 CPU数,从而减少网络的复杂度。”
“特色”之外,地市级气象应用显然对于服务的要求也很严苛,“他们不仅关心如何使用集群系统,还需要了解如何在曙光集群开发新的软件和做软件的移植”,为此,曙光提供了一系列的培训课程。课程分别针对:普通用户、系统管理人员、开发人员。培训的内容包括从集群的简单使用到并行软件的研制和并行算法的设计,从系统的管理和日常维护到设备的原理等诸多方面。整套培训体系有机房的现场培训、课堂讲课、上机实习等多种方式。武汉暴雨所、苏州气象局、宁波气象局等科研人员都参加了培训。
|