中国超算中心正面临作用难以充分发挥尴尬

2014-06-27

       镶嵌着“国家超级计算天津中心??天河”字样的弧形大楼,坐落于天津塘沽海滨。在炎炎烈日下,红墙衬托的白色字体,透射出中国现代科技发展的硬实力。6月13日,《中国科学报》记者走进了大楼,只见迎面墙壁上书写着几代国家领导人的题词,暗示其重任在肩。大楼第二层机房保持在适当的低温中,清凉宜人。一排排整齐的黑色机柜闪烁着绿色星光,“天河1号”正满负荷运行。

事实上,相比许多设立在其他省市的国家级超级计算中心,处于饱和运行状态的“天河1号”是幸运的,因为更多的超算中心正在面临着无相应配套软件,难以充分发挥作用的尴尬。

绝无仅有的案例

      2009年,“天河1号”作为国家“十一五”科技发展重大项目、由国防科技大学和天津市共同承担建成。建设中,科技人员采用CPU(芯片)+GPU(加速部件)融合方式提高运算速度。在2010年世界超级计算机500强竞赛中,“天河1号”显示出强劲的运算能力,一举摘得了世界第一的桂冠。

与全世界所有超级计算中心不同的是,在取得世界第一的成果后,国家超级计算天津中心(以下简称天津中心)作为中国军民科技融合的范例,经过几年努力,在应用中又成为自负盈亏的国家超级计算中心。

     “计算机五六年更新一代,如不充分挖掘应用潜力,数亿元的投资在夺得世界第一后不能穷尽其用,显然很不划算。”天津中心应用部部长孟祥飞解释,这也促使他们在满负荷运行情况下继续深挖市场潜力,不断举办系列培训活动,培育新客户。

      天津中心主任刘光明介绍:“天津中心每年维护运行约需要3000万元人民币。其中一半用于支付电费,能维持正常运行是件十分幸运的事情。”

目前,天津中心主要服务于承担国家重大研究任务的科研机构和政府部门管理。先后与中科院大气所、中石油油气勘探院、华大基因等成立了联合实验室,开展大气模拟、地质成矿模型、药物设计等研究,也成为天津滨海新区政府的云服务系统。

      但是,“相比国外,国内仍有许多行业并不了解超级计算机的用途。”孟祥飞也承认,天津中心的成功运行模式,正是因为其相关合作方的软件研发很成熟,能够让“超算”发挥作用。

发展受制于软件

      继天津后,为推动超级计算的发展,我国先后在深圳、长沙、济南、广州和无锡等地发展和筹建国家命名的超级计算中心。此外,我国还有两家老牌超算中心,即上海超级计算中心和中科院超级计算中心。这些超级计算中心的建成,使中国计算能力从百亿、千亿迅速提升到亿亿级。

      6月10日,中科院计算所研究员张云泉在九三学社中央科技委首次科技沙龙上透露,我国超级计算机的性能近年来已经3次夺取世界第一,但在实际应用中却难以发挥出其最高效率,距离为国家科技创新、推动国民经济发展做出具有实际意义的工作尚有一定距离。

      一个事实是,《中国科学报》记者采访时得知,某超级计算中心目前只能发挥约70%的运算功能。

       张云泉分析,国家超级计算中心难以充分发挥作用的重要原因在于,中国计算机发展在硬件方面得到了政府的有力支持,因而发展迅速。而由于重视和投入不够,与其相应的软件出现了“好马”无“好鞍”现象。中国超级计算虽运算能力成功登顶,但驾驭水平没能跟上。

     “应用软件的研发对超级计算的发展具有举足轻重的地位,其生命周期可持续几十年,而硬件只能维持5年左右。”一位业内人士指出,不同应用软件解决不同的应用问题,是超级计算能力的具体体现。影响中国超级计算能力发挥的关键在于应用软件的缺乏。

满足应用为最佳

      一位不愿具名的计算机工程研究员告诉记者,中国各地国家超级计算中心,在应用中充分发挥出能效的是天津超算中心、上海超算中心和中科院超算中心,基本处于饱和运行状态,与应用需求结合紧密。

       这位计算机工程研究员认为,能满足应用的计算机即是最佳计算机。计算机速度越来越高,结构会越来越复杂,软件研发难度也随之提高。美国在计算机发展战略中,软件研究投资金额达到总投资的60%以上。因为软件研究首先需要进行方程研究,弄清边界条件,随后把方程变成离散模式,最后再编写成软件。一个生产型软件,需要几十位研究人员同步开展工作,代价很高。这类研究,在国内鲜有科研机构进行,因投入高、短期难见效益。

       美国田纳西大学诺克斯维尔分校教授Jack Dongarra早在2004年就提醒计算机研发人员:“高端计算机的真正危机在于软件,软件成本已成为现代技术中最主要的经济开支。”

       刘光明认为,中国超级计算机发展不妨借鉴美国经验。美国在部署国家橡树岭国家实验室超级计算发展时,同步部署了相关应用软件的研发,很值得学习。

摘自

《中国科学报》 (2014-06-19 第1版 要闻)