高性能计算硬件比肩国际水平 业内:中国更需要世界级工业软件公司

 9月14日,中科院遗传所与联想数据中心相关人员在北京举办了一场小型沟通会,希望在高性能计算领域,科研界与产业界能架起更为紧密的桥梁。

“我们的日常工作以计算为主,分析生物大数据,没有高性能的计算机群来支撑的话,整个工作没有办法开展。”中科院遗传所博士生导师梁承志如此介绍高性能计算对现代生物信息学研究的重要性。今年五月份,在国际著名学术刊物《Nature》上,梁承志课题组首次揭示了小麦A基因组序列精细图谱,其实验过程中涉及大量的生物数据计算分析。

联想数据中心中国区方案营销总监李炜表示,中国企业目前基本上可以补全高性能计算机硬件领域所有空白点,无论性能是否足够好,国内已经可以做了。但是在软件领域国内很多地方是空白,中国需要世界级工业软件公司。

科研少不了自主高性能计算机

HPC是高性能计算机群的简称,是执行一般个人电脑无法处理的大资料量与高速运算的电脑,运算力更为强大的被称之为超级计算机。气候气象、海洋、航空航天、生物、材料、高能物理、药物、生命科学等领域的发展都少不了它,高性能计算机曾为天宫系列卫星路径预测、国产大飞机C919精细数值模拟立下汗马功劳。

梁承志在接受《每日经济新闻》记者采访时表示,2000年左右生物信息学科开始起步发展,呼唤更多研究人才。加之少年时代对于计算机的强烈兴趣,自己所在的群体遗传的分析又需要最新的方法、技术,最终选择了遗传学和生物信息的交叉领域。

1995年梁承志于中科院遗传所获得遗传学博士学位,而在2001年,梁承志在加拿大Waterloo大学又获得数学与计算机科学硕士学位。实现了从生物学到计算机科学的跨越,主要研究方向是基因组学和生物信息分析,这也成为梁承志学术生涯最重要的选择之一。梁承志于《Nature》所刊发的文中,绘制了小麦A基因组序列精细图谱,可以加速栽培小麦的遗传改良和分子设计育种。

在研讨会上,梁承志表示,生物大数据有着 “三高”的特征:高复杂性、高不确定性和高维度。这就导致了计算量的复杂,需要高性能计算机集群。如果没有高性能集群支撑的话,对数据的分析是没有办法实现的,因为数据量太大,对存储和计算都有很高的要求。

“以前我们做生物研究,相对来讲实验为主,做实验过程漫长,花费很高,积累数据量有限。现在实验能力提高了,十年前你要做实验可能要花费一年,现在一个月或者一周,甚至一两天就做完了。” 梁承志指出,现在我们得到了越来越多的数据,通过生物信息学的方法和分析过程,可以产生更多规律性的东西。

梁承志指出,随着生物信息技术的爆发,高性能计算力的提升更为迫切。其同时指出,科研及其他高精尖技术研发的特殊性决定了安全性上的保证更为重要。

软件应用需发力

在中科院遗传所的一处小小的机房所在地,一位科研人员介绍,中科院和联想合建的计算机集群,16年之间在这里不断更换,更新到了现在第四代深腾8810。计算力也从当时的万亿次,提升了千万亿次,提升了千倍。

 

深腾8810高性能计算机系统 图片来源:采访对象供图

回顾历史,我国高性能计算机确实实现了迅猛发展。1983年,我国“银河Ⅰ号”的运算速度达每秒1亿次,同时标志着我国巨型计算机研制成功。2002年8月,联想研制成功了深腾1800超级计算机,实际运算速度超过万亿次。这是中国超算系统首次进入全球TOP500,排名第43位。

新华社报道,在2017年新一期的全球超级计算机500强榜单中,中国超算“神威·太湖之光”和“天河二号”连续第四次分列冠亚军。

不过,“跑”得快、性能好的国产高性能计算机,在实现应用落地上仍需发力。李炜对《每日新闻记者》介绍,性能上我国产品已经足够好,但国产的高性能集群应用领域比较窄,硬件之外,需要软件层面的升级。

在高性能集群最早诞生的时候,最大的技术挑战在于计算能力的损耗。李炜解释,一个计算节点是两万亿次,一百个节点是两百万亿次,但计算的时候不能做到一加一等于二,会有能量的损耗。牛顿的能量转化定律决定了,现实状况下不可能实现理想状态下的能量转化的话,计算力转化就有流失,这就要靠软件。

梁承志对生物信息研究领域所面临的瓶颈进行了介绍。其表示,生物数据复杂性的特点使得其对软件的要求越来越高,目前很多软件能力比较弱。市场上现在生物信息的软件比十年前好太多了,但总的来讲,生物信息学分成不同的小的领域,每个小的领域的软件大家都是各做各的,还没有真正的好的融合,这需要一个过程。梁承志这样表达目前所遇到的阻碍,希望在HPC软件应用生态上更为协同完善。

中国有华为、联想等这些大的硬件企业,也有阿里巴巴、百度这样的互联网巨头,现在中国更需要世界级的工业软件公司。李炜指出,联想当时做集群的时候,已经自己开发了集群调优并行软件,特别是数学计算、遗传、物理、气象等领域里有专项团队在做算法开发,努力保证集群效率做到更高。

华金证券在研究报告中指出,从高性能计算机应用机构来看,HPC 应用正在从政府、研究机构转向商用,互联网企业渐渐成为HPC 应用的主战场。这主要得益于人工智能研发对高性能计算需求的增加,随着互联网、工业物联网等新兴负载的出现,有望改变高性能计算软件应用的短板。

相关产品

评论