HPC专家委员会主席:GPU将成为HFC的新动力机房建设

2010-05-05    来源:比特网    编辑:王允
Gilad Shainer每年都与中国有两次约会:一次是IDF前的媒体沟通,还有一次则是十月份的中国高性能计算Top100研讨会议。这位相识已经三年的老朋友每次都能带来有关高性能计算前瞻性的观

  Gilad Shainer每年都与中国有两次约会:一次是IDF前的媒体沟通,还有一次则是十月份的中国高性能计算Top100研讨会议。这位相识已经三年的老朋友每次都能带来有关高性能计算前瞻性的观点。不久前,他依约接受比特网(Chinabyte)专访,身兼Mellanox技术营销总监与全球HPC专家委员会主席双重身份的Gilad表述了HPC下一个阶段的发展轨迹。

  高性能计算的互连趋势

  高性能计算市场近几年发展非常迅速,已经从一个有潜力的市场变成了成熟的市场,对此观点Gilad认为,HPC的应用已经涉及到数据中心。同时HPC的一些新的核心技术也已经从HPC市场,扩展到其他的应用领域。

  Gilad认为,应当从三个方面来看待HPC在下一次变革中的发展,第一是处理器,第二个是存储技术,第三是网络。而在Mellanox擅长的网络方面,将会推出更加富有智能性的网络产品。他解释说,现在CPU还在承担一些网络上的工作,在以后可以把很多以前在CPU,或者在系统中所要执行的功能,交给网络来进行实现,这样可以最大限度的将CPU的一些负载转接在网络上面。这样可以很大性能的提高产品性能,“所以我们认为在今后的几年当中,如何发展这种智能性的网络将是一个很长期的趋势。”Gilad表示。

  现在Infiniband已经可以帮助整个系统的原有负载工作,转移到网络、网卡来进行,在未来可以很大程度的提高HPC的运算性能以及扩展整个HPC系统的规模。

  GPU的火热发展

  Gilad认为,GPU是HPC在跨入下一个领域的动力。他解释说,从现在的应用模式来讲,无论是从学校、研究机构,他们已经认识到自己的应用开始变得越来越复杂,对于整个HPC系统运算能力要求越来越高。Gilad认为,如何让现有的HPC运算能力从现在的几万亿次,提升到几十万亿次,甚至更高阶段HPC当中,GPU会扮演一个非常重要的角色。

  而现在在一些大型的应用领域,包括国防科大开发的天河一号系统,已经大量采用了GPU系统。在GPU系统中,能够提高系统性能,而在整个GPU应用当中,有三个方面比较重要。

  第一,如何让应用程序能够在这种包括几百个核心的GPU平台上运用,必须对程序重新进行编译,重新进行设计;

  第二,在GPU设计当中,现在已经有了一种GPU Connect的技术,这样可以使得GPU与网络之间的通讯,不需要在CPU直接进行传递,这样可以实现性能的提高;

  第三,希望在将来GPU可以成为一个单独的系统。这样可以把相关的应用,直接分配到GPU系统中,由GPU系统来单独运行,构成一个整个的GPU虚拟化的系统。在今后应用当中,可以和目前的虚拟化技术完好的结合在一块。

  如何实现可扩展HPC

  如何实现扩展HPC,Gilad表示现在Mellanox也在做相关的事情。但是对于如何实现可扩展HPC,Gilad认为,第一,如果要在可扩展HPC领域进行一些应用的话,首先是客户的应用程序必须要重新针对于可扩展性要重新进行设计。现在HPC专业委员会已经在气象学、生物学,以及在一些全球大规模的气象合作当中已经做了很多这样的努力。

  这样客户可以针对于这种可扩展性,重新来设计程序,这样保证程序在这种已经实现可扩展的硬件设备上,能够实现想要的性能。

  第二,在HPC系统当中如何能够实现性能的稳定性。Gilad认为,HPC可能是一个几千个节点的系统,如果不能保证这个系统运行长时间的稳定性,这样的系统在实际运用中毫无价值。所以需要一些更有智能性的设备,它们能够自我诊断,发现到一些问题,即使能够保证应用程序在有故障的系统下,野能够继续稳定的运行。同时,还能将把这些问题即使报给IT的管理人员,所以能够让这种系统即使得到解决。所以智能的系统是保证HPC稳定运行的一个重要因素。

  除此之外,这种可扩展的HPC系统还需要更具备智能型的设备,能够把一些通讯,或者是一些数据传递的工作,由网络来承担下来,而不用占用CPU或者GPU的时间,让CPU和GPU的工作基本上都是专注于客户的应用系统。而通过网络的一些自己的智能工作,把很多传输过程当中,产生一些需求,能够通过网络上进行解决,这样也是能够提升整个HPC这种可扩展性的重要因素。

  全球HPC专家委员会2010重点工作

  在从去年的长沙举行的中国高性能计算Top100发布之前,全球HPC专家委员会集合了IDC、美国橡树岭国家实验室以及中科院的专家们做了一天的HPC研讨,此次会议之后,HPC委员会迅速壮大,已经从会议之前的一百个左右,增加到一百四十个。

  同时,HPC委员会主要致力于三个方面的工作:第一个;助客户的应用程序能够在HPC系统中实现,得到应用;第二个帮助客户能够提升产品的性能。第三个方面就是和一些OEM,比如DELL、IBM、HP等进行合作来建立一些体验中心。在这些体验中心,不仅让这些客户能够能够感受到新系统中新的性能和一些应用,同时也要让其他的客户,在体验中心能够获得一个必要的信息。

  在此之外,Gilad透露说,HPC专家委员会计划在未来的几个月,在中国北京要开立办事处,目前已经与中科院计算所展开合作,双方已经有一个系统在筹划中,而在系统正式运行之后,也将会宣布办事处的成立。

  IDC预计2010年高性能计算领域将会持续发展,而这一市场早已成为各厂商“盘中食”,以Infiniband见长的Mellanox也将会持续在智能型HPC上下足功夫。

1
3