酝酿了一年多,华为32路开放架构小型机KunLun终于与广大用户正式见面了。
在日前召开的CeBIT 2016(汉诺威消费电子、信息及通信博览会)上,华为对外正式发布了全球首款32路开放架构小型机——KunLun。作为一款可以算得上划时代的产品,我们首先看看它究竟有何特别之处。
要说KunLun最大的特点,那就是最高支持32路x86处理器,这也是当前x86服务器领域扩展性最高的。
可能有人问要做到32路很难吗?是的,很难。众所周知,做高端服务器(Scale-up纵向扩展服务器)最大的难点在于如何以最少的资源消耗来保证处理器之间的缓存一致性,这也是为什么至今仅有极少数的八路以上的x86服务器问世的主要原因,归根结底,跟技术水平的高低是有直接关系的。
拍摄于2015年HCC期间
而在少有的八路以上的x86服务器中,无论是在惠普Superdome x还是华为开放架构小型机KunLun都有一个十分关键的组件就是Node Control Module(节点控制器)。它起什么作用呢?我们首先看看没有节点控制器的八路服务器内部CPU是如何通讯的。
英特尔官方的8路E7的互联架构,由于不提供额外的节点控制器,限于E7的QPI接口数量(最多3个),可接访问的只有相邻的CPU。如上图中,蓝色的CPU就是黑色CPU0所无法直接访问的,这意味着CPU0如果想访问蓝色CPU所控制的内存数据,就必须要经过其他CPU,反过来蓝色CPU所控制的内存数据传回CPU0也同样如此,显然也会影响途中经过的CPU自己的处理效率。
那有节点控制器的八路服务器内部CPU通讯又是什么情况?
上图为某品牌八路服务器的CPU互联架构,从图中我们可以看出,通过XNC节点控制器的中继,CPU之间无需经过其他CPU就可以直接互联,进行内存数据的“非一致性”访问(NUMA),而且XNC还会带来额外的好处——无需使用昂贵的E7-8800系列的8路专用型号,用性价比更好的双路E7-2800系列就可以做出8路的产品。
从以上对比也不难发现,有和没有节点控制器,最终的性能等各方面的区别还是很大的。换言之,如果没有节点控制器这项核心技术,想做八路以上的服务器也是很困难的,毕竟处理器数量翻一翻,内部CPU之间的通信的频次可是呈几何倍数增长的,这其中的资源浪费可想而知,很可能出现虽然CPU数量多了,性能却出现下降的局面。
有关华为KunLun关键业务开放平台节点控制模块的更多信息我们现在还无从而知,但毫无疑问Node Control Module(节点控制模块)是其中一项非常重要的技术。
除此之外,采用创新性的RAS2.0技术,基于x86开放架构平台打造也都是KunLun值得关注的方面。前者使得KunLun真正称得上小型机。据华为IT产品线关键业务服务器总经理王震介绍,RAS2.0基于固件、不依赖OS的故障响应和诊断机制,能够全面、自动的故障信息收集与分析,实现主动预警、隔离、替换失效部件,并率先支持CPU、内存等核心部件的在线维护。
后者则赋予了小型机新的活力。我们过去认知的小型机是RISC、SPARC……围绕他们构建的生态系统也只是少数几个厂商的圈子。x86则不同,十几年耕耘,围绕它已经建立起了资源非常丰富的生态系统,基于此设计的小型机在平台、软件、应用方面相比传统小型机都会有很大的优势。
华为官方公布的KunLun9016(16路)与IBM Power P780(16路)的对比,性能提升40%的同时,TCO减少了50%。
从以上信息其实也不难看出,华为KunLun已经不只是一台简单的高端服务器,更是一种象征,其诞生的意义甚至可以媲美至强7500的面世,说其为x86服务器领域的又一个里程碑也并不为过。自此,x86平台与小型机的争夺将更加白热化。且不论最后谁胜谁负,但就像华为IT产品线总裁郑叶来在CeBIT上所讲,KunLun的发布标志着另一个小型机时代的到来。
据悉,KunLun主要面向四大类应用,包括数据库/OLTP、内存计算、HPC和云计算&虚拟化。而尽管KunLun这几天才正式面世,但就像前文所讲,事实上KunLun自研发出来已经有一段时间了,KunLun已经积累了不少用户。王震透露,目前包括国有五大行在内的近30家客户已经在应用KunLun。应该说这是一个十分不错的成绩。