联想服务器是这样炼成的刀片服务器

2015-09-18    来源:网络    编辑:佚名
在不久前IDC公布的中国x86服务器市场数据中,联想分别以23.4%和22%的份额成为出货量和销售收入的“双冠王”,成为最大赢家,这样成绩的背后,联想自有其秘诀。市场是产品的反映,一

  联想TDC是做什么的?

  通常,科技公司的研发中心往往隐于企业背后,是一个神秘的部门,作为联想服务器的诞生地之一,台北研发中心也是一个低调的部门,但是能量巨大。

  据联想全球x86服务器台北研发中心总经理樊克思介绍,联想目前在全球有着13个研究&开发实验室,其中核心的5个为平台设计中心,台北研发中心是其中之一。

  针对联想不同的企业级产品序列,5个平台设计中心各有分工:TDC主要负责System x X6等高端服务器、Flex System等刀片和融合系统、NexScale等高密度服务器的研发;北京研发中心主要负责System x/ThinkServer中标准机架和塔式服务器、以及一般的高密度服务器的研发;上海&无锡研发中心主要负责相关软件的研发;美国圣何塞研发中心和莫里斯维尔研发中心主要负责联想存储、网络等产品的研发。

  不难看出,台北研发中心所包含的产品,System x X6、FlexSystem、NexScale均属于此前SystemX服务器中颇具代表性的产品,通俗而言,是比价考验技术能力的产品段,台北研发中心承担了这些“重头”产品的研发,足见其对联想的重要程度。

  联想TDC并非是刚刚落成,其前身是2004年成立的System X实验室(xTDC),System x历史上大名鼎鼎的BladeCenter、Flex System、NextScale、System x M4/M5、以及部分存储和网络系统都诞生于此。樊克思介绍说,2009年对于TDC来说是重要的一年,此前,System x的产品设计、行销等工作都是在美国做的,2009年之后,System x产品交由台北研发中心来做研发和交付。

  去年10月1日,随着联想对IBM x86业务的成功并购,台北研发中心正式纳入联想麾下。换句话说,System x的DNA将继续被传承,联想获得了System x的全部设计和研发能力。

  “喇叭式”的研发流程

  谈及为何将研发中心设立在台北,樊克思表示道理很简单:“台北有着x86生态圈中主要的ODM和OEM公司,我们和他们是非常接近的,这更利于交流和协作。”

  台北研发中心如此重视“生态”的力量,原因在于和业内很多服务器研发中心的做法不同,TDC并不仅仅从事产品研发中的某一阶段,而是采取“端到端”的产品开发模型,从产品的概念设计,到产品计划、产品开发、质量管理、产品发布、生命周期管理,TDC涉及产品研发的七大流程。

  樊克思介绍说,TDC的“端到端”产品开发模型是一个“喇叭式”的结构:在产品概念设计之前会有很多的候选项目,这时候要经过大量的讨论;当概念确定下来之后更改就要被缩减,到产品计划的阶段就要更少了;一旦计划确定,进入产品开发阶段,这时候希望更改的地方就非常少了。“这样的流程对于我们来说是非常重要的,在规划产品的时候想法有很多,但资源和市场有限,我们要决定好做哪一些产品再往下做,希望计划之后尽量不要做很多修改,因为修改就是痛处”,樊克思表示。

  联想TDC的多个团队都会在不同阶段参与到“喇叭式”开发模型当中,包括产品组合与产品管理、产品营销、架构&开发&测试、采购、服务规划&培训、制造、产品工程等,形成一套非常完整且缜密的设计流程。“这样的好处是针对科技改变和客户的需求,能够很快的讨论做出决定,以支持客户的需要”,樊克思说。

  高品质的服务器是这样炼成的

  收购IBM x86之后的联想已经具备了业内最完善的x86服务器产品组合,ThinkServer和System x两条产品线涵盖了四路及以上高端服务器、刀片服务器及融合系统、高密度服务器、以及1P/2P机架式和塔式服务器,支持各种应用及市场范围。

  不过,产品丰富度并不能和市场占有率画上等号,就像iPhone,仅有可怜的几款型号,但其销量抵得过多数手机厂商的所有产品之和。

  服务器市场也是同样的道理,以多为胜并非是制胜之道,对于服务器这种数据中心核心设备而言,产品品质是最为核心的要素。

  通常,用户更加关注服务器的RAS(可靠性、可用性、可服务性)、安全性、可管理性和节能设计,甚至高过于对性能的要求,联想服务器深谙此道。

  在权威调研机构ITIC发布的2014-2015年全球服务器硬件可靠性报告中,联想System x以仅1%的故障率击败了其他x86服务器产品,可用性高居榜首、直逼小型机;而在另一个权威调研机构TBR的客户满意度评分报告中,联想System x在客户、服务、产品和业务四个方面满意度持续领先,15季度中有13个季度位列榜首;同时,在服务、产品和销售指数的22个要素中联想System x也位居榜首。

  “谈到设计,如果有人问我说联想服务器的设计特色是什么,我们最引以为傲的就是我们的DNA”,联想全球Flex2P服务器产品行销总监黄国柱介绍说,在RAS方面,联想服务器采用了最高规格的原料以保证可靠性,如30u镀金插槽;采用可靠的电路设计、无烟设计;采用高效风扇、双冷风道设计、光路诊断系统和PFA等等。

  “就像汽车的分区空调,联想服务器采用了双冷风道设计,每个区域N+1冗余,根据风扇区域中的组件和散热条件调节风扇速度,在较低环境温度或系统空闲状态下保持最低风扇速度”,黄国柱表示,这样的好处在于能够提供更高的散热效率和更出色的可用性,并且更加节能,提供更持久的生命周期。

  而光路诊断系统和PFA就像汽车仪表盘上的故障提示,能够显示服务器的哪个子系统发生了问题;PFA功能对电源、风扇、VRM、磁盘、处理器、内存等主要部件进行故障预测分析,提供故障预警。这样的设计能够监控服务器健康状况,减少突发宕机时间,并且能够帮助维护人员快速定位故障修复故障,提高了服务器的可维护性。

  为在品质上精益求精,联想服务器不仅在RAS、安全性上花了大量精力,还通过严格的测试和质检环节来进一步提升产品品质。

  据联想TDC资深系统测试工程师徐福彬介绍,联想在“喇叭式”开发模型的开发和质检阶段会引入严格的测试,包括构件程序验证(BBFV)、系统设计验证(SDV)、系统集成测试(SIT)等流程,对包括CPU、内存、扩展卡、电源、内存等在内的选件,包括UEFIFA、IMM、DSA在内的固件,被测系统,以及Windows、Linux、VMware等操作系统,还有Xclarity等相关工具进行完善的测试。

  风洞测试

  “联想服务器测试是从BBFV阶段开始参与到产品的研发,这个时候产品才开始开发,系统软件和固件还未完善,这个时候以基本核心程序测试为主,还包括对早期板载、芯片组、固件等进行设计验证,以及子系统集成验证等;当产品进入SDV阶段,软硬件和固件基本已经成熟,要开始做比较完整的功能性及程序上面的验证;到SIT阶段,我们将从客户的角度来做产品验证,我们会把系统从开箱、配置、部署,会有一套模拟客户执行的脚本,以确保产品交付到客户手上是没有问题的。”

  高温测试

  除此之外,联想服务器还要经过系统稳定性和高负载压力测试、系统模块震动可靠度验证、集成功能测试、工程维修有效性测试、服务器选件兼容性测试、存储装置测试、存储设备互通性测试等一系列严格的测试过程。据介绍,联想服务器能够稳定工作在40摄氏度环境,这就是“千锤百炼”的成果。

  为打造业界最高品质的x86服务器,联想服务器除了采用精良的设计和严格的测试,还具备端到端的质量管控,以确保交付到用户手中的每一台服务器都是优质的产品,这也是联想服务器能够做到“差异化”的一个重要因素。

  据联想企业级业务集团全球供应链副总经理李峰荣介绍,联想“端到端”的质量管控包括端到端的质量管理框架、新品开发过程的质量管控、制造过程质量管控、供应商质量管控、问题处理过程质量管控等环节。“比如在客户端质量管理中,联想一个很重要的计划叫做早期质量的检测系统,能够在量产之前及早发现和解决问题”。

  设计、测试、质量管控环节让联想服务器具备了优秀的品质,那么对于用户来说够了么?还不够。服务器毕竟是拿来用的,性能也是用户考量的一个重要指标。为了进一步“榨干”服务器的硬件性能,联想服务器还引入了“效能工程”,让服务器在各种应用中实现最佳的性能。

  据联想TDC效能工程师周建闵介绍,联想服务器在研发模型的每个阶段都融入了调优过程,效能团队的工作方向包括系统性能验证、能效验证、效能指标验证、以效能观点融入系统设计、客户与销售团队现场支持等,目标就是为客户提供最佳的效能比。

  对于客户而言,“能效工程”能够给他们带来切实的好处。据测算,,服务器三年的电费和散热成本相当于1.5倍的服务器价格;而经过系统优化,以双路至强E5-2699 v3为例,可节省25W的电源消耗;以80%负载计算,相当于一台服务器三年内可省下1600元人民币,很容易计算,在一个具有成千上万台服务器的大型数据中心,每年能够节省的费用将是一个惊人的数字。

  联想TDC服务器机架

  ——独特的DNA、精良的产品设计、严格的测试流程、深度调优、完善的质量管控,这些环节构成了联想服务器的独特竞争力,让联想服务器在一众x86服务器中脱颖而出。

  记者手记:x86,拼的就是品质

  井然有序、管理严明、一丝不苟、专业、低调,这是联想台北研发中心(TDC)给笔者留下的深刻印象。或许只有这样,才能打造出特点鲜明、具有专业品质的x86服务器。

  标准是把双刃剑,就如x86架构,它不仅提供了更加通用的计算指令集,也规范了服务器接口规范和协议,使得服务器厂商能够更容易构建服务器系统,也让用户获得了更加易用和更具性价比的方案;但另一方面,标准有时候表现得也像一个“笼子”,制约了服务器厂商的发挥空间,更难于创新和突破,于是,“同质化”成为x86服务器世界中的最大难题。

  那么,x86服务器厂商如何才能打破同质化,脱颖而出?堆砌硬件?打价格战?No,无论对于某一家服务器厂商,还是对于整个生态圈来说,这都不是一件好事,打破同质化的最佳武器并不是堆硬件和拼价格,更好的设计、更好的品质永远是客户选择产品的决定性因素。

  就如手机圈儿,iPhone一枝独秀的原因绝不是靠超高的硬件和低廉的价格,花六七千元去购买一台手机的理由到底是什么,大家都懂得。

  体验和品质,放诸四海而皆准。不管你是手机用户,还是服务器用户,所追求的目标都是一致的。

  如果将营销称之为“术”,那么产品应当称之为“道”,要在竞争激烈的服务器市场中胜出,最根本的,还是要做好产品,做好的产品。

1
3