EasyStack获评2016年度制造行业OpenStack最佳实践行业资讯

2016-07-28    来源:厂商供稿    编辑:佚名
近日,由工业和信息化部信息化和软件服务业司指导,中国信息通信研究院和中国通信标准化协会共同主办,云计算开源产业联盟承办的云计算开源产业联盟第一次成果发布会在京召开

近日,由工业和信息化部信息化和软件服务业司指导,中国信息通信研究院和中国通信标准化协会共同主办,云计算开源产业联盟承办的“云计算开源产业联盟第一次成果发布会”在京召开。

工信部信息化和软件服务业司巡视员李颖、中国信息通信研究院党委书记李勇出席会议并致辞,云计算开源产业联盟常务副理事长何宝宏主持会议。会议发布了中国首个云计算开源产业发展白皮书,以及政府、广电、电力、电信、教育、金融、医疗、制造八大行业基于OpenStack技术的最佳实践。



EasyStack合作伙伴副总监 罗云飞

其中,制造行业OpenStack最佳实践由EasyStack助力联想集团OpenStack高可用企业云平台项目获得。EasyStack合作伙伴副总监罗云飞在会上对最佳实践进行了分享。他表示,联想采用EasyStack ESCloud全开源解决方案,将计算,存储,网络全虚拟化和计算与存储融合架构,实现以少量资源支撑20%内部IT业务系统和Moto Cloud业务,IT部门逐步由成本中心转变为创新中心。此外,EasyStack在银行、电信、电力,物流以及教育行业等等都有非常多的成果案例。

具体最佳实践分享如下:

联想集团的私有云就是其中之一,联想集团不用多说,他的交互的业务特别多,他的IT系统非常庞大和复杂,他在全球有很多的数据中心,涵盖像中间件、虚拟化、备份、安全等等各种不同的技术平台,以及数不清的业务系统,非常庞大的一个IT。这些业务系统和技术平台的特点,他们是各自独立部署的,各自成为一个体系,也就是说我们经常讲的信息孤岛的问题比较严重。

它给联想带来的困境比较多,首先第一个是效率的问题,他们在交付一个新的基础设施的时候,通常需要一个周甚至几个周的时间。但是我们知道,如果通过云计算交付的话,可能分钟级甚至秒级就可以完成,另外因为它不是自服务的,所以它需要人工去干预,需要专业的技术团队去部署和实施。这里面沟通、协调以及交付的效率都会影响它业务的上线。第二是成本,联想采用很多大型商业的系统,因为这些系统不是去自动伸缩的,它的资源利用率非常低,效率就比较低下,资源的透明度也不好,最后是安全。目前采用的都是封闭的网络设计,这些直接导致了他的应用不能很好的隔离和做到安全。

2015年上半年开始,我们逐步去帮联想做私有云的部署,基于我们的OpenStack系统,这个是一个架构图,非常清晰明了,底层采用的是X86通用服务器加万兆的网络,另外通过像OpenStack的一些模块,比如通过KVM实现计算的虚拟化,像对象存储、块存储以及一些定向文件,我们用Ceph来存储等,上层还有一些计量、编排的能力,总体来讲这个系统是开源、开放的,我们最终做到是软件和硬件的解耦,对于联想带来的好处,他可以去灵活使用各种异构的硬件资源,而不会被任何一个技术或者一个产品去绑定,有很好的灵活性。

业务的稳定运行离不开高可用,我们在高可用上也做了一些设计,像计算、存储的这些数据,我们实现三副本的拷贝,另外为了实现不同网络、不同租户的安全,我们设计了很多的VLAN。包括管理网络,以及内部的数据私有网,还有对外的接入网络,这种VLAN都有。

当前的状态怎么样,目前完成的联想IT的一期,在北京的数据中心搭建了云计算平台,主要是为他的手机业务提供云资源,因为大家知道联想收购了摩托罗拉,后面他也不断在发展自己的手机业务,所以我们一期是在北京,他们也会逐步把北京其他的业务迁移到云上来。后面的二期我们会牵扯到像武汉等等其他一些城市的数据中心,甚至联想在全球的数据中心,都纳入进来,去做跨区域、跨数据中心的云计算资源池。在必要的时候我们会去考虑公有云的能力。

在走向移动化、社交网络的过程中,无论传统的PC与手机都经历着激烈的竞争及快速的技术转变。作为国内IT标杆企业的联想集团,在面临市场的飞速演变与竞争中提出——从产品向用户转型的新战略。而只有可快速迭代、弹性扩展的企业云平台才能够支撑联想这种业务创新的需求。经过慎重研究与评估后,联想集团IT选择EasyStack公司,基于OpenStack承载其“互联网”战略的企业云平台。经过半年多的实践,已经建设成为规模超过3000 CoreOpenStack生产级环境,数据以最高10TB/天的速度快速增长,并计划在年内将10%~20% IT负载迁移到云环境,这让联想走在了国内企业级OpenStack的实践的前列。

转型与云选型

以往的联想的内部IT主要面向大型客户以及渠道为主,系统架构以包括IBM Power小机、AIXPowerVMDB2及近年普遍使用的VMware虚拟化的传统IT架构构建而成。在向互联网企业转型的过程中,首先在用户数与交易量就远远无法支撑全新的B2C的业务。其次在成本方面,联想以往的IT架构是大规模采用商用化的解决方案,可靠但不便扩展且成本昂贵。

此外,对于IT团队的效率与安全合规性,传统的IT架构仍然无法支撑起联想面向电商与移动新业务转型。2015年,联想IT进入到基础架构再造的阶段——需要采用新的云计算平台来支撑新的业务。

联想的选型历程

在选型过程中,联想对主流的x86虚拟化技术、私有云平台、公有云进行了全面分析与对比后,联想从稳定性、可用性、开放性、以及生态系统的全面与活跃度等因素考虑,最终认为OpenStack云平台技术可以满足联想的企业需求,联想确定采用OpenStack作为其业务持续创新的基础云平台,并选择EasyStack作为合作伙伴一同实践前行。

高可用的架构设计

在逻辑架构上,联想企业云平台完全通过软件定义环境的方式来管理基础架构,底层采用x86服务器以及10Gb网络,引入互联网式的监控运维解决方案,并用OpenStack平台来管理所有资源。

联想企业云逻辑架构

出于高可用角度、最大化的提升云平台的系统效率,联想设计了云平台的物理架构,并采用高配置的服务器来构成计算、存储与网络一体的超融合系统,通过OpenStack整合为统一的资源池,将计算节点和存储节点放在同一个物理节点上。

 联想企业云物理架构

硬件层面,双路的System X3650服务器,以及四路的ThinkServer RQ940,成为了联想企业云平台的硬件支柱。每节点用5SSD硬盘与12SAS硬盘来构成存储模块;SSD不仅用来做存储的缓冲,也是高性能存储池资源;并通过VM访问分布式存储,来实现系统的高可用性。

为了将OpenStack提升至企业级服务水平,我们在计算、网络、存储等方面解决了很多挑战。

计算

在计算方面,联想采用高密度的虚机部署方式,底层基于KVM 虚拟化技术,通过多种优化手段,发挥物理机最大性能,在计算存储融合架构下对CPU,内存等硬件资源做隔离。最终实现在每台双路CPU计算节点上保证50+虚机仍能平稳高效运行。

另外,在云环境里面一般提倡应用程序自身高可用来应对硬件故障,但仍然有一些应用属于传统应用,对于单个主机的可用性还有要求。对于不能做高可用的传统应用,联想通过Compute HA技术实现了计算节点的高可用,通过多种检测手段判定计算结点是否发生故障,将故障物理机上的虚机迁到其它可用的物理机上,整个过程无人值守,最大程度减少因为物理机故障导致的业务中断。

网络

——网络隔离

使用不同网卡,不同交换机或不同VLAN将各种网络隔离,如:单独的OpenStack管理网,虚机生产网络,存储网络,公网,PXE网络。避免网络相互干扰,达到提高整体带宽和更好监控网络的目的。

联想OpenStack企业云平台网络架构

——多Public网络

通过多个Public网络实现网络灵活性,便于管理安全策略。比如联通Public网络,电信Public网络,办公Public网络。

——网络及优化

使用VLAN网络模式,与传统数据中心网络更好的整合,通过优化VLAN数据包处理,达到很好的网络数据包处理能力,让虚机网络带宽接近物理网络带宽。

——双网卡绑定,多交换机

通过双网卡绑定到不同的交换机达到物理网络的高可用。

——网络节点HA

通过多个网络节点,实现公网的负载均衡及HA,实现高性能和高可用网络节点使用Router级别的Active/Standby方式实现HA,使用独立的网络路由监控服务确保网络HA的稳定性。

存储

联想OpenStack云平台采用Ceph作为统一存储后端,其中Glance镜像、Nova虚拟机系统盘、Cinder云硬盘的数据存储由Ceph RBD提供,利用CephCopy on Write特性,通过修改OpenStack代码,可做到秒级虚拟机部署。

Ceph作为统一存储后端,其性能无疑是企业核心应用是否虚拟化、云化的关键指标之一。在计算存储共同运行的超融合部署架构中,存储性能调优既要最大化存储性能、又要保证计算和存储资源的隔离,保证系统的稳定性。针对如下图所示的整个IO栈,联想从下往上,对各层进行了优化:

——网络方面

打开Jumbo帧,提高数据传输效率;同时可采用10Gb以太网络来承载Ceph Cluster网络的流量,提高Ceph数据复制效率。

——性能方面

利用SSD固态盘作为Ceph OSD日志盘来提高整个集群IO性能,来达到关键业务(如电商系统的数据库业务等)对性能的要求,做到性能和成本的最佳平衡点。SSD 具有低功耗,响应时间短,高IOPS,高吞吐量的特点。在Ceph的日志系统,对应的是多线程访问,采用SSD来代替机械硬盘,可以充分发挥,SSD随机读写响应时间短,高IO吞吐量的特点。通过调整IO调度策略,使之更适合于SSD盘,降低了整个IO的延时。

——合理规划

根据服务器上虚拟机的密度,合理规划超融合节点下Ceph OSD的数量,并为OSD预分配CPU和内存等资源,同时,为保证系统稳定性,采用cgrouptaskset等工具对QEMU-KVMCeph OSD进行资源隔离。

——参数调优

Ceph参数调优方面,通过调整JournalFileStore的默认队列、OSDOP线程数等参数,可有效提高性能。其它更多调优参数,可通过迭代测试,找到当前硬件环境的最佳参数。

——数据高可用

数据高可用方面,除了OpenStack已有的数据保护措施之外,联想未来规划中的两地三中心也做了数据灾备方案的准备:

通过专有的低延迟的光纤专线,数据可同步存储在同城备份中心,可异步存储在异地灾备中心,最大限度保证数据安全性。

AD集成

此外,联想还将自身的业务需求融入到了OpenStack企业云平台中,作为一个拥有数万名员工的大企业,需要通过AD活动目录来进行认证,员工就不用单独再建用户、记口令等;通过协作方的定制开发,联想已将AD功能融入OpenStack企业云平台之中。

应用成果

在采用EasyStack ESCloud方案后,推动联想集团向”PC+”、”互联网+”转型,支持大数据、电子商务、智能硬件、MotoCloud等创新业务。 混合云连接器对接公有云实现业务弹性。通过超融合架构和虚拟机高密度设计,实现云主机成本低于公有云。多数据中心运行多业务系统,数据中心间异步数据复制,保证业务安全和数据安全。

1
3