简单实用 菜鸟了解企业存储中各个术语技术应用

2010-11-10    来源:论坛    
如果说之前对于存储的认识还是在简单的硬盘、内存上,那么网络时代的快速发展,存储技术不断的更新,存储已经早就在硬盘为基础前提下得到飞速发展。而今,企业级存储技术不断

  如果说之前对于存储的认识还是在简单的硬盘、内存上,那么网络时代的快速发展,存储技术不断的更新,存储已经早就在硬盘为基础前提下得到飞速发展。而今,企业级存储技术不断涌入市场,使得习惯于传统存储知识的用户在术语认知上有所缺陷,如网络存储、虚拟存储、云存储、重复数据删除技术、归档技术等一大批术语究竟是什么,很是让人费解?尽管掌握这些术语似乎没有实际意义,并不能真正意味着对于行业技术的熟悉,但是这些基本的存储术语,可以帮助想进一步深入了解企业存储技术的人获得入门知识。

  说到数据存储,最先想到的一定是PC上的硬盘,因为在PC上数据基本都存储在这块磁盘中,对于其数据保存起着一定的影响作用。而对于企业用户来说,服务器数据的存储相对更加重要,有些甚至决定着企业的命运。提及到这,随着企业网络应用中数据不断增加,网络存储技术的概念也随之出现。

  DAS、NAS和SAN三种存储究竟是什么?

  首先,DAS(Direct Attached Storage,直接外挂存储)是存储方式的一种方案。这种存储方案的服务器结构如同PC机架构,外部数据存储设备(如磁盘阵列、光盘机、磁带机等)都直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分,同样服务器也担负着整个网络的数据存储职责。DAS这种直连方式,能够解决单台服务器的存储空间扩展、高性能传输需求,并且单台外置存储系统的容量,已经从不到1TB,发展到了2TB,随着大容量硬盘的推出,单台外置存储系统容量还会上升。此外,DAS还可以构成基于磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。

  其次,NAS(Network Attached Storage,网络附加存储)全面改进了以前低效的DAS存储方式,它是采用独立于PC服务器,单独为网络数据存储而开发的一种文件服务器。 NAS服务器中集中连接了所有的网络数据存储设备(如各种磁盘阵列、磁带、光盘机等),存储容量可以较好地扩展,同时由于这种网络存储方式是NAS服务器独立承担的,所以,对原来的网络服务器性能基本上没什么影响,以确保整个网络性能不受影响。它提供了一个简单、高性价比、高可用性、高扩展性和低总拥有成本的网络存储解决方案。

  SAN(Storage Area Network,存储域网络)不是把所有的存储设备集中安装在一个专门的NAS服务器中,而是将这些存储设备单独通过光纤交换机连接起来,形成一个光纤通道的网络,然后这个网络再与企业现有局域网进行连接,在这种方案中,起着核心作用的当然就是光纤交换机了,它的支撑技术就是光纤通道协议,这是ANSI为网络和通道I/O接口建立的一个标准集成,支持HIPPI,IPI,SCSI,IP,ATM等多种高级协议。在SAN中,数据以集中的方式进行存储,加强了数据的可管理性,同时适应于多操作系统下的数据共享同一存储池,降低了总拥有成本。

  了解到存储基本方式后,你会更加清楚的认识到企业级产品中很多技术和产品都是围绕着这几个来展开的。如今最热门的莫过于虚拟化和云的技术概念,而存储上也很好的将这两个概念分别应用。

  何为虚拟存储技术?

  在技术层面上,很难具体把虚拟存储透彻的详解。但是,从通俗定义的角度上来说,虚拟存储就是将存储系统进行虚拟化。其实虚拟化技术并不是一件很新的技术,它的发展,应该说是随着计算机技术的发展而发展起来,最早是始于70年代。由于当时存储容量,特别是内存容量成本非常高、容量也很小,对于大型应用程序或多程序应用就受到了很大的限制。为了克服这样的限制,人们就采用了虚拟存储技术。

  既然虚拟存储技术由来已久,那如何理解如今热门虚拟存储应用?从概念上比较通俗的理解,就是把多个硬盘、RAID通过一定手段集中管理起来,所有的存储模块在一个存储池中得到统一管理,这种可以将多种、多个存储设备统一管理起来,为使用者提供大容量、高数据传输性能的存储系统,就称之为虚拟存储。

  此外,虚拟存储技术还可以通过管理软件,为网络系统提供一些其它有用功能,如简化服务器的远程镜像、Snapshot等应用。

  云存储是受云计算影响

  而谈及到云存储,受到云计算的影响,随着数据中心对云应用与需求增长,云计算数据中心落地也就产生了云存储。云存储应用的最新热潮是主存储的服务,最明显的应用范围是SAN和NAS。在这两种环境中,本地存储在主存储中扮演了云存储缓存的角色。随着数据的更新,其被复制到云中,这就类似于传统系统中快照复制的方式。数据的记录只在云副本中保存。这样使得应用或用户转向云存储区域,数据则复制回缓存由用户读取。

  可能这还不够直观简单,可以说云存储是在云计算概念上衍生和发展出来的一种新的技术或者服务,云计算是将分布式处理、并行处理、网络计算相互结合,通过网络将计算机处理程序自动分拆成无数个较小的子程序再由多部服务器组成的庞大系统经计算分析之后将结果交回给用户。而云存储则是将网络中各类存储设备通过应用软件集合起来协同工作,对外提供数据存储和业务访问功能的一个系统。

  云存储主要是由4层组成:包括存储层、基础管理层、应用接口层、访问层。

  存储层是云存储最基础的部分。各个存储设备通过各种网络设备联系在一起,存储设备可以是FC光纤通道存储设备,可以是NAS和 iSCSI等IP存储设备,或是 SCSI或SAS等 DAS存储设备。存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。

  基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。

  应用接口层:不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。比如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平台等。

  访问层:任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。

  存储最终的目的是有效利用数据,更好服务于业务发展。正是这种理念下,不论是虚拟存储还是云存储,都需要结合很好的数据应用技术,有效的处理数据使其可以达到满足企业用户要求的效果。而存储上最大的工作是需要后期的备份,如今随着数据量呈现爆炸式增长,数据重复的几率不断扩大,简单的“存”和“储”的含义,不是把数据放在角落里就高枕无忧。更重要的是,通过这些数据,进一步产生价值,提升企业业务能力,增加效益。

  重复数据删除(Data Deduplication)就是一种数据缩减技术,旨在减少存储系统中使用的存储容量。依据数据处理方式的不同,重复数据删除技术可分成两种:其一是在线处理(In-line),这一方式中,数据在读进来之后,当存到磁盘之前就已经进行了重复数据删除;其二是后处理(Post-Processing),采用这一方式的话,数据在存到磁盘上后才会进行重复数据删除,在存到磁盘前,数据没有减少。

  这两种方式各有优缺点:In-line的优势是节省了磁盘空间,同时重复数据删除一步到位,特别简单。但缺点是对CPU的损耗非常大,会占用大量CPU资源,导致性能下降。相比之下,Post-Processing对CPU的占用会小很多,但缺陷在于重复数据删除的环节会比较复杂。

  然而数据量的爆炸性增长,造成了数据方面诸多话题更容易引起共鸣。现在所说的存储,并非是 简单的“存”和“储”的含义,而是涉及到“备份”、“数据归档”、“数据保护”、“数据挖掘”等等。那么在这些“存储”范围之中,“数据归档”是最为谈论的技术。

  如何理解数据归档

  存储网络工业协会(SNIA)对于数据归档是这样解释:是指数据集合的一致性拷贝,通常用以长期持久地保存事务或者应用状态记录。一般情况下,数据归档通常用以审计和分析的目的,而不是用于应用恢复的目的。

  而比较简单的理解,通过备份概念很形象说明,数据归档与备份都是数据存储的应用形式,只是应用目的不同。

  备份是对数据进行复制,是为了确保在出现数据丢失或系统灾难时将复制的数据恢复回来。根据备份的解释再来看数据归档就很好理解了。数据归档是针对“海量数据”的应用,是对数据进行有计划的迁移。当数据停止改变或不被频繁使用时,通过数据归档把它们转移到别的地方,让出主存储空间,并且使之处于日常的备份窗口之外,既节约了空间,又提升了备份的效率。

  那么根据上面的解释,如果再简化来说,那就是“Ctrl+C”和“Ctrl+X”的区别,备份是复制,数据归档是剪切。对企业而言,备份和数据归档具有两种不同但互补的功能:备份用于快速复制和恢复,以减少故障、人员错误或灾难带来的影响;数据归档则用于对数据进行有效的管理、保留和长期的访问与检索。

  另外,企业可以将数据归档和备份结合起来用,以达到优化成本、改进存储基础设施的整体效力,使备份能够在有效的数据归档解决方案下变得更有效率,而数据归档也可以利用备份基础设施满足数据保护需要。

1
3