关注:企业如何杜绝存储管理上混乱?存储与灾备

2011-03-23    来源:计算机世界    
我们经常看到这种情景:在IT环境中,某系统不断遇到变化(工作负载、资源和管理等方面)而出现性能下降,又没有相应的维护和升级来保持其有序性。对于存储来说,则表现为存储

  我们经常看到这种情景:在IT环境中,某系统不断遇到变化(工作负载、资源和管理等方面)而出现性能下降,又没有相应的维护和升级来保持其有序性。对于存储来说,则表现为存储性能渐渐降级、可用存储容量不断减少,或明明有存储空间却无法使用等,而这种变化常常是潜移默化的。

  出现这些存储管理混乱的现象,不但有技术上的原因,也与管理和环境有关。例如,管理人员会丢三落四,有太多的事情要做;受存储管理工具所限,很难密切跟踪存储等复杂的虚拟资源;人员流动频繁;硬件更换周期较慢。另外,服务器虚拟化加剧了问题的复杂性。

  如何避免存储上的混乱?首先要分析混乱的根源,才能找出应对混乱的方法。不过,评估所采用的策略时要看它可能会节省多少费用,才能明白将会得到什么样的回报。

  存储空间回收

  企业级磁盘阵列管理软件工具可以用来识别容量浪费现象。其中一些浪费的原因是由于效率低下。因为容量经常按照“分配给服务器、返回到存储池、重新分配”轮回,久而久之,存储池就会变得支离破碎。如果有多个存储系统使用同一个存储池,则更是如此。存储虚拟化(块级和文件级)有助于把现有的可用存储池整合成更庞大的卷,以供新的应用程序使用。

  优秀的存储资源管理(SRM)工具还能识别已分配但并未使用的存储资源。这些孤立的文件或卷可能分配给了不再使用的服务器或虚拟机,但从未返回到存储池。容量还可能映射至无效的主机总线适配器(HBA)或端口全局名(WWN),预留给从未变成现实的未来项目。在理想情况下,这些分配应记录下来,但却常常被人们忽略了。人员流动和企业并购是造成存储混乱的另一个根源,存储系统因这种合并而进入新环境,如果那些“老的”团队没有管理新的存储资产,那么,这些孤立的数据很可能驻留在这些系统上。

  一些独立的SRM工具可分析主机与磁盘组、逻辑单元号(LUN)、克隆、镜像和快照等之间的关系,以识别映射或掩码错误以及引起文件丢失的情况。它们还会着重列出环境何时出现了变化、哪些会引起容量丢失等。由于它们是独立的监测解决方案,因此,可针对整个环境来监测,而不是单单针对某一家厂商的单个阵列或一组阵列来监测。

  虚拟服务器

  与物理服务器相比,虚拟环境会导致存储混乱更严重。如果使用虚拟服务器,没有硬件设备,没有支持合同,也没有提醒它们存在或耗用存储资源的物理指标,即使虚拟机在创建、记录及管理时,它们还是会引起存储混乱。由于分配、扩增和停用等正常周期,虚拟机的存储资源会变得与当前需求不一致,所以,必须定期认真考虑支持虚拟服务器环境的资源,才能保持经济高效的运营和优化。

  除了使用可以帮助资源协调流程的独立监测工具外,还可使用服务器虚拟化平台厂商提供的一些工具。有些工具甚至能够在虚拟机的整个生命周期内管理虚拟机,同时不断优化资源。与其他SRM工具一样,与平台独立的虚拟基础架构管理工具能够提供独特的功能。

  自动精简配置

  除了能够识别浪费容量的回收工具外,一些阵列和单独设备还包含自动精简配置技术。当初研发自动精简配置技术是为了解决操作系统或应用程序无力处理容量扩增引起的超量分配问题。通常用户不必为数据库或文件系统的容量扩增后出现的停机时间和复杂性而纠结,添加的存储阵列和设备在构建之初就会留出足够的容量,以满足预期的未来增长。虽然这节省了时间,还确保了存储可用性,但结果会出现大量的闲置容量。

  自动精简配置技术缓解了这个问题,它允许这些应用程序超量认购容量,但不是由存储系统来实际分配。现在很多厂商提供自动精简配置,这项技术为控制一种类型的存储混乱提供了方法,但只适用于新创建的卷,而那些从非精简的存储系统迁移来的数据可能会带来问题。

  在过去,文件删除后,文件系统只是把它们标记为“可以被覆盖”,而存储阵列并没有认识到这一情况,仍认为该容量“被占用”,没有办法回收这些被浪费的容量。因此,数据在创建、修改和删除后,就会出现混乱,久而久之,“瘦”的卷也会“胖”起来。

  自动精简配置技术的新进展已解决了这个问题。文件被删除后,系统会运行实用程序,实际上是把一连串“零”写到那些被删除文件的位中。然后,卷拷贝到具有“零块检测”功能的阵列后,零块被剥离,形成一个瘦的卷。对许多环境来说,这就需要额外的维护步骤,但这能发现被浪费的容量,从而节省费用。

  作为这项技术的改进之处,能够识别瘦卷的文件系统实际上能自动挑出被删除文件的块,然后与存储阵列联系,确认这些块,以便回收。使用通用的应用编程接口(API),其自动化过程就会带来一种方法:让瘦卷保持瘦,减少存储混乱,又不会给存储管理人员增添工作量。尽管众多存储厂商支持零块检测,但只有少数厂商开发了支持可识别瘦卷的文件系统的API。

  不同的存储厂商使用不同的块大小,块越小意味着零块检测越有效,所节省的容量越大。此外,执行这些功能所需的处理过程会影响性能,其具体取决于在何处执行。一些厂商用软件来实现,把负担扔给了阵列处理器,另一些厂商则使用专用集成电路(ASIC)。

  重复数据删除

  存储环境出现混乱的另一个原因是,创建重复的文件和数据集。备份可能是这方面的根源,其他数据保护流程也有可能产生重复数据,比如灾难恢复。虚拟机映像可能含有大量的重复数据,因为它们通常是由同一组模板创建而成的。微软Office等用户应用程序也会生成内容与其他用户创建的文件非常相似的文件。

  重复数据删除当然能减少备份和灾难恢复流程中的重复数据量,并在随后的备份中也保持这些精简的数据集。重复数据删除技术现在也应用于非备份应用环境,比如归档和二级存储,这有助于缓解浪费容量的情况。

  虚拟化系统

  确认及找出这些孤立的文件或一块块无法使用的存储空间是第一步,只有将其收集起来之后才可以重复使用。专用磁盘阵列通常拥有卷管理实用程序及其他工具,进行收集工作。但如果使用多家厂商的存储平台,或者需要额外功能(如自动精简配置和重复数据删除功能),基于块或基于文件的存储虚拟化设备也许是解决之道。这种“与存储无关”的解决方案可以缓解混乱,同时便于跨多个平台整合已回收的容量。

  混乱现象在IT领域司空见惯。在存储系统,混乱无序可能表现为:由于为了应对不断变化的日常运营,系统不断添加、重新配置及停用,久而久之,可用容量减少、性能下降。效率低下的存储分配、丢失或遗忘的预留容量以及数据对象的重复会日积月累,即便在组织管理极其有序的环境下也在所难免。虽说存储阵列拥有有助于遏止这种浪费的工具,但常常要采用其他方法。自动精简配置、重复数据删除和先进的存储基础设施管理解决方案等技术有助于解决这个问题。最后,存储混乱现象还是会发生,但合适的工具加上一点预防性维护应该有助于避免出现不可收拾的场面。

  存储混乱天天都会产生,所以应使用专门识别这类情况的工具,将其列入常规预防性维护的一部分。

  自动精简配置技术

  自动精简配置是指对于一项应用,系统会在磁盘上为该应用分配一定量的空间,但实际上只有应用需要时,才真正使用这部分空间。这好比银行的账面存款超过银行实际拥有的现金一样。自动精简配置技术并不缩减总的数据占用空间,但可以推迟购买更多的磁盘,只有绝对必要时才购买。自动精简配置让存储系统能够在任何的特定时间,支持比物理存储容量允许的更多的应用程序。

1
3