NetBackup 7.5:放下磁带,才能走得更远?存储与灾备

2012-04-11    来源:比特网    
首先,笔者想澄清一下本文的标题:放下磁带,不代表最近推出的新版本赛门铁克NetBackup 7.5软件不再支持磁带(当然也不太可能这样),也不代表NetBackup原有针对磁带的功能特性有什么弱

首先,笔者想澄清一下本文的标题:“放下磁带”,不代表最近推出的新版本赛门铁克NetBackup 7.5软件不再支持磁带(当然也不太可能这样),也不代表NetBackup原有针对磁带的功能特性有什么弱化。只是磁盘在数据保护领域正扮演着越来越重要的角色,特别是备份应用;而未来若干年中磁带仍将在海量数据归档、不活跃数据长期保存等方面发挥其价值

在讨论NetBackup 7.5在虚拟化以及磁盘支持等方面的新特性之前,我们先提一段小“插曲”,在本月IDC公布《2011年第四季度IDC季度存储软件跟踪》的新闻中,前3名EMC、IBM和赛门铁克的市场份额分别为25.7%、19.8%和15.4%。当时这个令笔者有点意外,因为在之前的很长一段时间赛门铁克都排在第2位,而上季度一下就落后IBM这么多?

随后来自国外媒体的一篇报道解释了其中缘由:IDC的那个新闻稿与完整报告中的统计数字有出入,应该是前者出现了错误,实际情况应该是赛门铁克—15.4%和IBM—14.2%。

IDC统计的存储软件市场包括存储设备管理、数据保护备份和归档软件等7个功能性市场。我们认为EMC排名第一与他们在存储硬件上的业绩是分不开的,EMC自称拥有市场排名第三的备份软件(Netwoker),IBM的Tivoli Storage Manager(TSM)有可能是第二,而第一应该就是赛门铁克全功能跨平台的NetBackup。再加上主要支持Windows环境并强调易用性的Backup Exec,赛门铁克在备份软件方面的占有率应该还是最高的。

永久增量——适合磁盘时代的备份方式

上面的小标题如果换一种方式,也可以说全备份和增量备份是磁带时代的产物。不知大家对这种说法是不是都认可,接下来请看一下我的解释是否有道理?对于存储备份领域的专家和赛门铁克NBU的用户来说,笔者在此可能有点班门弄斧了。

首先,初始的全备份很好理解,而当过了一段时间数据有不同程度改变之后,按照传统的备份方式用户通常有两种选择:再次全备份和增量备份。选择前者将会重新备份整个数据集,即使有了重复数据删除技术之后,很多情况下还是需要将生产服务器/被保护主机上的全部内容通过网络再次发送至备份软件介质服务器(如果是源端重复数据删除或者在快照功能上与NetBackup集成的阵列,应该不需要传输冗余数据),尽管减少了备份占用的磁盘空间,但备份时间不见得会缩短,处理资源和网络带宽可能也没有节省。

那么,增量备份只会对全备份之后新增加或者改变的数据进行操作,这样就避免了上述反复全备份的一些问题。不过,增量备份在进行恢复到某一个时间点时,必须先恢复全备份,然后按顺序逐个恢复该备份时间点之前的所有增量。如果其中有任何一个失效,恢复就会失败。因此,很多用户都是每周至每个月做一次全备份,其间每天进行增量备份。

再来看一下备份介质。磁带不具备像硬盘移动磁头那样的随机数据访问能力,因此备份、归档软件等对磁带的访问方式通常都是顺序流式读写。LTO-5规范的LTFS文件系统中索引分区的出现对媒体等行业有所帮助,但无法改变磁带本身固有的特点。

对于传统的全备份和增量备份来说,一盘或者多盘磁带连续写入/读出正好符合这样的访问规则。不过到了磁盘时代,如果用户不需要多个恢复时间点的话,原有全备份+增量备份的的方式似乎就不太适合了。

我们认为这就是CommVault、飞康等新兴的数据保护软件厂商力推磁盘解决方案的原因。飞康CDP(连续数据保护)的工作原理类似于建立在精细粒度快照基础上的备份,在一些情况下能够实现很小的RTO(恢复时间目标)和RPO(恢复点目标),这种方式利于实现数据的高可用和容灾。不过根据笔者进行过的测试,完全同步的CDP依赖于网络带宽和备份存储性能,会不同程度的影响生产存储性能(需要等待备份存储也写入返回ok),特别是在通过WAN进行复制时。因此实际使用更多的应该为15分钟左右的异步CDP。

也就是说,备份和CDP仍然各有各的市场。另一种产品——VTL(虚拟磁带库)则是过渡的产物,它无法充分发挥磁盘随机访问的能力。就像有的业内人士所说:磁带备份时代领先厂商的产品系列,比如CA ARCserve、被EMC收购的(Legato)Netwoker、IBM Tivoli Storage Manager(简称TSM),可能还有赛门铁克Veritas,有些不愿放弃原来在磁带设备支持上的“遗产”,希望凭借这个门槛继续赚钱,而不想一下子转向磁盘备份。

但历史的车轮终究是阻挡不住的。随着EMC和NetApp对Data Domain的竞购大战,支持重复数据删除的磁盘备份存储硬件开始受到人们的关注,就连戴尔这样磁带产品线完全OEM自别人的厂商,也利用收购自Ocarina的数据精简技术推出了DR4000产品线。尽管IBM重复数据删除的ProtecTIER系列只是VTL而没有支持OST(赛门铁克OpenStorage API)或者NAS协议,但其TSM软件却比较早的加入了“永久增量”(或称累积备份、合成备份)功能。类似的还有CA Technologies公司(原名CA)在前年、去年推出的ARCserve D2D和ARCserve Backup r16。

赛门铁克NBU 7.5中的NetBackup Accelerator其实也是一种永久增量技术。“只需单击一下即可执行完全备份,其速度和成本与增量备份的相当,同时还不会影响到完全备份的快速恢复。”

对于永久增量原理,笔者是这样认识的:既然备份保存在磁盘上,那么它就是文件系统中的一个/多个对象或者类似的存放形式,而与备份数据相关的文件系统、目录索引等元数据信息也包括在其中。那么当采用新技术的“增量备份”执行时,就可以将变更数据像在被保护系统上生成的过程那样,重复应用到备份存储上,这样就和再次全备份的效果相同了。

虚拟机备份、源/介质服务器/目标端去重  

由于服务器和桌面虚拟化的广泛应用,备份软件对虚拟机的支持情况也成了竞争中关键的一点。这个时代催生了一些新兴的数据保护软件厂商,比如Veeam Backup,还有近期被戴尔收购的AppAssure等。同时他们也向该领域中原有的巨头发起挑战,赛门铁克等又是如何应对的呢?

上表引用自赛门铁克NetBackup 7.5官方资料

第一次看到V-Ray这个名词,笔者首先联想到X-Ray(就是我们在医院里拍的X光片)。赛门铁克称其V-Ray技术“具备X射线般敏锐的可视性,能够深入识别VMware VMDK和Hyper-VVHD文件,无需复制或者装入数据,即可实现真正意义上的精细恢复。”  

根据上面的表格,可以总结出虚拟机备份几个方面的关键功能支持,这些衡量标准不仅适用于NetBackup:

1. 通过一次性备份进行两种类型的恢复:单个文件以及用于灾难恢复的完整虚拟机映像。

2. 与VMware vStorage API for Data Protection(VADP)和Microsoft Hyper-V的集成,消除虚拟机上备份处理的开销。通过脱离主机在Hypervisior管理器层面执行备份操作,应用程序的运行速度不受影响,而且无需在每台虚拟机上维护和升级代理。

注:关于以上说法,笔者认为主要是针对虚拟机文件系统和单个文件的备份及恢复。对于应用程序数据,像微软Exchange Server邮件服务器这样支持VSS(Volume Shadow Copy Services卷映像拷贝服务)“快照”静默的可以不用安装代理,而那些不支持VSS和VADP并对数据一致性要求高的的应用还是建议安装NetBackup的备份代理。

3. 在虚拟机恢复在线状态时自动发现、识别和保护虚拟机,不论这些是新的、克隆的还是从其他位置迁移来的虚拟机,而无需编辑备份策略。

4. 从单一界面提供跨物理和虚拟环境的重复数据删除功能。

此外,赛门铁克还为“内置重复数据消除功能提供了灵活的选项。不论是在源位置、介质服务器还是目标硬件设备”,见下图:

上图引用自赛门铁克NetBackup 7.5官方资料

左侧的“1”部分代表运行在备份代理上的“源端重复数据删除”,精简后的数据经过网络传输可以节约带宽,但会占用一定的被保护主机CPU、内存处理资源,不适合在那些对性能较为敏感的生产服务器上使用。  

中间的“2”部分是运行在NBU介质服务器上的重复数据删除,这里的服务器硬件即可以使用第三方的,也可以从赛门铁克购买软硬件打包的NetBackup 5200系列产品。该类方案能够搭配各种普通的DAS/SAN/NAS磁盘存储,而不再需要像EMC DD、昆腾Dxi那样的专用硬件。

右边“3”部分的NetBackup 5000系列,相当于在NBU 5200上集成了存储单元,组成与备份软件一体的“目标端重复数据删除”方案。通过不断增加硬盘扩展机箱,其容量能够从16TB扩展到192TB以上。

NetBackup版本对照

对于NBU的三种版本,相信很多人早已不陌生了。NetBackup Starter Pack、NetBackup Server和NetBackup Enterprise Server分别针对中小企业、中型企业和大型企业,其中前两者都是客户端+介质服务器的2层架构,只有Enterprise Server是3层架构(增加了Master Server);NBU Starter Pack的客户支持数量有5、20和40三种,而另外两种版本无限制;可用代理和选件方面,只有NBU企业版支持Shared Storage Option(共享存储选项)和Enterprise客户端;另外,Starter Pack捆绑了服务器、客户端、磁带驱动器和数据库代理,而两种Server版本是需要单独购买的。

1
3