当前位置:首页 > 数据应用 > 正文

数据中心——-数字时代的垃圾填埋场

2009-08-06 IT168

       大扫除是一项烦人的工作,你不得不面对因一时懒散或者心血来潮而积攒的大量垃圾,并在整理过程中遭遇隐藏在某些被遗忘的角落里意外惊喜。对于一个多愁善感的人,决定哪些东西必须扔掉哪些东西需要保留的过程更是充满了反复。但和对一个超过100TB的数据中心内存储的数据进行一次清理相比起来,IT部门宁愿天天打扫办公室。

  互联网是人类历史上最大的垃圾场,从早先不断被转载的信息到如今视频共享网站上无数个被重复上传几十次的视频文件,还有无处不在的垃圾邮件,数据垃圾已经成为了网民生活的一部分。企业的处境更为糟糕,数据垃圾像病毒一般肆意增长,吞噬一切。ERP、CRM、BI、SOA这些信息化工具都离不开数据,而企业对于数据的渴望也在剧烈膨胀,似乎拥有越多的数据就拥有越多的信息,却未曾想过那些无用的数据带来只是噪声而已。就拿很多公司的CRM中客户数据来说,由于缺乏事先的计划,用户数据的质量不高且不完整,加上没有长效管理,导致重复的、过期的以及错误的数据不仅占据了大量的数据存储资源,还使得整个CRM的作用大打折扣,不断增长的开支并没有带来多少价值,长此以往数据垃圾像雪球一样越滚越大,将企业拖入不可靠信息的泥沼。

  另一方面在行业规则和法律纠纷的压力下,IT部门的负责人往往倾向于保留所有可以保留的数据。电子邮件首当其冲,它已经成为全球企业内部交流、以及企业与外部(包括客户和商业伙伴)信息往来的最主要方式之一,其数量快速增长,但效率却日益地下。大量的邮件被层层转发和回复之后,变动冗长而难以阅读;垃圾邮件及和工作无关的邮件防不胜防,网络带宽的提升又使得大附件邮件变得普遍,虽然邮件服务器的性能和功能有了长足的提升,但是现有的电子邮件运作体系进行已经到了亟需调整的地步。其次是网络信息安全数据的存储,如上网浏览记录、聊天记录和VoIP通话记录,这里不讨论用户隐私方面的问题,单从数据存储方面来看,历史数据的存储量将是非常惊人的。此外,企业需要管理的数据类型越来越多样化,大量非文本格式的文档如Word和PDF、图片、多媒体资料难以用经济有效的方式进行压缩归档。所有这些通常只是为了归档而存储的数据,在经过简单的处理后就被塞进了数据中心,于是问题被简化成了数据中心的容量不足,而随着存储成本的降低,扩充存储容量的方式显然成为最直接的解决方法,结果就是大量极少用到或不会被用到的数据垃圾被保存在高成本的主存储或者归档系统。正是在这种数据存储策略导致数据中心变成了垃圾填埋场。

  诚然,管理垃圾数据是非常复杂的,涉及到数据辨识、清理、优化等等,而这些工作又是周期性,需要花费时间和一定的人力资源,且不会带来明显的收益,因此常常被忽视。然而,数据的有效存储工作将对公司的业务产生长期和正面的收益,且越早行动收益越明显

  虽然有部分企业意识到了这个问题,但市场上很难找到有效的数据审查和数据垃圾清理的工具。目前,存储厂商更为关心的是使得单位字节的存储成本不断下降,一些最新流行的概念从虚拟化到云存储无不体现了这一趋势。但数据存储中最为重要一条定理是:“数据的质量远比数据的数量重要”。企业为了不断增长的数据而在软硬件上连续投资的做法,实在是一个代价昂贵的错误,而存储厂商是不是也能反思一下呢?
 

大家都爱看
查看更多热点新闻