不想错过重要资讯?
马上订阅新闻邮件!
 
a 您现在的位置: 中计在线 >> 存储 >> 存储技术 >> 文章正文
全方位数据查询不是梦
作者:CommVaul…    文章来源:中计在线    更新时间:2007-9-26 10:16:27
【字体:
 中计在线信息化频道全心上线!全力推动中国信息化进程!信息决策,易如反掌,尽在CIW信息化!
央行近期将收编草根网上支付
·外电称中国厂商生产的iPhone配件已上市
·微软将澄清XP停产传闻
·惠普再次超戴尔成全球最大电脑商
·第八届中国信息安全大会
·英特尔2007春季IDF专题

全方位的信息查询是建立在一体化信息管理基础上的,如果没有一体化信息管理的依托,所谓全方位信息查询就成了无稽之谈。

图1一体化搜索平台的配置架构

今时今日,众多企业在数据管理中面临的主要挑战之一是如何从海量数据中获得更多的价值,尤其是企业自身一点一滴辛苦积累起来的数据。为了应对这个问题,近年来,很多公司都在信息技术系统上进行了巨额投资。可惜,在很多情况下,种瓜未必得瓜,不菲的投入并未给企业带来应有的回报。

找数据难

笔者是一名系统工程师,平时经常帮助企业规划存储系统,对这一点深有感触。尽管有的企业在IT建设上投入了大笔资金,可随着业务量和数据量的逐年增大,这些企业内部却出现了数据混乱的局面:谁也不知道整个公司的信息系统中存放了多少数据,这些数据又具体存在哪个系统,其中又有多少数据间存在冲突……至于是否存在未经授权就使用数据的情况就更不得而知了。IT经理们也经常抱怨:“企业内部的数据越来越多,每个信息系统里都有大量的数据,但若要从这些系统里寻找想要的数据,则难如大海捞针。”花了大价钱进行IT系统建设,到头来却出现找不着信息的尴尬局面,不能不引起深思。

众所周知,随着知识经济的发展,信息管理的重要性日益突现,信息管理的基本点有两个方面:一要保护好数据,二要能及时方便地搜索到所需信息,假如能够做到及时,就意味着你有可能比别人更先知先觉,因为你比其他人能更快更早地找到信息。

我们都已经习惯在网上用Google来查询一些资料,只要简单输入关键字,就能得到相关的信息。可是当我们面对生产系统或备份数据时,就没那么幸运了。经常会遇到这样的问题:当需要查询某一文档时,既不知道文件名,也不知道文件产生的时间,只知道文件的内容,在这种情况下,怎么查呢?如果该文档还存在于在线系统中,也许还有办法,如果该文件在某个离线的磁带中,也许就更不好办了。传统的数据管理系统是没办法处理这种问题的。

新一代的数据管理软件使解决这一难题出现了希望的曙光。其实,只要对在线数据和离线数据建立内容索引,通过内容索引,用户就能查询到在线数据、离线备份数据、归档数据副本中的文档。表面上看,这种技术并不复杂,但真要实现这一功能却并不容易。原因是我们面对的是海量的非结构化数据,再加上多种文件格式,如Word、PDF、Excel等,还要考虑到多个版本。如此种种,事情就没那么简单了。

突破两个关键点

要想实现全方位的内容查询,有两点关键技术必须突破:一是要有高效的、针对海量数据的全文索引,另一方面就是要能对不同介质的存储进行虚拟化管理。目前,主流的存储介质有三类:磁盘、磁带和光盘,以这些介质构成的存储设备的特性是不一样的。在多层存储架构中,我们会用磁盘来做近线存储,数据保留周期在一年以内;通常会利用磁带来做离线存储,数据保留周期在三至七年;利用光盘来做归档存储,数据保留永久。在这种分层的存储架构下,数据因时间的推移会被迁移,因此内容索引机制不仅要能跟踪数据的迁移,而且对数据的存取也必须能跨越不同的存储,也就是说能对存储进行虚拟化管理。用户只需要利用逻辑的查找界面,就能发现并读取所需要的数据和文件,而不必关心数据存放在何种介质的设备上。

信息是以各种类型的数据进行存储的,数据的类型主要有文件、邮件以及数据库。而存放这些数据的介质可分为在线和离线两大类。在线数据就是我们生产服务器上的各种文件系统、邮件系统及数据库系统中的数据,而离线数据就是备份数据和归档数据。传统的搜索工具主要针对在线数据进行搜索,而对离线数据的搜索几乎没有太多的解决方案

一体化搜索

无论是当前数据还是历史数据,无论是在线存储还是离线存储,无论是复制数据、备份数据还是归档数据,全方位的内容查询就是能对不同应用软件产生的不同格式的数据进行全方位查询。这是一个美好的目标,堪称数据管理的更高境界。要实现这一目标,也就是要实现在线数据、归类数据和备份数据的一体化搜索,必须构建一体化搜索平台。

一体化的搜索平台主要包括以下几个主要部分。

内容索引服务群,这是多台服务器构成的集群,提供高效的并行运算。这是个高度灵活的配置,小系统可采用一台服务器,对大系统可采用多台服务器

能对备份数据、归档数据进行内容索引。这些数据可以存储在任何介质中,如磁盘、磁带或光盘。

在线连接策略,通过策略对在线数据做定时的内容索引。在线策略的优势是能及时提供新的变化的内容信息,缺点是对在线服务器的压力较大,会影响生产系统的效率。

离线连接策略是利用备份系统的功能来实现的。因为在线系统每天都需要做备份,在线数据的副本就会存放在离线介质中,这样只要对离线数据进行内容索引,而不需对在线数据进行内容索引。这种策略的优势是对生产系统影响很小,缺点是实时性会降低。

Web搜索服务器。利用Web界面来进行搜索操作,用户和法规小组能通过Web来访问内容索引,操作方式类似于利用Google进行搜索。

系统管理对整个搜索进行配置、监控和管理。

全方位的内容索引平台,能提供下列功能。

●基于角色的Web界面,对普通用户和具有特权的法规用户分别提供具有不同功能的操作界面。

●与AD SSO集成,进行用户权限管理,用户只能搜索访问有权限访问的数据。

●能将查询结果保存到虚拟的文件夹或指定的数据文件中,也能在查询界面中恢复离线数据,并进行浏览。

●能在搜索结果中进行再搜索,并对搜索结果进行过滤。

●能与Outlook进行集成,搜索在线、备份和归档的邮件。

●能生成搜索系统管理、工作状态报告。

全方位的信息查询是建立在一体化信息管理基础上的,如果没有一体化信息管理的依托,所谓全方位信息查询就成了无稽之谈。一体化信息管理可用图2来简单描述,通过一个单一的管理软件对不同类型的数据进行统一的管理。要实现统一的数据管理,必须要对多种类型的存储设备进行单一、虚拟化的管理,在此基础上提供多种方式的数据管理,例如备份、恢复、归档、复制、快照等。统一的数据管理能对在线、离线数据建立统一的索引,快速定位任何数据副本所在的物理位置,不管该文件是在磁盘或磁带上。有了统一数据管理的基础,对在线、离线的数据建立统一的内容索引,就能实现全方位的数据搜索。

CommVault今年8月刚刚发布的新一代数据软件Simpana 7.0,新增了全方位数据查询这一卓越功能,填补了业界的空白。这一功能主要为两类用户设计:从事法律调查取证的专业用户,以及一般的企业用户。针对两者不同的管理权限,Simpana 7.0通过两种截然不同的方式帮助客户从杂乱的“故纸堆”中立刻找到所需信息。

法规遵循用户搜索——以往要从庞大的数据集中找出蛛丝马迹,对于从事法律调查取证的用户来说,这是最令人头痛的。Simpana 7.0的出现让这一问题迎刃而解。在一个统一的界面上,特许用户获得高级数据访问权,通过迅捷的数据查找,大大提高了搜索备份和存档数据的能力,从而能积极响应各类政策法规的调查取证要求。

企业用户搜索——使用CommVault的自助搜索功能,用户通过一个类似Google的搜索界面,就能立即使用原本被锁定于备份或存档副本中的数据。键入一个关键词或短语,所有与关键词有关的搜索结果条目在几秒之内呈现出来。

图2 一体化信息管理

责任编辑:杜菲
  • 上一篇文章:
  • 下一篇文章: 没有了
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
     相关文章
    没有相关文章
     相关评论
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    用户名:
    · 您将承担一切因您的行为、言论而直接或间接导致的民事或刑事法律责任
    · 留言板管理人员有权保留或删除其管辖留言中的任意内容
    · 本站提醒:不要进行人身攻击与无聊谩骂。谢谢配合。
    热门文章
    最新推荐