| 1982年,在超级杯决赛中,旧金山49人队的橄榄球四分卫Joe Montana一记长传,将球传给了队友Dwight Clark,突破对方在达阵区内设的防线,赢得宝贵的6分,整个过程在短短的几秒内一气呵成,却将49人队一举推上了超级杯赛的冠军宝座。后来,这场比赛被载入了美国国家橄榄球联盟的赛事编年册,被称作是“奇迹乍现的一刻”。
谁才是最大的赢家呢?你也许觉得我这个问题问得很愚蠢,当然是旧金山49人队啦,没错,但是,还有一个答案,媒体广告商们。在历界超级杯比赛现场直播期间,决赛的收视率是最高的,因为那是两支最强球队之间的对决。
无论是超级杯的收视率,还是其它各种主流媒体的收视率收听率,这些数字都是由纽约的Nielsen Media Group负责统计的。电视电台的广告部将根据Nielsen提供的数据,来制订广告的收费标准。
“收视率是一项非常重要的商业数据,”Nielsen集团的技术策略副总裁Marty LeFebvre介绍说,“每年,地方电视台和国家电视台的广告收入总额都会超过600亿美元,收视率在其中起着主导性的作用,必须非常准确,一点儿都不能马虎。”
Nielsen采用了一系列的办法来收集原始数据,比如说电话采访、查阅周报等等,不过,最重要的手段仍然是“电视讯号追踪”。每天从凌晨3点~7点,40,000台测量仪器将会连接在电视上,主要是起着转换信号的作用,有些类似计算机拨号上网时使用的modem,它们将会拨通一个中央处理数据中心的电话(电话号码是以1-800开头的,号码可以预先植入DR脚本内)。每个电话的持续时间大约为50秒,电脑将会下载测量仪器每天捕捉到的数据(大约75MB/天)——这些数据包括用户收看电视的时间、收看的频道、每个频率的收视人数统计,等等。
这些都不算什么,真正的难题还在后面。
在有线电视、VCR/DVD、卫星电视、TiVO和互联网还没有得到广泛普及的年代中——收集收视率的数据,相对来说还是挺简单的。当时美国国内只有三套广播电视网络,没有其它娱乐方式可供选择。LeFebvre主要依靠一套直接外挂存储(DAS)系统来存储每天收集到的信息数据。但是,随着各种电视娱乐方式的出现并普及,DAS已经渐渐无法满足急剧膨胀的信息量存储需求了。
“我们对自己的数据库一点儿都不了解。我们公司没有一个人知道我们目前储存的数据量究竟有多少,也不知道我们收集到了哪些类型的信息数据,”LeFebvre说。
于是,公司最终决定更换存储系统,SAN成为我们的首选。据LeFebvre回忆,当时他们是出于6个方面的考虑,才做出了部署SAN的决定:①由专人负责管理;②单个控制点(统一的工作准则和规程);③购置数量大的话,价格可以适当便宜一些;④通过专用接口,将数据传送至网络中央的存储服务器内;⑤高可用性和高性能;⑥更加合理的计划编制。
现在,他们的数据都被统一传送到设在佛罗里达州丹纪丁的数据中心,由Vax/Alpha的小型机服务器集群系统进行接受。然后,这些数据将会被上传给一台大型机,经由两台Brocade 12000主交换机和多台冗余Brocade 3800的解析,最后被传送给SAN服务器。Nielsen选用了不同品牌的小型机服务器(比如说Sun、HDS),负责收集数据;两台StorageTek Powder Horn智能化磁带库(内部架构是由30个通过光纤连接的磁带驱动器组成的),负责备份数据。而真正的数据分析过程则在SAN上完成。
SAN平时处理得最多的数据集就是“前一天晚上的电视收视率”。透过这组数据,媒体公司们就可以知道观众们对前一头晚上推出的电视节日的反响。如果是计算东海岸城市电台的收视率,那么在每天早上7点钟之前就需要集齐所有的原始数据;如果计算美国西海岸城市电台的收视率,需要在晚上11点~凌晨3点之间完成所有原始数据的收集;最后,将所有的数据传送给SAN,在第二天上午得出最终的结果。
现在,Nielsen的客户只需打一个电话,或是通过一个专用网络,或是登陆一个基于Web的界面,就可以查询到前一天晚上的节目收视率了。另外,Nielsen还可以满足不同媒体公司对收视人群的调查要求,提供他们所需的各类数据。比如说,美国西海岸,下午6点,观众年龄介于18~34岁之间,某个节目的收视人数为多少?
除了管理直接为用户提供所需信息的SAN系统之外,LeFebvre和存储小组的伙伴们还需要照料另外三个SAN网络。一个是用于桌面计算,一个是用于运行应用程序,一个是用于扩展SAN。除了扩展SAN之外,第三个SAN网络还有另外一个用途:用于测试不同制造商提供的存储设备在同一个工作环境下的协同性。
自从安装了SAN系统之后,我们就非常清楚每天接收到和送出的数据量究竟有多少了,记得第一次看到这些数字的时候,我们都吓了一跳,Nielsen每个月往磁带库中备份的数据量居然高达110TB——而在2000年,每个月备份的数据量仅有26TB。据LeFebvre预计,未来Nielsen公司收集的数据量将会以60%的年增长率递增。
他认为,从事他们这一行的人,必须非常敬业,否则,再怎么优秀的存储管理系统,也是无法管理好如此庞大的数据量。“我们需要一批热爱本职工作的职员。无论是晚上睡觉前,还是早晨出门散步的时候,他们的心中都会惦记着公司存储数据的事情。而且,还要有敏锐的直觉,在合适的时机合适的场合,使用合适的资料。”
就象Joe Montana将球传给Dwight Clark的那一刻,肯定是非常地清楚Dwight Clark在场上所处的位置——然后在适当的时机将球传出去。如果时间不对,或是场合不对,都不可能得到这场胜利。 |