从生死边缘到技术上的救世主

1999年,由于无法保证网站的正常运行,eBay被逼到了生死边缘,它急需一位有工程师背景的高人来帮它做一件前所未有的壮举:以超过摩尔定律的速度延伸公司的基本结构。在过去的50年里,以英特尔公司高登·摩尔(Gordon Moore)命名的摩尔定律准确地描述了硬件发展的轨迹:芯片上晶体管的数量每两年翻倍一次。在实际生活中,这便意味着作为计算机硬件大脑的微型芯片在速度和性能翻倍的同时,其体积也会缩小至原来的1/2。而对于eBay来说,现有的硬件设备已经无法满足自身高速成长的需要。它已经使用了太阳微系统公司所能提供的最大的主机,它的数据库服务器也已经接近其物理体积增长速率的最大限度。

与此同时,eBay的用户大军也开始将矛头对准公司,并纷纷迁移到其他拍卖网站上去。市场也狠狠打击了eBay的股价。经过工程师们21个小时的奋力抢救后,eBay的股价已经从截至停机前最后一笔拍卖进行时的180美元下泻了将近50美元。等到网站恢复之后,股价已变成136美元,市场资本缩水近50亿美元。面对这段让eBay“濒临死亡的经历”,CEO惠特曼不顾让她下台的呼声,命令自己手下400名雇员给所有用户打电话为已经造成的不便表示歉意。

“这种做法让公司放下了架子,”惠特曼告诉《今日美国》的记者,“我们有火箭飞船般的发展速度……这样的做法打消了员工们‘呵,我们多特别啊’的想法,对公司的文化有很大的益处。”

由于公司将主要精力都放在了扩大规模和用户体验上,基础结构的问题被忽视了。现有的基础结构不仅无法稳定地满足应有的需求,更不用说什么冗余系统了——网络内甚至连数据备份都没有建立。由于频繁的停机和故障,整个网站运行起来就像一个颤颤巍巍的老头。为此夜以继日地工作的惠特曼下决心一定要防止这种情况再次发生,并决定另觅一位技术主管。一位猎头曾说过,这个世界上能将eBay拉出泥潭的只有10个人,而她就找到了这么一位:他的名字刚好与“互联网”(web)同音。他就是电脑制造商Gateway的信息部主管梅纳德·韦伯(Maynard Webb)。

从某种程度上来说,韦伯在Gateway上监管的系统要比eBay复杂得多。它不仅需要配置一台由2000个不同零件组装而成的电脑每天生成和发送2.5万份订单,还必须能将制造系统、车间自动化以及供应链管理三者串联起来。设计和维护一个可供用户自行完成电脑配置的网站及终端本身就是一项重大的工程壮举。它必须时刻待命,并能通过系统查询到任何一条订单。不过,运输过程所需的阶段毕竟有限,Gateway完全可以设计出一套自动装置完成整个过程,模拟实时操作。

相比Gateway,eBay的交易过程虽然看似更加简单,其中却包含了大量的随机互动工作。整个网站需要在零失误的环境下实现实时运转。在拍卖过程中,用户时刻都想知道是否有比自己价格更高的出价。这些都必须是实时互动,而数以千万的用户人数更增加了这项工程的难度。更令基础结构难以负担的是,eBay的规模每6个月就会翻一番,日交易量直追纳斯达克。

惠特曼向韦伯许下誓言,表示他在管理eBay发展方向时可以自由使用任意资源。她也愿意向其支付比自己收入更高的薪水:除去45万美元的基本工资之外(是她本人的两倍多),还另加10.8万美元的分红。如果所有工作都能顺利完成,则再追加30万美元的奖金,并允许对方购买eBay50万股债券。

正式就职前3周的一天,还在和妻子看房子的韦伯就接到了通知,得知网站再一次陷入了瘫痪,于是他把砍价的重任留给了妻子,自己独自一人投入了战斗。在躲开了驻扎在eBay圣何塞总部门前的一堆记者后,韦伯找到了正在疯狂寻找事故原因的工程师们。13个小时过后,韦伯和手下的工程师们终于找到了那个让他们出了乱子的罪魁祸首:一个小小的软件故障。

对于一家正在成长中的电子商务企业而言,一个稳定的基础结构必须拥有灵活性、扩展性以及稳定性三种特点。eBay一样也沾不上边。它的整个网络就是用Solaris系统和微软NT服务器东拼西凑而成,布满了无数个单点故障。只要有一个部件出现故障,整个网络就有可能因此而瘫痪掉;如果这项功能又恰好与中央数据库有关,那么由此引发的停机就可能持续数个小时。韦伯要做的第一件事就是找出所有的单点故障——什么才是限制扩张的瓶颈?怎样才能将它们消除掉?“一旦掉进了失败的深渊,你就很难再爬上来,”韦伯说道,“一旦你落后于整个扩张曲线,想再解决掉源源不断的巨大数据、拔得头筹就很困难了。”