Dan Rose 是 Coatue Management 旗下的早期阶段风投基金 Coatue Ventures 的主席,曾在 Facebook 和亚马逊效力了 20 年。这位亚马逊前高管描述了 2000 年初亚马逊从 Sun 服务器改用 HP/Linux 服务器,此举面临使公司差点破产的风险,并为后来的 AWS 奠定了基础!他在 Twitter 上介绍了始末,现将推文内容翻译如下:
2000 年互联网泡沫破灭时,我供职于亚马逊。资本市场突然枯竭,而当时我们每年要烧掉 10 亿美金。我们最大的一笔支出是数据中心成本,确切地说是成本高昂的 Sun 服务器。我们花了整整一年的时间来丢弃 Sun 服务器,并换成 HP/Linux 服务器,这套系统后来成为了 AWS 的基础。故事梗概如下:
1999 年我进入亚马逊后的第一周,在电梯里见到了 Sun 掌门人 McNealy 前往亚马逊老大 Bezos 的办公室。Sun Microsystems 是当时全球最有价值的公司之一(最高市值超过 3000 亿美元)。那年头,购买 Sun 产品就像购买 IBM 产品:“没有人因此而被解雇。”
我们公司的口号是“快速壮大起来”。网站的稳定性至关重要——每停机一秒钟会损失庞大销售额,于是我们投入巨资以维持网站正常运行。Sun 服务器是最可靠的服务器,因此尽管 Sun 的专有架构成本高昂且极具黏性,但当时所有的互联网公司都使用其服务器。
2000 年,随着风投资金支持的初创公司纷纷关门大吉,全新的 Sun 服务器开始以大甩卖的价格出现在 eBay 上(那是在 AWS 出现之前,用户不得不自建数据中心)。亚马逊原本可以与 Sun 达成更好的协议,但是 Jeff 却选择了一种更为激进的方法。
那时亚马逊的首席技术官是 Rick Dalzell,他的老东家是咄咄逼人的沃尔玛。他指导整个工程技术部门把 Sun 换成了 HP/Linux。
Linux 内核于 1994 年发布,同年 Jeff 创立了亚马逊。六年后,我们将全公司押宝于此,当时这是一种新颖而冒险的做法。
转型期间产品开发陷入停顿,我们的所有新功能“冻结了”一年多。我们面临严重积压,但在我们完成了向 Linux 转型的工作之前没有交付一项新功能。我还记得一次全体会议,其中一位技术工程副总裁展示了一张蛇吞老鼠的图片。
而同时,收入增长出现了减速,于是我们又不得不提价以减慢烧钱速度。这是恶性循环,我们不仅烧光了钱,还花光了时间。当时,亚马逊濒临破产的边缘。
但是,一旦我们开始向 Linux 转型,就再也没有回头路了。所有人动手重构代码库,更换服务器,为系统切换做准备。如果切换成功,基础设施成本有望骤降 80% 以上。而如果失败,网站将崩溃,公司将消亡。
所幸我们最终还是及时且顺利地完成了转型。对于整个工程团队来说,这是了不起的成就。网站正常运行起来,没有任何中断。资本支出一夜间大幅缩减。我们突然有了一套可以无限扩展的基础架构。
随后发生了更有意思的事情。作为一家零售商,我们始终面临很强的季节性,每年 11 月/12 月的访问量和收入都会激增,而全年大部分时候处于空闲状态。Jeff 于是开始思考这个问题:我们每年有 46 周拥有所有这些多余的服务器容量,干嘛不出租给其他公司呢?
大概在同一时间,Jeff 还对分离内部依赖关系颇感兴趣,那样一个团队可以在不受其他团队约束的情况下构建系统。实现这种松散耦合模式所需的架构变化于是就成了 AWS 的 API 原语(API primitives)。
对 AWS 来说,这些是基本的真知灼见。我记得 Jeff 在全体会议上发言,他以电网为例阐述了这个想法。1900 年,一家公司非得建造自己的发电机才能开张营业。2000 年的公司为什么非得建造自己的数据中心呢?
即使没有 AWS,云基础设施最终也会出现(这就好比即使没有特斯拉,电动汽车也会出现),但是多久后才会出现?因此面临怎样的机会成本?在 AWS 大大降低了开办公司的成本之后,创新呈爆炸式增加,现代风投生态系统随之诞生。
亚马逊在 2000 年至 2003 年差点儿完蛋。但是如果没有这场危机,这家公司不太可能会做出艰难的决定,从而转而采用一种全新的架构。而如果没有这种转型,AWS 可能永远不会问世。所以千万不要浪费实则蕴藏机遇的危机!
亚马逊最近花了数年时间来淘汰 Oracle 数据库系统,很少有公司尝试过这么做。干苦活要有肌肉,而干苦活可以使肌肉变得更结实。最优秀的公司将每一次挑战视为机遇,并将这种思想深深地融入到其企业文化中。
共有 0 条评论