核心提示:互聯網巨頭的云計算發展史,已被撰寫千遍。
但正史的開場,總會被人為修飾,精彩有余,卻只保留了全盤上的合理,未展露其局部
互聯網巨頭的云計算發展史,已被撰寫千遍。
但正史的開場,總會被人為修飾,精彩有余,卻只保留了全盤上的合理,未展露其局部的不合情之處。
云的誕生,自然也不全是官方語境中的“業務增長,倒逼技術升級”而來。
畢竟決策因人而起,而人不可能永遠理性。
真正起到決定性作用的那一刻,拍板的那一瞬間,需要企業決策者們足夠頭腦發熱,帶著感性、沖動和不合理,簽署下這幾筆改變公司戰略發展方向的文字。
而云計算的前傳,正是由這份感性背后,或是跌宕起伏、或是無心插柳、亦或是不可理喻的故事組成。
網卡冒煙的淘寶與阿里云
談云計算歷史,多半從阿里講起。人們所熟知的是,2006~2009年之間,亞馬遜的AWS初長成,馬云與曾鳴的云計算論道,王堅的加盟,阿里云登上歷史舞臺。
但做云計算這一步棋,并不全是阿里的主動為之、提前規劃。
時間回到2006-2008年初,立項不久的淘寶商城(天貓前身),在公司內部還處于一種“放養模式”——沒資源、沒人管,員工們只覺得本部門不太受待見,根本想象不到自己2008年要經歷怎樣的“地獄模式”。
其實在2007年,淘寶業務便突然開始爆發,到了2008年已經是核爆級別的增長,舊的IT體系已經被逼到崩潰邊緣。據說當時早上八點到九點半之間,時常會出現服務器的處理器使用率,飆升到 98%的情況,離爆棚就差兩個百分點。
這個時間段“渾身是傷”的淘寶,讓一批頂尖技術人才迅速成長起來,例如阿里程序員大牛林昊(畢玄)等人。
多位同時期的淘寶商城技術元老,向雷峰網(公眾號:雷峰網)生動地描繪了當年那些“慘烈”的畫面:
“淘寶在當時是頗為先鋒的業務形態,市面上的技術組件,性能和容量都配不上淘寶。最恐怖的時候是大促,流量洪峰一來,機房里的機器全體宕掉,千兆的網卡‘啪’一下就冒煙。立馬換上一批新網卡,‘啪’一下,又冒煙陣亡了。”
為什么當時的淘寶這么“脆”?在舊的架構里,一切邏輯和流程都非常簡單:業務需求一來就做個系統支撐上線,從沒考慮過什么架構、平臺、冗余。到了新架構出現,平臺整體才得以顯現,后來廣為人知的中臺概念也才在這一階段慢慢沉淀下來。新一代體系直到2013年才真正穩定下來,一路“修修補補”沿用至今。
淘寶是發展最快、問題最多的一個,但出問題的不止淘寶一個,承擔交易結算功能的支付寶、阿里內部的財務系統也連帶著一塊“遭殃”。“早期這里頭的賬,就沒平過幾次”,一位前淘寶員工回憶道。
加上當時也處在淘寶技術架構體系2.0向3.0演進的階段,可以說,整個阿里的技術層面都巨大承壓,堪稱阿里誕生以來最大的一場技術“生死劫”。
“每天從睜眼到閉眼,就是不停地修改,不停地救火。工作剛梳理清楚頭緒,情況又變了,一切得從頭再梳理一遍。凌晨一兩點下班是常態,感覺把一輩子的班都加完了。”該技術元老直言,這是他職業生涯最有成就感同時也最痛苦的一段回憶,項目做到一半,不少同事的情緒已經快要抑郁了,感覺像是在過一條搖搖欲墜的橋,每天背的貨物還越來越重。
毫不夸張地說,這輪“劫數”的出現,才是阿里入局云計算的真正開始。
此后,便是轟轟烈烈的阿里“去IOE”進程,云計算系統“飛天”雛形誕生,“云梯計劃”聚集團上下之力順利實現,一系列勵志故事在阿里云上演。
巨頭的云計算前傳:躲在正史身后的「跌宕起伏」和「不可理喻」
王堅
2009年,阿里云順利度過了大版本升級,飛天系統穩定性表現尚可,但在2010~2012年間,阿里云陷入了停滯,整個部門連續三年在集團內部拿最低分。最廣為人知的一幕是,王堅淚灑年會現場,說:“這兩年我挨的罵甚至比我一輩子挨的罵還多。但是,我不后悔。”
這一表象之下,是稚嫩的阿里云在產品化和商業化上的隱憂。
很多人都認同,阿里云有一群技術“瘋子”,這其實不只意味著他們在技術上有著極高的熱情和造詣,同時也意味著,他們可能不太精通技術之外的事情。
一位與王堅打過交道的天貓前技術專家點評,那個時候的阿里云并非技術能力不行,而是產品化和商業化甚至可以用一塌糊涂四個字來形容,少了一條和業務部門“共情”的腦筋。
這群P9、P10級別的云技術專家們,會隨時打磨自己的系統。從純技術角度來說,精益求精,有問題就早發現早解決,這總是沒錯的——但對業務部門來說,這種沒有事先打過招呼的“隨時打磨”,簡直是災難級別的。
“比如他們會突然上機房,改動兩個參數看看效果,但商家那邊直接就崩潰兩個小時,這已經達到了P0級別事故的標準。如果是在管理嚴格的部門里,早就剝奪股權、讓專家們收拾包袱回家了。”這位專家哭笑不得地說。
進一步對標AWS就會發現,阿里云的產品,從細節到應用再到商業合作漏洞不少,從管理流程上就顯得頗為粗糙,后來阿里云花了一兩年的時間與其他部門共同打磨修改,才形成了今天的產品化水平。
2012年“聚石塔”的上線應用,就是一次典型的阿里云與業務部門攜手共進的成長經歷,某種程度上也可視作阿里云邁向成熟、邁向商業化的里程碑。
早期,大中型商家擁有自己的業務流程模式與IT系統,因此不愿寄人籬下按照淘寶的后臺要求來做商品銷售和管理。這個時候淘寶需要做一個面向大B端的平臺,把大中型商家接進來,形成協同關系。
但這一平臺的首個版本,并不受商家們的認可,被評價為“很技術化,但不懂商業”。
為了抓準商家的痛點,據說團隊把當時杭州的所有腰部以上規模的商家,全部拜訪了一遍。在這個過程中,商家真正的需求才浮出水面:業務發展很快,但IT水平跟不上。
于是,無心插柳下,這一套為商家IT系統和數據做云托管服務的平臺就此誕生,也就是后來的“聚石塔”。
簡單來說,商家只要集中精力做業務,不必耗時處理IT問題,大流量時的IT資源和系統穩定性、訂單履行速度等一系列問題,由聚石塔兜底處理。
過程中需要不少云端資源,淘寶商城順理成章地將阿里云拉進這一項目中。
“如果當時沒有淘寶商城/天貓的幫忙打磨、場景落地,阿里云不一定有今時今日的地位。”一位前阿里老員工如是說。
據統計,2012年的雙十一,就有近七成的天貓訂單順利用上聚石塔。這是一個在集團內部評價頗高的項目,為阿里解決了不少老問題,像是此前很難拿到的各行業供應鏈數據,終于可以沉淀在聚石塔上。這樣一個項目,后來也由王堅接手,阿里云的成長表現可見一斑。
在陸續渡過技術和業務的“生死劫”之后,阿里云在王堅的帶領,以及淘寶的助攻下,逐漸穩步踏上正軌,成為中國云計算的排頭兵。
但正史的開場,總會被人為修飾,精彩有余,卻只保留了全盤上的合理,未展露其局部的不合情之處。
云的誕生,自然也不全是官方語境中的“業務增長,倒逼技術升級”而來。
畢竟決策因人而起,而人不可能永遠理性。
真正起到決定性作用的那一刻,拍板的那一瞬間,需要企業決策者們足夠頭腦發熱,帶著感性、沖動和不合理,簽署下這幾筆改變公司戰略發展方向的文字。
而云計算的前傳,正是由這份感性背后,或是跌宕起伏、或是無心插柳、亦或是不可理喻的故事組成。
網卡冒煙的淘寶與阿里云
談云計算歷史,多半從阿里講起。人們所熟知的是,2006~2009年之間,亞馬遜的AWS初長成,馬云與曾鳴的云計算論道,王堅的加盟,阿里云登上歷史舞臺。
但做云計算這一步棋,并不全是阿里的主動為之、提前規劃。
時間回到2006-2008年初,立項不久的淘寶商城(天貓前身),在公司內部還處于一種“放養模式”——沒資源、沒人管,員工們只覺得本部門不太受待見,根本想象不到自己2008年要經歷怎樣的“地獄模式”。
其實在2007年,淘寶業務便突然開始爆發,到了2008年已經是核爆級別的增長,舊的IT體系已經被逼到崩潰邊緣。據說當時早上八點到九點半之間,時常會出現服務器的處理器使用率,飆升到 98%的情況,離爆棚就差兩個百分點。
這個時間段“渾身是傷”的淘寶,讓一批頂尖技術人才迅速成長起來,例如阿里程序員大牛林昊(畢玄)等人。
多位同時期的淘寶商城技術元老,向雷峰網(公眾號:雷峰網)生動地描繪了當年那些“慘烈”的畫面:
“淘寶在當時是頗為先鋒的業務形態,市面上的技術組件,性能和容量都配不上淘寶。最恐怖的時候是大促,流量洪峰一來,機房里的機器全體宕掉,千兆的網卡‘啪’一下就冒煙。立馬換上一批新網卡,‘啪’一下,又冒煙陣亡了。”
為什么當時的淘寶這么“脆”?在舊的架構里,一切邏輯和流程都非常簡單:業務需求一來就做個系統支撐上線,從沒考慮過什么架構、平臺、冗余。到了新架構出現,平臺整體才得以顯現,后來廣為人知的中臺概念也才在這一階段慢慢沉淀下來。新一代體系直到2013年才真正穩定下來,一路“修修補補”沿用至今。
淘寶是發展最快、問題最多的一個,但出問題的不止淘寶一個,承擔交易結算功能的支付寶、阿里內部的財務系統也連帶著一塊“遭殃”。“早期這里頭的賬,就沒平過幾次”,一位前淘寶員工回憶道。
加上當時也處在淘寶技術架構體系2.0向3.0演進的階段,可以說,整個阿里的技術層面都巨大承壓,堪稱阿里誕生以來最大的一場技術“生死劫”。
“每天從睜眼到閉眼,就是不停地修改,不停地救火。工作剛梳理清楚頭緒,情況又變了,一切得從頭再梳理一遍。凌晨一兩點下班是常態,感覺把一輩子的班都加完了。”該技術元老直言,這是他職業生涯最有成就感同時也最痛苦的一段回憶,項目做到一半,不少同事的情緒已經快要抑郁了,感覺像是在過一條搖搖欲墜的橋,每天背的貨物還越來越重。
毫不夸張地說,這輪“劫數”的出現,才是阿里入局云計算的真正開始。
此后,便是轟轟烈烈的阿里“去IOE”進程,云計算系統“飛天”雛形誕生,“云梯計劃”聚集團上下之力順利實現,一系列勵志故事在阿里云上演。
巨頭的云計算前傳:躲在正史身后的「跌宕起伏」和「不可理喻」
王堅
2009年,阿里云順利度過了大版本升級,飛天系統穩定性表現尚可,但在2010~2012年間,阿里云陷入了停滯,整個部門連續三年在集團內部拿最低分。最廣為人知的一幕是,王堅淚灑年會現場,說:“這兩年我挨的罵甚至比我一輩子挨的罵還多。但是,我不后悔。”
這一表象之下,是稚嫩的阿里云在產品化和商業化上的隱憂。
很多人都認同,阿里云有一群技術“瘋子”,這其實不只意味著他們在技術上有著極高的熱情和造詣,同時也意味著,他們可能不太精通技術之外的事情。
一位與王堅打過交道的天貓前技術專家點評,那個時候的阿里云并非技術能力不行,而是產品化和商業化甚至可以用一塌糊涂四個字來形容,少了一條和業務部門“共情”的腦筋。
這群P9、P10級別的云技術專家們,會隨時打磨自己的系統。從純技術角度來說,精益求精,有問題就早發現早解決,這總是沒錯的——但對業務部門來說,這種沒有事先打過招呼的“隨時打磨”,簡直是災難級別的。
“比如他們會突然上機房,改動兩個參數看看效果,但商家那邊直接就崩潰兩個小時,這已經達到了P0級別事故的標準。如果是在管理嚴格的部門里,早就剝奪股權、讓專家們收拾包袱回家了。”這位專家哭笑不得地說。
進一步對標AWS就會發現,阿里云的產品,從細節到應用再到商業合作漏洞不少,從管理流程上就顯得頗為粗糙,后來阿里云花了一兩年的時間與其他部門共同打磨修改,才形成了今天的產品化水平。
2012年“聚石塔”的上線應用,就是一次典型的阿里云與業務部門攜手共進的成長經歷,某種程度上也可視作阿里云邁向成熟、邁向商業化的里程碑。
早期,大中型商家擁有自己的業務流程模式與IT系統,因此不愿寄人籬下按照淘寶的后臺要求來做商品銷售和管理。這個時候淘寶需要做一個面向大B端的平臺,把大中型商家接進來,形成協同關系。
但這一平臺的首個版本,并不受商家們的認可,被評價為“很技術化,但不懂商業”。
為了抓準商家的痛點,據說團隊把當時杭州的所有腰部以上規模的商家,全部拜訪了一遍。在這個過程中,商家真正的需求才浮出水面:業務發展很快,但IT水平跟不上。
于是,無心插柳下,這一套為商家IT系統和數據做云托管服務的平臺就此誕生,也就是后來的“聚石塔”。
簡單來說,商家只要集中精力做業務,不必耗時處理IT問題,大流量時的IT資源和系統穩定性、訂單履行速度等一系列問題,由聚石塔兜底處理。
過程中需要不少云端資源,淘寶商城順理成章地將阿里云拉進這一項目中。
“如果當時沒有淘寶商城/天貓的幫忙打磨、場景落地,阿里云不一定有今時今日的地位。”一位前阿里老員工如是說。
據統計,2012年的雙十一,就有近七成的天貓訂單順利用上聚石塔。這是一個在集團內部評價頗高的項目,為阿里解決了不少老問題,像是此前很難拿到的各行業供應鏈數據,終于可以沉淀在聚石塔上。這樣一個項目,后來也由王堅接手,阿里云的成長表現可見一斑。
在陸續渡過技術和業務的“生死劫”之后,阿里云在王堅的帶領,以及淘寶的助攻下,逐漸穩步踏上正軌,成為中國云計算的排頭兵。