題圖 | 視覺中國
今日,年輕人們已經很難想象過去的互聯網“宕機”的窘迫。
2010-2016年,由於智能手機和移動互聯網的快速普及,中國互聯網行業曾陷入了一波被“擠兌”的風潮。
比如早年的“雙11”,一旦跨越零點,整個淘寶都會出現明顯的卡頓,甚至是進不去購物車、無法結算。
2011年上線的鐵路線上購票平臺12306,同樣是大家擠破頭的重點目標,每逢節假日、寒暑假,12306就屢屢宕機,以至於當時的官方都建議旅客們“繞道”打電話買票。
10多年時間眨眼過去,“宕機”成了稀客。
“雙11”的銷售額在13年間,已經翻了10000倍,峰值訂單量更是從最初的400筆/秒,增長到了超過58.3萬筆/秒,換算過來增長了近1500倍,大幅的交易量增長,對應的是愈發平穩的使用體驗,連卡都不卡,更別提宕機了。
12306也一改往日模樣,將訪問流量切到阿里雲後,肩負著全年峰值近40億次旅客的購票任務,通過穩定且高效的服務,有效支撐了中國鐵路系統高鐵化的進程,也由此拉動了許多地區的經濟發展。
體驗順滑的互聯網,就像即插即用的電力、擰開水龍頭就流出的自來水一樣,正在成為生活司空見慣的一部分。這些生活中最常見的應用背後,都是雲計算在支撐。不知不覺,我們的衣食住行都被雲計算給“包圓”了。
歸其根本,互聯網行業這些年的持續發展,離不開“負重前行”的阿里雲們。也正是雲計算這把不斷壯大的“薪火”,讓互聯網持續發出了耀目的“火焰”。
起於“吝嗇”的雲計算
2001年,全球互聯網投機泡沫破裂,市場中無腦支持互聯網企業燒錢擴張的態度,發生了180度轉向。
互聯網企業在狂奔30年後,終於撞上了一個現實問題:面對不斷擴張的業務規模和激烈的行業競爭,如何降低成本?
亞馬遜面臨的挑戰尤其突出:線上銷售業務的季節性極強,大多數日子的業務流量都比較平均,可到了“黑色星期五”(美國版雙11)等傳統購物高峰期,流量就要多上十幾倍。
這造成了一個尷尬的局面,如果按照峰值購買服務器,平常就只能“吃灰”;如果不多儲備服務器,流量一上來又得宕機。
當然,故事的結局已經盡人皆知,亞馬遜第一個搞出了雲計算。形象點說,就是把服務器資源變成了一塊隨意揉捏的“橡皮泥”,業務需要多少,就“扯”下來多少。
放到具體業務上,一旦需求陡增,就從整個雲計算的資源池裡抽調更多來支撐,在需求迴歸正常之後,再把抽調的資源還回去。因此,企業只需要支付一小段時間的資源佔用成本。
這種按需索取,靈活調控的操作方式,從根本上解決了互聯網高速發展背後的成本問題,讓整個行業在過去的20年裡獲得了巨大的發展。
但站在今天回看,第一代雲計算“打補丁”的意味非常明顯。在整體硬件架構基本不變的基礎上,亞馬遜確實實現了硬件資源的“虛擬分割”,效率不高但“湊活”能用;硬件的使用率有提升,但閒置率還是很高。
接下來幾年裡,行業不斷將這套“分割大法”從硬件層向軟件層拓展,於是乎就出現了初期雲計算的3種產品類型:基礎架構即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS)。
粗略看起來,SaaS似乎已經是“化整為零,高效利用”打法的盡頭,畢竟在這種模式下,從網絡到應用(例如不同APP都能實現的語音識別)已經全部由雲廠商直接提供,但浪費依舊嚴重。
以電商為例,在引入雲計算之前基礎設施建設的標準是“能夠承受峰值”,實際的硬件利用率不過10%左右。而通過雲計算早期打補丁式的發展,資源得到了較粗顆粒度的化整為零、重新利用,硬件利用率逐步提升至15-20%,變相節約了40-50%的成本。
這樣的成績從成本角度看,已經非常驚人,但實際利用率上仍不算高。核心問題出在“分解+重新利用”的整個過程,初期雲計算的現實基礎和“刀法”不支持細緻的分解,自然也無法在組合步驟獲得更大幅度的提升。
既然修修補補不好用,那不如從頭來過?
完整為雲計算重構的思路應運而生,並被形象地稱為“雲原生”,為雲而原生。
雲原生的時代
從技術的視角看,雲原生是對雲計算的又一次自我顛覆。除了將原來各個層級的組件被再次打散、重組,形成更高效的解決方案,還加入了基礎設施容器化(統一基礎設施架構、提升運轉效率)、DevOps等近幾年雲計算行業新浮現的理念和解決方案。
在實際應用中,表現為客戶全方位用起來“更順手”,在硬件利用率上再次躍升,理想狀態下可提升至40-50%,比起不使用雲計算成本有了400-500%的提升。
雲原生的效果固然明顯,但也給雲廠商提出了更高要求:
一來重構過程中的很多技術,實際上在過去也有所應用,廠商必須有能力修改、重造;二來重構需要大量的人力物力和時間,廠商必須有“重來”的決心。
說白了,沒有金剛鑽,攬不了這瓷器活。
不過,今年一季度,國際權威諮詢機構Forrester剛剛發佈了全球公有云容器服務的能力報告,在其"領導者"象限中,就出現了中國雲計算龍頭阿里雲的身影。值得一提的是,這也是中國雲計算廠商首次進入該象限。
Forrester在其報告中,對阿里雲在容器服務上的表現給予了高度的評價:
“阿里雲在服務網格支持、容器和 VM 運行時支持、容器鏡像支持、安全特性和策略、成本管理、混合雲支持、邊緣計算支持、容器存儲和網絡等方面具有強大的能力;相關客戶還稱讚其在日誌記錄和監控方面有出色的可觀察性、高效地管理集群生命週期,與多款服務無縫集成;在微服務開發支持、DevOps 自動化等垂直領域具有深厚的能力。尤其適合瞄準中國和亞太市場的全球企業或佈局海外業務的本地公司,來獲得沉澱於先進實踐經驗的全面雲原生數字化轉型能力。”
之所以阿里雲能夠比AWS、微軟等國外巨頭取得更好成績的關鍵,在於阿里雲自身對於雲計算技術研發的堅持,在過去近15年的發展歷程中,阿里雲幾乎每年都在持續輸出全新自研成果。
還是以雲原生為例,早在2018年阿里雲剛實現部分核心電商業務“雙11”上雲,就已經定下了集團規模化上雲的遠大目標。緊接著通過三年的努力,才將核心交易系統雲原生化,並且在各個業務部門推進上雲方案設計和驗證,最終才在2021年徹底實現首個全面雲上運行的“雙11”。
截至目前,阿里巴巴的所有業務已經全部遷上阿里雲,整體運行效率較之前再次獲得大幅提升:研發效率提升了20%、CPU資源利用率提升30%、在線業務容器可達百萬規模。
有了阿里雲自身全面上雲,全面雲原生化的榜樣在,越來越多的阿里雲客戶也加入了第二次雲計算變革。
“高質量上雲”浪潮
對於阿里雲的客戶而言,雲最直接的價值莫過於降本增效,具體來說,雲原生技術有四個維度的優勢:快速部署、業務穩定、節省資源、開發高效,這些往往綜合體現。
大家所熟知的微博,面對的挑戰就和亞馬遜類似,也是少數時間需要遠超平時的基礎資源,但難度水平要高上許多。不僅如此,熱點還不像“購物節”可以提前準備,會有多“爆”也不容易預估,因此雲計算的彈性調用難度提升了數個量級。
阿里雲和微博合作,建立了高效的雲原生方案,“彈性裸金屬+容器”的解決方案不僅能彈性伸縮,熱點應對更加高效便捷,峰值日彈性可達數十萬核CPU,可以幫助微博輕鬆地支撐其突發流量並保障業務穩定性。
同樣受益於阿里云云原生技術的,還有年輕人最愛的B站。作為國內主流的視頻平臺,B站對於可靠性,性能,跨地域數據同步等有極強的要求,同樣是傳統數據庫架構無法滿足的存在。阿里雲隨之給出了“應用型負載均衡ALB+數據庫tair”的雲原生解決方案。
前者的高性能及彈性能力,滿足了B站廣告業務每秒上百萬請求的處理調度,同時搭配DNS實現多地域間的流量調度。後者具備極高的高可用及擴展性能力,跨地域數據自動同步,秒級延遲,多地域之間就近讀寫,降低架構複雜度和管理成本。簡單來說,B站雲計算架構上的升級,實現了自身廣告業務的效果提升,還完全不會干擾到用戶的實際使用體驗。
同樣是廣告業務,在近幾年中國企業的出海浪潮中,專注於提供移動廣告技術服務的匯量科技取得了亮眼的成長,它的雲計算供應商同樣是阿里雲。匯量科技的業務遍佈全球,服務超過200個國家和地區的客戶,日均能夠完成2000億次廣告請求和全球20億DAU(日活躍用戶數量)。
龐大的需求自然對應高聳的成本,匯量科技2017年聯合阿里雲推出了大型彈性集群管理平臺SpotMax,將阿里雲整合後碎片化的全球雲資源使用效率進一步提高,實現了雲原生資源利用效率上的進一步提升。通過這一創新,匯量科技的單位廣告請求成本降低了65%,最高為企業節省了90%的用雲成本。
在商業之外,阿里雲還賦能了更多社會公益。
今年6月,網易瑤臺攜手青海省玉樹藏族自治州稱多縣政協,舉辦了一場公益攝影展,在線上三維舉行,不僅有明確的展廳間隔,還有橫縱交錯的展牆。其最大的亮點是用戶可以操控虛擬人物,跟朋友一起逛展、聊天,交流對作品的理解和感悟,幾乎完整還原了線下的藝術展覽。
為了讓用戶便捷地體驗如此未來感的虛擬活動,網易瑤臺提供了一種通過瀏覽器快速參與活動的方式,讓性能普通的便攜設備也能享受精美的活動場景,而這意味著需要將場景放到雲端進行渲染,並將結果進行實時傳輸。在這其中,阿里雲提供了基礎的雲原生雲計算能力,如雲服務器ECS、專有網絡、彈性 IP、雲監控、訪問控制等。
與此同時,阿里雲的全球大規模部署幫助瑤臺實現了就近接入、更低的網絡延遲和更好的沉浸體驗;按量方式的開通部署,能夠提供充足的彈性GPU供應,來支持各類活動突發狀況;阿里雲的渲染能力與 AI 性能,也能讓用戶享受到優質的視覺體驗。
面對雲計算行業越來越虛實結合的發展趨勢,阿里雲也在持續推進自身的技術支撐能力,目前已經擁有了虛擬演唱會等 3D 實時互動空間(彼真科技)、家居渲染(紅星美凱龍設計雲)等標杆用戶。
寫在最後
劉偉光補充道:“我們有理由相信,雲計算是互聯網企業增效降本的必經之路。”
在“高質量上雲”趨勢中,雲原生顯然是最關鍵手段之一,劉偉光也著重強調了它的作用:
“雲原生技術將越來越易用,互聯網企業只需關心架構之上的敏捷開發與業務創新,底層資源都可以交給雲計算公司來考慮。這在根本上加速了IT領域一次大規模的社會化分工,並將改變創新驅動力的底層邏輯。”
下定決心繼續推動雲計算發展的阿里雲,並沒有因行業內領先的技術地位和大量客戶的認可而滿足。相反,他們選擇了“油門踩到底”。
在今年6月舉辦的2022年阿里雲峰會上,阿里雲將今年最重要的策略定位為“Back to Basic”,聚焦核心技術,繼續做深基礎。
以這次峰會上發佈的全新雲數據中心專用處理器CIPU(Cloud Infrastructure Processing Units)為例,就能夠幫助CPU分攤部分計算、存儲、網絡、虛擬化、硬件加速需求,同時還能接入阿里雲的飛天雲操作系統,實現上百萬臺服務器的管控,並且讓算力虛擬化損耗降到0。
憑藉過往在雲計算整體架構上的自研投入,阿里雲目前在在全球雲計算的市場和技術水平中都獲得了領先地位,在權威機構 Gartner 發佈的年度報告裡,阿里雲在計算、存儲、網絡等幾個大項中都獲得了全球最高分。其中,在網絡技術上,阿里雲被權威機構 AMiner 評為全球十大最具影響力的網絡研究機構。
如此出色的行業評價,離不開阿里雲從創立至今一直都堅持的技術創新,後者也是雲計算能夠不斷帶來變革的關鍵。只要堅持技術創新的決心和力度不動搖,阿里雲必然能夠持續在雲計算這個行業中不斷成長,同時幫助全球400多萬付費用戶獲取價值。
互利網行業已經飲得雲計算技術紅利的“頭啖湯",其它行業還會遠嗎?