2020年12月19日,在首屆中國雲網絡峰會上,阿里雲展臺人頭攢動,裡三層外三層,是什麼激發了這麼多人的興趣?
為什麼需要採用軟硬體一體化架構
隨著企業上雲越來越廣泛,網路頻寬進一步增長,初期採用物理伺服器和DPDK構建的方式無以為繼,一方面伺服器的摩爾定律已經失效,需要更多伺服器來滿足不斷增加的流量訴求,另一個方面,伺服器的大量增加對安裝部署/交付運維/成本/功耗等也帶來了不利影響,而採用可程式設計硬體晶片可有效面對不斷增加的流量訴求,從單臺伺服器160G到當前可程式設計單晶片3.2T/6.4T,下一代12.8T,轉發能力提升數十倍,轉發時延更低,整體Capex和Opex大幅降低。因此,硬體化是必然選擇。
軟硬體一體化閘道器XGW應用場景
XGW負責公網,專線和跨Region流量的匯聚和分發,如下圖所示
典型場景如下:
1)使用者經Internet(公網)訪問阿里雲,使用的典型產品有EIP和共享頻寬2)使用者IDC訪問阿里雲,使用的典型產品有高速通道(專線)3)雲上跨地域通訊,如北京地域ECS訪問深圳地域ECS,使用的典型產品有CEN
採用軟硬體一體化XGW後可以滿足使用者在上述場景的大頻寬和高質量需求
1)大頻寬:比如天貓雙11或某大客戶數10Tbps專線上雲流量。2)大單流:比如IoT場景的GRE tunnel,單流數數十Gbps。3)穩定性:沒有軟轉發的CPU打滿隱患。4)低延時/低抖動:硬體閘道器的管道足夠粗,客戶上雲絲般柔滑,沒有卡頓,就像高速公路的車道足夠多,車輛行駛一路通暢,沒有排隊/沒有阻塞。
客戶案例
1)客戶資訊:客戶是全球知名的網際網路科技企業,旗下有多個知名應用,包括影片,資訊,教育等等。2)業務訴求:客戶採用混合雲架構,頻寬規模達到雙向51.2Tbps,IDC機房和雲上網路全棧支援IPv6。業務痛點:超大規模,IPv4地址資源枯竭,需要全棧切換到IPv63)解決方案:阿里雲透過XGW軟硬體一體化閘道器,提供超大頻寬,以及混合雲全棧IPv6支援4)方案價值:1)超大頻寬支援,單機3.2Tbps,可水平擴充套件 2)全棧IPv6,無縫連線雲上IPv6和線下IPv6網路
軟硬體一體化閘道器XGW技術實踐
1)晶片選擇
選擇了可程式設計交換晶片的道路,首先面臨的問題是晶片選擇阿里雲有幾個選擇,第一個用傳統的AISC卡,因為傳統的網路裝置交換機裡的AISC已經非常成熟。第二個是P4可程式設計AISC晶片——一個可程式設計能力越來越強的晶片。另外一個FPGA,傳統意義上,它也算是硬體晶片。
2)晶片表項的最佳化
首先阿里雲充分挖掘了晶片的能力。在轉發晶片包含多個pipeline,透過多個pipeline去共同達成高速的轉發效能。最簡單的程式設計方式就是每一個pipeline裡都下發相同的表項,所有的處理邏輯是全部對稱的,整個的轉發模型非常簡單。但是這種方式也有相應的代價,每一個pipeline裡儲存的相同表項,就是整個晶片對外的能力。
3)實現網路QoS
利用可程式設計晶片資料平面,實現網路QoS的能力。大規模租戶的應用較複雜,部門較多,不同應用的優先順序不一樣,對於頻寬的要求也不一樣,如果每個應用都按照它最大頻寬來購買,成本會非常高。所以,許多超大規模客戶希望購買一定頻寬,然後在發生堵塞的時候先丟棄優先順序低的報文,保證高優先順序的報文透過。透過可程式設計資料平面可以實現了這樣的QoS的功能。
軟硬體一體化未來最佳化
雲網絡未來將從以下幾個方面進行最佳化:
1)異構晶片。當前阿里雲使用的Barefoot P4可程式設計晶片,未來阿里雲可能會使用多廠商的異構晶片,比如阿里自研晶片、Broadcom晶片等。透過晶片適配層,可以有效的遮蔽晶片的差異,做到快速上線。
2)網路安全。隨著大量不同行業的租戶上雲,對網路加密安全有了更高的要求。透過可程式設計的資料平面提供加密的功能,來支撐不同的客戶的訴求。