隨著移動網際網路、IoT、人工智慧等技術的迅速發展,資料產生的規模空前增長,據知名諮詢機構統計,預計未來5年資料規模年均增速達30%,面對快速膨脹的資料規模,各類企業、機構需要更快、更全面的掌握分析資料,挖掘內在價值,支撐經營決策和最佳化管理,資料倉庫作為核心查詢分析平臺,必須要具備大規模叢集能力,也是資料庫廠商需要突破的核心技術點之一。
大規模資料倉庫叢集不僅僅是將眾多伺服器“攢”起來,更需要解決大併發複雜查詢下的通訊連線風暴問題。並且在數千節點的叢集中,平均每天都會有硬體故障發生,如何應對“硬體不可靠”帶來的問題?如何在硬體亞健康情況下資料倉仍能提供穩定的效能,如何在作業系統“軟死”情況下資料倉庫不出現卡頓、無響應等問題,是技術面臨的極大挑戰。在2048節點大規模叢集認證的背後,是GaussDB(DWS)強大“硬核科技”的表現。
一、 Multi-Streams多流通訊技術在2048節點規模下,叢集進行全並行資料交換時,叢集內可達百億級的並行連線,出現通訊連線風暴,已遠遠超出TCP連線埠號和socket檔案控制代碼上限。
GaussDB(DWS)自研的Multi-Streams多流通訊技術,將連線數提升5個數量級,突破物理機TCP連線埠限制,能夠支援叢集內百億級通訊連線,並且理論支援節點數無上限。
Multi-Streams多流通訊採用邏輯連線技術,避免了TCP物理連線的三次握手的機制,單資料節點建連效能達到100萬次/s,提升20倍。
該技術基於全非同步無阻塞代理通訊架構,支援跨邏輯連線的socket合併,將網路吞吐能力提升3倍。
二、高可用設計及叢集管理技術GaussDB(DWS)設計之初,充分考慮高可用性,其具備多層級高可用及容災能力,在程序級、節點級、叢集級出現軟硬體異常的情況下具備平滑處理能力。
在棘手的硬體亞健康、“軟死”問題上,GaussDB(DWS)具備完善的智慧檢測和處理機制,能夠實時監測任意節點狀態,包括伺服器亞健康狀態、磁碟慢盤、靜默損壞等等場景,透過自動感知、剔除、平滑切換等高可用策略,提高業務的連續性。
並且,在物理元件發生故障的情況下,Server端Multi-Retries技術能夠大幅減少故障失敗的業務感知,保障業務持續執行。
在叢集管理上,針對超大節點數場景,透過邏輯重構,實現叢集起停的全並行處理,2048節點規模下具備分鐘級起停能力。
三、大規模場景下的並行資料備份恢復技術完全線上:資料備份期間,採用全程無加鎖技術,任何業務SQL、包括DDL均不受影響
多層級並行極速備份:每節點獨立多併發、多通道備份,提供10PB級資料快速備份恢復效能
全域性一致性快照:叢集級全域性一致性快照,資料強一致性保證
細粒度資料恢復:支援多粒度資料恢復,滿足客戶誤刪、個別表損壞等緊急恢復需求。