摘要:更為深入地介紹了GaussDB(openGauss)的關鍵特性、成功案例。
GaussDB(openGauss)是深度融合華為在數據庫領域多年的經驗,結合企業級場景需求,推出的新一代企業級分佈式數據庫,支持集中式和分佈式兩種部署形態。
它面向金融互聯網交易和政企OA/辦公場景,具有安全可靠、超高性能、簡單易用等優勢。
華為雲數據庫產品部高級產品經理沈志鵬在1024程序員狂歡節的直播間,更為深入地介紹了GaussDB(openGauss)的關鍵特性、成功案例。
分佈式or集中式,總有一個適合你
GaussDB(openGauss)定位為企業級雲分佈式數據庫,架構上著重構築傳統數據庫的企業級能力和互聯網分佈式數據庫的高擴展和高可用能力。
對比傳統形態,GaussDB(openGauss)能夠獲得:
高性能:支持分佈式事務強一致性,同時32節點下能夠達到1200萬tpmC的性能實測指標;
高可用:支持同城跨AZ多活容災,兩地三中心金融級部署場景;
高拓展:當前支持最大256節點的在線擴容,同時保障客戶擁有卓越的性能線性增長,打破傳統DIY架構的性能天花板;
易運維:高度支持HTAP混合負載場景,極大的減少了業務改造成本,同時基於雲平臺獲在線監控,運維,升級等便利的能力。
GaussDB(openGauss)在華為雲上擁有兩種部署形態:集中式和分佈式,分別面向企業核心交易和未來海量事務型場景,打造差異化競爭力。
集中式部署
集中式部署又包括單機和主備兩種類型。
以主備為例,支持1+2(最大保護)主備,基於數據庫日誌複製的熱備,在單機性能可滿足需求的情況下,提供高可用。
其中,1+1(最大可用)指的是,數據會同步寫往備機。但如果出現網絡等影響,無法完成同步操作,會轉為異步。後續網絡恢復,會自動追上。在數據不同步期間,切換會有數據丟失。
1+2(最大保護)則意味著數據會同步寫往備機,且要求必須有一個確認,才向客戶端返回。可靠性高。
集中式版本擁有開源生態,用戶可以通過開源網站直接下載,作為國內唯一開源數據庫,也是華為開源、開放、不LOCKIN單一廠商的最佳證明。
分佈式部署:
分佈式部署方面,數據按shard劃分,讀寫負載準線性擴展,滿足大規模業務量場景,支持兩地三中心高可用部署。另外,分佈式版本承載華為雲自研分佈式組件體系,是傳統企業擁抱互聯網,面向未來海量事務型場景挑戰的有力保障。
下面是分佈式架構中的一些關鍵角色:
分佈式架構又可以分為獨立部署&混合部署。
混合部署方案適合通用客戶,其方案包括:1、各角色3副本,數據3副本部署;2、各角色進程合一部署,對外只體現數據庫節點;
這樣部署的優勢是組網簡潔明瞭,交付界面高效;起點配置要求低,適配場景比較通用;和未來的技術演進方向匹配。
另一個獨立部署方案適合高端客戶,它的方案包括:1、各角色3副本,數據3副本部署;2、關鍵角色進程分開部署,對外體現CMS、GTM、CN、DN主、DN備。
獨立部署方案下,用戶可以根據業務負載確定CN和DN的最佳比例,達成最高效的組網。
解讀GaussDB(openGauss)分佈式關鍵特性
關鍵技術一:分佈式執行框架
業務應用下發SQL給Coordinator,SQL可以包含對數據的增(insert)、刪(delete/drop)、改(update)、查(select)。Coordinator利用數據庫的優化器生成執行計劃,每個DN會按照執行計劃的要求去處理數據。
因為數據是通過一致性Hash技術均勻分佈在每個節點,因此DN在處理數據的過程中,可能需要從其他DN獲取數據,GaussDB 提供了三種stream流(廣播流、聚合流和重分佈流)來降低數據在DN節點間的流動。
DN將結果集返回給Coordinate進行彙總。Coordinator將彙總後的結果返回給業務應用。
關鍵技術二: GTM-Lite技術
GTM-Lite技術可以在保證事務全局強一致的同時,提供高性能的事務處理能力,避免了單GTM的性能瓶頸。
這裡的高性能事務管理指的是無鎖、多版本、高併發事務技術。
而且分佈式的GTM-Lite方案提供全局事務快照和提交號管理,實現強一致性,且無中心節點性能瓶頸。
關鍵技術三:基於NUMA-Aware實現高性能事務處理
基於鯤鵬CPU的NUMA-Aware數據庫架構,性能更強。
關鍵技術四:集群HA,多層級冗餘實現系統無單點故障
GaussDB(openGauss)通過硬件冗餘、實例冗餘、數據冗餘,實現整個系統無單點故障,高可用。
其中硬件高可用包括存儲磁盤RAID冗餘、網絡雙交換機冗餘、多網卡冗餘、主機UPS電源保護。
軟件高可用則包括協調節點CN實例多活冗餘、數據節點/全局事務管理/ 集群管理器實例Active-Standby冗餘。
除此之外,還支持軟硬件故障檢測,最終進一步保障數據庫的高可用。
關鍵技術五:跨AZ/Region容災技術帶來高可用
集群內HA,數據不丟失,業務秒級中斷;同城跨AZ容災,數據不丟失,分鐘級恢復,以及兩地三中心部署。
除了同城跨AZ和兩地三中心,GaussDB(openGauss)還在探索異地多活,其主要特徵有:
支持多中心統一查詢及全局一致讀,整體資源利用率高;靈活的高可用方案:通過配置多副本,可以實現DC,AZ,Region級高可用容災策略;負載分擔及故障無縫切換;支持平滑在線擴容。關鍵技術六:Scale-out在線橫向擴展帶來高擴展
GaussDB(openGauss)支持但集群最大256節點,節點擴展下能夠獲得卓越的性能線性比
同時節點擴容能夠做到完全在線,對客戶透明,節點擴容完成後DN數據自動重分佈,CN自動完成負載均衡。
最後,除了帶來GaussDB(openGauss)分佈式關鍵特性解讀之外,在1024程序員狂歡節期間,華為雲還準備了一大波技術乾貨直播活動,既能學技術,還能抽盲盒、錦鯉大禮包。