毫無疑問,目前全球基礎軟體行業有兩個重要的趨勢:一方面是“軟體現在吞噬一切”,每一家公司都正在變成軟體公司;另一方面是“開源也在吞噬一切”,越來越多的公司也都在擁抱開源,並使用開源軟體。 開源分散式資料庫,就是在這樣的背景下,成為全面雲化時代匹配企業數字化轉型的最佳選擇。資料顯示,到2021年傳統商業資料庫市場會下降20%至30%,而與此相應的則是雲資料庫的迅猛增長,按照Gartner預測,到2023年全球3/4的資料庫都會跑在雲上。
其中,Greenplum就是近年來湧現出來的優秀開源分散式資料庫的“代表”,憑藉其超強的資料儲存、處理和實時分析能力,Greenplum今天已被廣泛應用於資料倉庫和大規模資料處理領域,在2019年的Gartner報告中,在經典資料分析領域Greenplum全球排名第三,實時分析領域全球排名並列第四,Greenplum也是兩個領域中排名前十的產品中的唯一一款開源產品。
但Greenplum過去主要基於傳統的物理機部署,在資料庫“雲化”的大潮中也面臨著很大的挑戰,因為與在裸金屬上執行的傳統物理機管理相比,在虛擬機器以及多雲或者混合雲環境中執行的Greenplum無論是效能的損耗,以及可管理性都遭遇著很多難題。
VCF on VxRail的出現提供瞭解決這一難題的“答案”——它不僅能夠為企業私有云和公有云提供靈活、始終如一、安全的基礎架構,同時也可以為在虛擬化以及多雲環境中執行包括Greenplum這樣的資料庫應用提供統一的管理平臺,是企業構建雲資料倉庫乃至大規模資料處理的理想平臺選擇。
從這個角度來說,超級雲資料庫,也必有超級雲平臺,特別是企業上雲仍然是大勢所趨,而云資料庫作為上雲過程中最為核心的業務遷移專案,選擇戴爾科技雲平臺VCF on VxRail,相信能夠讓企業雲化轉型“事半功倍”。
GreenPlum資料庫雲化的挑戰
眾所周知,Greenplum是基於PostgreSQL的分散式資料庫,它具備以下幾個特點:支援MPP架構,Greenplum採用MPP架構,具備線性擴充套件儲存能力及分散式任務處理能力,支援資料的大規模平行計算;同時Greenplum支援主節點與計算節點增加冗餘備份,節點宕機時可自動快速切換,能夠降低整體資料倉庫服務宕機風險確保資料不丟失。
此外,Greenplum支援多種資料儲存方式,包括支援行儲存及列儲存的資料儲存方式以及外部表儲存,滿足不同場景下的資料儲存需求,且高度相容PostgreSQL語法,提供視覺化的管理控制檯,企業也可以方便透過Greenplum快捷管理監控資料倉庫,降低入門成本。因此,Greenplum自推出之後,在資料倉庫領域具備了極大的優勢,並在全球範圍內擁有良好的口碑。
不過,也要看到類似GreenPlum這樣的MPP資料庫,過去幾年也正面臨著全新的挑戰,那就是在虛擬機器上執行時往往會使得IOPS的效能損耗,已成為一個不爭的事實,同時跨雲平臺一致性的管理也是GreenPlum的一大難題,這也導致了很多企業級客戶目前關鍵業務的資料庫仍然還執行在傳統的物理機上。
正如VMware解決方案架構師陳實所言:“與在裸金屬上執行的傳統基礎架構管理相比,在虛擬基礎架構上執行Greenplum環境的可管理性還可以進一步提高,因為資源需求會隨著業務需求波動,這就使Greenplum叢集處於動力不足或過度配置的情況。因此,這就需要更靈活、擴充套件性更強、更安全的基礎架構來滿足Greenplum不斷變化的需求。”
其實,從GreenPlum資料庫發展歷程來看,為了最大限度的釋放GreenPlum的能力,早在9年前GreenPlum資料庫就開始執行在EMC DCA的一體機上,4年前GreenPlum宣佈執行在x86的物理機上,而隨著VMware VCF架構全面支援Kubernetes(即VCF with Tanzu),GreenPlum的“雲化”程序也會隨之進一步提速。
VxRail Manager和SDDC Manager整合
而最終的測試結果也顯示——VxRail上的VCF全棧整合能力,將超融合基礎架構層和VMware雲軟體堆疊全面融合起來,可以為客戶提供一個完整、自動化的“交鑰匙”混合雲體驗,不但可以進一步提升GreenPlum資料庫的能力,實現跨多雲環境下的資料庫的靈活遷移負載,更能大大減少客戶在轉型之中的風險,增加了整個系統的執行效率,真正解決了企業在大資料時代雲上資料能力構建和雲上資料分析的業務“痛點”。
VCF全面釋放Greenplum能力
據陳實介紹,本次解決方案中VCF的測試環境由管理域和工作負載域組成,其中為VCF管理域建立了4節點VxRail P570F叢集,執行管理虛擬機器和裝置;而在工作負載域中,則建立了另一個4節點VxRail P570F叢集和另外的NSX-T Fabric,並部署了NSX Edge叢集和Greenplum虛擬機器。
VCF on VxRail架構上的Greenplum
值得一提的是,該解決方案也可以根據客戶的需求和資料庫大小,在工作負載域中擴充套件更多的物理主機,這是因為VCF架構中的vSAN叢集可以支援多達64臺的非延伸叢集物理主機。隨著vSAN叢集增加更多的主機,不僅用於計算的CPU 容量和記憶體可以增加,vSAN儲存容量也能隨之增加,這也是超融合架構的優點之一,即可以同時按比例增加計算和儲存容量。
在此基礎上,工程師團隊還測試了將工作負載域從4節點增加至8、16、24、32和64個節點的情況。而測試結果顯示,在每種情況下,計算和儲存資源均隨著需求增加,而效能則呈線性增長。
而針對Greenplum虛擬機器的部署,解決方案也從Greenplum容量規劃、虛擬磁碟和資料節點、Greenplum最佳化、硬體資源、軟體資源、網路配置、vSAN配置等不同的維度給出了測試的方法和思路,以及詳細的配置資訊。此外,為了驗證VCF on VxRail執行Greenplum的可用性,測試團隊還進行了物理主機故障、物理快取磁碟故障以及物理容量磁碟故障等驗證,最終該解決方案全部透過上述測試。
VxRail硬體配置
VCF軟體資源
不難看出,在本次VCF on VxRail執行Greenplum的方案中,VCF on VxRail的VxRail Manager和VCF Manager軟體提供的生命週期管理功能,可以為Greenplum提供了一致性的管理工具平臺。而VCF中的vSAN為Greenplum提供了可靠、高效能、靈活的儲存;NSX-T則為Greenplum提供了細粒、安全、高效能的虛擬網路基礎設施。此外,vSphere DRS和vSphere HA提供了高效的資源利用和高可用性。
換句話說,戴爾科技集團透過這樣的最佳實踐,不僅全面釋放了Greenplum的能力,更為眾多的企業在VCF on VxRail 上執行Greenplum提供了一種可落地、可部署的設計方法和通用架構,值得參考和借鑑。
超級雲資料庫,必有超級雲平臺
事實上,除了支援Greenplum這樣的超級雲資料庫,今天VCF on VxRail已成為企業未來混合雲平臺與資料中心建設中最為重要的解決方案,是企業數字化轉型中必選的超級雲平臺。
在戴爾科技集團大中華區雲計算和超融合技術顧問劉磊看來,VCF on VxRail最為核心的優勢,就是夠幫助企業級使用者輕鬆構建和運維具有公有云體驗的私有云或者混合雲,實現“一致的基礎架構,一致的運維體驗和一致的安全保證”,真正讓企業提高業務敏捷性靈活性,同時降低總體雲建設和運維成本,具體來說:
一是,從VxRail的角度看,VxRail不僅是基於超融合技術的完整資料中心生態,也是VMware雲原生應用最完美的基礎架構,它完整的集成了Dell EMC和VMware的生態,是緊耦合的超融合資料中心解決方案,具備完整的資料中心功能,同時它還實現了硬體平臺、超融合平臺、網路配置初始化管理和虛擬化平臺的單一介面的統一管理。此外,它還具備全生命週期管理,能夠實現自動化、安全和方便的軟體更新。
二是,從VCF的角度看,它是基於VMware成熟可靠的雲技術產品、沉澱了VMware十多年全球大型客戶雲建設與運維,以及與公有云廠商合作的豐富經驗打造而成,不僅能夠提供公有云體驗的私有云/混合雲,也能夠讓企業的應用無論是在雲上,雲下乃至雲間都能自由平滑遷移,同時提供一致的運維體驗和保障一致的應用安全,能夠為“企業上雲”構築堅實的創新基石。
三是,從VCF on VxRail角度看,它是Dell EMC和VMware技術創新的“集大成者”,也是戴爾科技集團為企業上雲量身打造的超級雲平臺,能夠為企業提供安全穩定的私有云和混合雲的架構。更為重要的是,企業還可以根據自己業務的需要進行VCF on VxRail的靈活選擇,同時由於基礎架構的一致性,企業現有的工作負載無需任何修改,就可以靈活地在私有云和公有云之間、多個公有云之間進行遷移;同時,這種負載遷移同時也是雙向的,既可以從私有云到公有云,也可以從公有云到私有云,或者是從一種公有云到另一種公有云,給使用者提供最大的便捷性。
“因此,VCF on VxRail是能夠隨著企業需求而轉變的現代化雲平臺,其端到端全堆疊整合的生命週期自動化管理能力,可簡化、精簡和自動化SDDC的運營,更能一鍵式全堆疊自動化修補和升級SDDC平臺,這些獨特的優勢都會加速企業邁向混合雲的全新旅程。”劉磊說。
總的來看,VCF on VxRail透過執行Greenplum,徹底化解了超大規模資料庫上雲過程中帶來的種種難題,也真正證明了自身作為“超級雲平臺”的全新作用和價值,無疑將為中國眾多企業級使用者實現全面雲化以及完成數字化轉型夯實更為堅實的基礎,也必將成為今後企業數字化轉型和升級過程中的首選雲平臺。