首頁>科技>

報告綜述:

安全可控勢在必行,資料庫國產替代加速開展,以黨政為代表的國產替代先行,並不斷向金融、電信等領域拓展。同時,伴隨雲計算、大資料技術的快速發展, 雲資料庫、資料倉庫、大資料分析等領域快速增長,國產資料庫廠商有望依靠 在價格、服務、雲技術結合能力等打造自身優勢,抓住增量市場視窗期,迎廣 闊藍海。

資料庫:雲時代核心底座,數字化業務的電子檔案櫃,需求升級+技術迭代驅動 行業發展。資料庫是按照一定的資料結構組織、儲存和管理資料的倉庫。19 世 紀 70 年代,關係型資料庫原型 System R 誕生,引領第一波資料庫浪潮,Oracle、 IBM DB2、SQLServer 等主流關係型資料庫崛起。進入網際網路時代,從需求側 看,資料量、資料複雜度快速提升,從供給側看,雲計算引領產業升級。在此基 礎上,非關係資料庫、分散式資料庫、大資料分析等技術快速發展,雲廠商、獨 立廠商開始對傳統資料庫廠商形成強有力的衝擊。

參與者:傳統 IT 巨頭、雲計算廠商、獨立廠商三類廠商,百舸爭流。1)傳統 IT 巨頭:關係型領域深耕,經久不衰 40 餘年,主要解決資料儲存的易用性、抽 象性、獨立性等問題,整體仍佔據主導地位;2)雲計算巨頭:藉助雲計算發展 趨勢及專有場景打磨產品,提供雲資料庫及服務,滿足企業海量資料儲存、低成 本資料儲存、動態變化資料儲存等需求,是雲時代的主力軍。3)獨立廠商:數 據快速爆發,需求加速釋放,獨立廠商往往在特定場景如資料分析、非結構化數 據處理等領域深耕,同時,多雲趨勢明顯,獨立廠商提供更加靈活的部署方式。

全球規模:超五百億美元大蛋糕,雲時代百家爭鳴。Gartner 資料顯示,2018 年全球 DBMS 市場規模達 461 億美元,同比+18.4%,增速達到近十年峰值,其 中雲資料庫貢獻 104 億美元,為行業增長貢獻 68%,這種變化背後反映整個數 據庫行業雲化趨勢顯著。預計到 2023 年,75%的資料庫要跑在雲平臺之上。其 中 Oracle 獨佔鰲頭,雲計算廠商與獨立軟體提供商快速崛起,AWS 市場份額由 2014 年的第 6 升至 2018 年第 3 位,僅次於 Oracle、微軟;阿里雲由 2014 年 的 26 位躍升至 2018 年的第 9 位。Gartner 2020 年全球資料庫魔力象限評估結 果,阿里雲首進全球資料庫第一陣營——領導者象限,是中國資料庫廠商首次進 入全球頂級資料庫行列。騰訊雲、華為雲進入“特定領域者”。

國內規模:百億市場,雲化加速。智研諮詢資料顯示,2018 年我國資料庫軟體 市場規模為 139.25 億元,其中,關係型資料庫規模約 118.36 億元,佔比約 85%。 IDC 預測,2020 年關係型資料庫雲部署方式將會和傳統部署方式的規模基本持 平,到 2024 年,中國關係型資料庫軟體市場規模將達到 38.2 億美元,未來 5 年 CAGR 為 23.3%,其中雲資料庫佔比將會接近 7 成。老牌資料庫公司人大金 倉、武漢達夢、南大通用等主耕關係型資料庫領域,雲計算巨頭阿里、華為、騰 訊等以分散式聞名,並不斷擴大生態。獨立資料庫廠商藉助雲原生、分散式等技 術聚焦各自擅長領域,如 PingCAP 的 HTAP 資料庫 TiDB,星環科技的大資料 基礎平臺等。

發展契機:安全可控帶來良機,雲與開源面向未來,國產廠商發展可期。安全 可控背景下,國產替代加速開展。金融方面,巨杉軟體、易鯨捷、萬里開源分別 中標唐山銀行、貴陽銀行、光大銀行重點資料庫專案。電信方面,阿里雲、武漢 達夢分別中標中國移動國產資料庫專案。另一方面,雲計算快速發展,預計 2023 年我國公有云與私有云市場規模將超過 3700 億元,加速釋放相應的資料庫配套 服務紅利。同時,藉助開源的力量,國內資料庫企業快速實現技術創新,縮小差 距甚至趕超海外資料庫龍頭。面向未來,雲與開源的趨勢將會更加明顯。

資料庫:數字化時代的電子檔案櫃

概述:組織、儲存和管理資料的倉庫

資料庫(Database,簡稱 DB)是按照一定的資料結構組織、儲存和管理資料的倉庫。 計算機資料庫中存放了有組織的、可共享的、統一管理的大量資料,包括文字、影象、聲 音等,是資訊化時代的資料檔案櫃。資料庫和作業系統、中介軟體一樣,屬於基礎軟體的範 疇,高度複雜且存在較高的技術壁壘,是應用系統承載資料的基石。

資料庫管理系統(Database Management System,簡稱 DBMS)是一種操作和管 理資料庫的軟體,用於建立、使用和維護資料庫。DBMS 對資料庫進行統一的管理和控制, 保證資料庫的安全性和完整性。DBMS 是把使用者意義下抽象的邏輯資料處理,轉換成為計 算機中具體的物理資料處理的軟體。使用者透過 DBMS 訪問資料庫中的資料,資料庫管理員 透過 DBMS 進行資料庫的維護工作。 資料庫系統(Database System,簡稱 DBS)一般由資料庫、資料庫管理系統、應 用系統、資料庫管理員和使用者構成。DBS 是儲存介質、處理物件和管理系統的集合體,是 一個為實際可執行的儲存、維護和應用系統提供資料的軟體系統,資料庫及其管理軟體是 資料庫系統的組成部分,資料庫管理系統是其核心部分。

分類:需求升級與技術迭代驅動,資料庫品類多元化發展

資料庫的分類多種多樣,為了方便理解,我們從分別從需求側供給側對當前主流的 資料庫型別進行梳理。 從需求側看,可對資料庫進行以下兩種分類:關係型資料庫和非關係型資料庫、OLTP 資料庫和 OLAP 資料庫。

1) 按資料儲存方式分類:關係型資料庫和非關係型資料庫

關係型資料庫是一種典型的資料庫型別,採用關係模型,常用行和列等二維的形式來 儲存結構化資料,一系列的行和列被稱為表,一組表組成了一個數據庫。典型的關係型數 據庫有 Oracle、MySQL、DB2、Microsoft SQL Server 和 Microsoft Access 等。 隨著 web2.0 的興起,傳統的關係資料庫在處理大規模和高並發動態資料時,出現了 響應慢、擴充套件困難等問題,非關係型的資料庫由此應運而生。非關係型資料庫的產生是為 瞭解決大規模資料集合多重資料種類的應用難題。

非關係型資料庫又被稱為 NoSQL,是 用非關係模型,儲存非結構化的如影象、音影片等型別資料的資料庫,分為鍵值儲存資料 庫、文件型資料庫、圖形資料庫等多種類別。非關係型資料庫透過例如圖形模型、文件模 型等更為靈活的模型,解決了關係型資料庫無法應對的非結構化資料問題。非關係型資料 庫有 Mongodb、Hbase、Redis、Cloudant 等。

2) 按應用型別分類:OLTP 和 OLAP

OLTP(On-Line Transaction Processing,操作型資料庫,又稱聯機事務處理)主 要關注一段時間內的實時資料,基本特徵是接收的使用者資料可以立即傳送到計算中心進行 處理,並在很短的時間內給出處理結果,是對使用者操作快速響應的方式之一。伴隨企業信 息系統大量業務資料的產生,從不同型別的資料中提取出對企業決策分析有用的資訊這一 需求日漸顯現。分析型資料庫技術就是在這樣的背景下發展起來的。OLAP(On-Line Analysis Processing,分析型資料庫,又稱聯機分析處理)主要是分析長期資料的規律 走勢,多應用於決策。

操作型資料庫的優勢在於線上實時業務的處理,分析型資料庫則擅長複雜的分析操作 並給決策提供支援,兩者的側重點不同,因此可以相互補充。例如可以從多個操作型資料 庫源收集資料放入 OLAP 資料倉庫中進行分析。在未來,會出現越來越多操作型資料庫和 分析型資料庫有機結合的應用。 典型的操作型資料庫有 Oracle DataBase、MySQL、DB2、MongoDB 等;典型的分 析型資料庫有 Apache Kylin、Hive、Snowflake、Oracle Hyperion、Spark 等。

從技術架構(供給側)看,資料庫可分為集中式資料庫和分散式資料庫

這種分類方式的誕生,一方面是由於傳統集中式資料庫缺乏擴充套件性,為了實現擴充套件而 出現了分散式資料庫,另一方面,是緣於雲技術和網路技術快速發展,推動分散式技術升 級,形成新型分散式資料庫。集中式資料庫由一個處理器、與它相關聯的資料儲存裝置以 及其他外圍裝置組成,將資料集中在一臺機器上進行處理,被物理地定義到單個位置。典 型代表有 Oracle、DB2、人大金倉、武漢達夢等;分散式資料庫採用分散式架構,將資料 在網路上分開儲存於多個機器中進行處理,分散式資料庫是一個數據集合,這些資料在邏 輯上屬於同一個系統,但物理上卻分散在計算機網路的若干站點上,並且要求網路的每個 站點具有自治的處理能力,能執行本地的應用。分散式資料庫典型代表如谷歌的 Google Spanner、阿里巴巴的 OceanBase、華為的 GaussDB 等。

開源資料庫是資料庫發展的另一路徑,也孕育了網際網路的繁榮發展。開源軟體是圍繞 社群概念設計的,將資料庫,API 和 Web 託管引擎的原始碼儲存庫向公眾開放,允許任何 人檢視或貢獻。社群中的領導者會指導和監控新功能的開發和修補錯誤。對於希望建立強大技術基礎的企業而言,開源工具一方面可降低成本、另一方面方便企業對技術的快速迭 代創新。比如國內的部分網際網路巨頭,一開始考慮到成本、可控性、技術創新型等因素, 多數選擇基於開源的資料庫進行資料庫的深度研發,並在研發過程中不斷回饋開源社群。

開源資料庫並不是和商業資料庫背道而馳的,開源資料庫同樣可以實現商業化。我們認為, 在雲計算快速發展的時代,商業資料庫和開源資料庫有望實現進一步融合。開源資料庫典 型代表如 MySQL、PostgreSQL、MongoDB、Hbase、TiDB 等

全球格局:Oracle領銜,雲時代百家爭鳴

參與者:傳統 IT 巨頭、雲計算巨頭、獨立公司三方勢力競逐市場

資料庫市場目前主要由傳統 IT 巨頭、雲計算巨頭、獨立資料庫公司三大勢力角逐。 傳統 IT 巨頭多在關係模型領域深耕,整體佔據主導地位,但云計算、大資料的快速發展帶 來了需求的進一步爆發,雲計算巨頭、獨立資料庫公司的資料庫產品快速崛起。以 Apache 軟體基金會為代表的開源專案在資料庫市場也具備一席之地,但這些專案往往不以盈利為 目的。

1)傳統巨頭:傳統資料庫領域,國外資料庫廠商起步較早,全球的傳統 IT 巨頭不斷 進行戰略佈局和產品迭代,在傳統資料庫領域主導市場,包括 Oracle、IBM、Microsoft、 SAP 等。

2)雲計算巨頭:伴隨雲計算、大資料等技術的快速發展,網際網路巨頭在資料庫市場 大放異彩,雲計算巨頭的資料庫產品借勢快速發展,包括亞馬遜、谷歌、阿里、騰訊、華 為、Facebook 等。

3)獨立廠商:在商業化和開源並行發展的同時,也湧現出一批技術起家的資料庫獨 立廠商,如 Mongodb、Snowflake 等公司,各自在自身的強勢領域深耕細作。

傳統巨頭在關係型 OLTP 領域強勢,雲計算巨頭以及獨立資料庫廠商在非關係型領域 以及 OLAP 領域更具競爭力。雲計算巨頭更多的是依靠雲計算、大資料的快速發展崛起, 同時,獨立廠商更多的選擇依賴開源快速提升產品影響力和市場認知度,同時依靠社群的 力量,也可以對產品進行快速的迭代升級。

從流行程度看,傳統資料庫產品佔據主流地位,傳統巨頭甲骨文、微軟、IBM 排名穩 居前列,另一類是開源社群版資料庫,包括 MySQL、PostgreSQL、Redis 等,值得注意 的是,MongoDB 作為獨立資料庫廠商,流行程度排名第五位,憑藉其優異的產品效能、 豐富的應用場景贏得市場的青睞。

從產品維度看,傳統 IT 巨頭以及雲計算巨頭的產品佈局較為完善,獨立資料庫廠商 專注於各自擅長領域。傳統 IT 巨頭如 Oracle,具備關係型、非關係型、分析類、開源等 多品類資料庫產品,滿足企業多樣化需求。網際網路巨頭如亞馬遜,產品主要圍繞雲生態布 局,多種雲資料庫、雲資料倉庫產品。獨立廠商如 MongoDB,專注於文件儲存資料庫 MongoDB 的開發。獨立廠商又如 SnowFlake,專注於資料倉庫的開發,主要應用於分析 類場景。

市場規模:五百億美元大蛋糕,雲資料庫快速崛起

各路豪強瓜分 500 億美元市場大蛋糕。Gartner 報告顯示,2018 年全球資料庫管理系 統(DBMS)市場規模達 461 億美元,同比+18.4%,增速達到近十年峰值,其中雲資料 庫貢獻 104 億美元,為行業增長貢獻 68%,這種變化背後反映整個資料庫行業雲化趨勢顯 著。Gartner 預計,到 2021 年,雲資料庫在整個資料庫市場中的佔比將首次達到 50%; 而到 2023 年,75%的資料庫要跑在雲平臺之上。

Oracle 獨領市場,全球雲計算巨頭市場份額快速提升,專注於資料庫的創業型公司 逐漸崛起。從需求端來看,受益於資料量的爆發,大資料的相關應用場景日漸豐富,帶來 不同型別資料庫需求量的快速增長。從供給端來看,雲技術快速普及,各大網際網路廠商積 極推出各種基於雲架構的資料庫產品,匹配雲計算的發展,不斷提升資料庫的計算和儲存 效能。根據 Gartner 資料顯示,2014 年 AWS 位列第 6,2016 年第 5,2017 年第 4,2018 年第 3 位僅次於 Oracle、微軟;阿里雲由 2014 年的 26 位躍升至 2018 年的第 9 位;谷歌 雲由 2015 年的 23 位躍升至 2018 年的第 10 位;華為由 2015 年的 24 位躍升至 2018 年 的第 11 位;騰訊雲由 2016 年的 27 位躍升至 2018 年的第 13 位。

以阿里、華為、騰訊為代表的中國雲廠商正在崛起。根據 Gartner 2020 年全球資料 庫魔力象限評估結果,阿里雲首次挺進全球資料庫第一陣營——領導者象限,是中國資料 庫廠商首次進入全球頂級資料庫行列。騰訊雲、華為雲進入“特定領域者”。Gartner 資料 顯示,2019 年騰訊雲資料庫市場份額增速達 123%,位居國內所有資料庫廠商之首,並在 全球範圍內保持了連續兩年增速前三的迅猛勢頭。華為雲憑藉 GaussDB 系列資料庫產品 提供完善的產品矩陣和資料庫遷移解決方案,基於融合開放理念,廣泛相容資料庫開源生 態和華為自主生態 openGauss。

崛起規律:深耕技術打磨產品,抓住大資料時代潮流

(1)傳統 IT 巨頭:關係模型掀起資料庫發展第一浪

20 世紀 60-70 年代,關係模型快速發展,關係型資料庫可解決資料儲存的易用性、 抽象性、獨立性等問題,拉開了關係型資料庫軟體革命的序幕。1970 年,IBM 公司的研 究員埃德加·考特在 Communications ofACM 上發表著名論文的《A Relational Model ofData for Large Shared Data Banks》,在還是層次模型和網狀模型的資料庫產品在市場 上佔主要位置的時代,拉開了關係型資料庫軟體革命的序幕。

IBM 在 1973 年就啟動了 SystemR 的專案來研究關係型資料庫的實際可行性,各方 關係型模型支持者吸取該專案經驗,進行關係型資料庫研發。1977 年,Oracle 創始人 Larry Ellison 與 Bob Miner 和 Ed Oates 在矽谷共同創辦了一家名為軟體開發實驗室的計算機公 司(Oracle 前身),開始進行關係型資料庫的研發,同時期 Berkeley 大學也在進行關係數 據庫系統 Ingres 的開發。IBM 雖然 1973 年就啟動了 SystemR 的專案來研究關係型資料 庫的實際可行性,也沒有及時推出這樣的產品,因為當時 IBM 的的 IMS(著名的層次型數 據庫)市場較好,公司當時認為,如果推出關係型資料庫,會是對另一款產品的顛覆。

80-90 年代,大量資料庫公司吸取關係模型經驗,逐步推出自己的產品。1983,IBM 釋出商業版資料庫 DB2。1984 年,Sybase 公司成立,創始人之一 Bob Epstein 是 Ingres 大學版(與 System/R 同時期的關係資料庫模型產品)的主要設計人員。1988 年,微軟推 出 SQLServer,主要適配自身 Windows 生態,這個時期,Oracle 因為客戶需求已經使用 C 語言開發出適用於多個系統版本的資料庫產品。90 年代,Mysql、PostgreSQL 等開源 版本資料庫陸續釋出,出現在人們視野中。

我們認為,傳統 IT 巨頭在資料庫領域能經久不衰的原因有以下幾點:

a.起步較早

國外資料庫廠商相對於國內廠商早起步 20-30 年。國內廠商中,如今佔據國內市場份 額較多的南大通用成立於 2004 年,達夢成立於 2000 年,而國外的 IT 巨頭早在上個世紀 便已經在這一領域進行研究發展,如 Oracle 誕生於上個世紀七十年代,早在 1989 年便進 入中國市場,2019 年已經發布了最新版本的 Oracle DB 19C。而 IBM 等公司同樣在同期 已經有了資料庫的研發。先入為主導致技術領先和客戶粘性是如今國外廠商仍然佔據國內 資料庫市場巨大份額的重要原因。

b.產品快速迭代

龍頭資料庫公司對於產品的更新換代較為積極,能夠產生較大的使用者粘性,使得市場 份額優勢持續。以Oracle為例,在 Oracle9i產品中引入網路(Internet)的特性,在 Oracle10g 中加入網格計算(grid)的特性,在 Oracle12c 中則引入雲(cloud)的概念,不斷讓產品 有新的突破。而透過每一次更新對於產品的漏洞進行及時修復、推出新的應用、最佳化產品 的效能,也都會吸引已有的使用者持續使用這款產品。資料庫的這些特徵,使其如同操作系 統一樣存在較強的使用者粘性,幫助行業龍頭廠商迭代已建立的市場份額優勢,因此資料庫 行業是一個容易形成寡頭的行業。

c.技術領先,效能加持

Oracle 的資料庫產品包括兩大類,第一種是自研的 Oracle Database,另一種是收 購之後歸入 Oracle 公司的 MySQL。

Oracle Database 適用於大型企業,在相容性、可移植性、可連結性、開放性方面都 有巨大優勢。以其相容性為例,Oracle Database 可以在 Windows、Unix、DOS 等多個 系統上工作;Oracle Database 也支援多種協議,如 TCP/IP、DECnet 等,可以與多種通 訊網路連線;Oracle 還提供了多種開發工具,方便使用者自己做進一步開發。Oracle 在系統 吞吐量的 TPS(Transactions Per Second)、QPS(Query Per Second)、併發數等關鍵效能 指標在同類產品中領先。以 Oracle 12.2 為例,C 語言程式碼達到了驚人的近 2500 萬行。

MySQL 是瑞典 MySQL AB 公司開發的一款開源資料庫產品,定位在於開發小而精的 產品,其易用性強,擁有適合分散式組織的可伸縮性,也有為決策提供幫助的資料倉庫功 能,還與許多其他伺服器軟體緊密關聯,擁有出色的價效比。2008 年 Sun 以 10 億美元收 購了 MySQL,而 Oracle 在 2009 年用高達 74 億美元的資金收購了 Sun,將 MySQL 變成 了 Oracle 旗下的產品。

資料庫產品最重要的指標之一是效能,Oracle 產品優勢出眾。安全效能方面,Oracle 的安全機制得到 17 家獨立安全評估機構的認可,獲得最高認證級別的 ISO 標準認證,SQL Server 幾乎沒有獲得安全證書,而 IBM 則選擇在資料庫之外解決安全問題,依靠操作系 統等來保證 DB2 的安全;可伸縮性和並行性方面,Oracle 的伺服器透過使一組結點共享 同一簇中的工作來擴充套件,提供高可用性和高伸縮性的解決方案。SQL Server 和 DB2 的並 行實施和共存模型仍不夠成熟,在處理日益增多的使用者數和資料方面的伸縮性有限;在開 放性上,Oracle 能在所有主流平臺上執行,支援所有工業標準,使使用者可以自由選擇最佳 方案解決問題,沒有 SQL Server 只能在 Windows 系統上執行的侷限性。Oracle 的底層使 用 C 語言開發而成,隨著不斷髮展在開發中也加入了 Java 語言和技術標準,並且支援絕 大多數程式語言,相比之下,競爭對手中的 SAP 的資料庫軟體 SAP Adaptive Server、SAP SQL Anywhere 等均只支援幾種程式語言,與其他技術與平臺的相容度低於 Oracle。

Oracle 在產品的多功能性上擁有較大優勢,擁有 RAC 等資料庫領域的硬核技術。 Oracle RAC (Real Application Clusters)是 Oracle 的一項支援網格計算環境的關於應用集 群的核心技術。在一個應用環境中,讓多個伺服器來管理同一個資料庫,分散了每一臺服 務器的工作量。Oracle RAC 的技術大幅提升架構的可用性、效能、擴充套件性,即使某些實 例宕機,也能維持系統正常工作;提高叢集的事務處理能力,使得多個例項能夠併發工作; 能透過增加節點提高資料庫的效能;Oracle DataGuard是Oracle的高可用性資料庫方案, 主要功能是資料保護、資料容災。Oracle DataGuard 在主節點和備用節點之間透過日誌同 步來保證主資料庫與備用資料庫之間資料的同步,實現資料庫的快速切換和故障恢復,最 大程度保護資料庫的安全。

d.生態完善

國外資料庫公司注重技術創新和邊界拓展,不斷獲得使用者粘性。以 Oracle 為例,Oracle 是第一個引入物件概念、多媒體等多種資料格式、並行技術、網格技術的資料庫。作為數 據庫產品的標杆,Oracle 的 IT 佈局十分完備,開發的產品涵蓋了行業管理軟體、企業管 理軟體、中介軟體、資料庫、作業系統、伺服器、儲存等多個領域。

此外,國外資料庫產品的商品化程度高,一系列配套的服務也更為成熟。如 Oracle 為企業提供的 ERP 管理軟體,幫助企業遷移到雲 ERP 上,助力企業提高彈性和敏捷性, 驅動企業實現業務增長。

(2)雲計算巨頭:低成本、高彈性需求驅動,以自身應用場景向外延展

雲資料庫是部署和虛擬化在雲計算環境中的資料庫,以服務的方式提供資料庫功能。 雲資料庫是在雲計算的大背景下發展起來的一種新興的共享基礎架構的方法,它極大地增 強了資料庫的儲存能力,消除了人員、硬體、軟體的重複配置,讓軟、硬體升級變得更加 容易。雲資料庫具有高可擴充套件性、高可用性、採用多租形式和支援資源有效分發等特點, 可滿足企業海量資料儲存、低成本資料儲存、動態變化資料儲存等需求。

我們認為,雲計算廠商資料庫產品快速發展立足的原因有以下三點:

1)成本壓力變大,各廠商逐漸開始基於開源進行自研。以阿里巴巴為例,阿里曾經 就是甲骨文在亞太地區最大的客戶,但由於 Oracle 資料庫的高昂價格,阿里逐漸切換為基 於 MySQL 進行自研。

2)各大網際網路廠商依託其專有應用場景不斷完善打磨產品,最終向外延伸實現邊界 的擴張。以亞馬遜、阿里巴巴為例,這些廠商場景複雜,需求快速爆發,傳統資料庫產品 不能及時響應自身業務需求,程式設計師又無法看到 Oracle 核心原始碼,便依託其電商場景下 龐大的資料處理場景打磨資料庫產品。在此基礎上,逐步演進為雲資料服務提供商,提供 多種雲資料庫、資料倉庫、資料探勘類產品。

3)實現高自主可控。雲計算廠商大多希望可以自己開發底層系統,實現系統軟體的 安全可控,基於此,可以更好的保障自身業務和客戶資料的安全性。

從供給端看,全球雲計算產業快速發展中國增速更高,雲時代新型資料庫廠商開始持 續湧現。受益於雲計算的快速發展,以分散式、微服務、容器等為代表的雲原生技術不斷 更新迭代與升級,為資料庫產業的蓬勃向上奠定堅實基礎。2019 年,全球總體雲計算市 場規模達到 1883 億美元,同比+20.86%。根據 Gartner 預測,未來四年全球雲計算市場 規模 CAGR 將保持在 18%左右,2023 年整體市場規模將達到 3500 億美金。我國雲計算 市場未來有望是公有云和私有云並存發展,根據信通院預測,2023 年我國公有云市場規 模將達到 2307 億元,我國私有云市場規模將達到 1447 億元,整體增速高速全球雲計算市 場增速,雲時代新型資料庫廠商開始持續湧現。

從需求端來看,資料量的爆發以及資料形式的多元化帶來了爆發性的市場需求。全球 資料量生產迅猛,IDC 預測,2020 年全球資料產生量將達到 49ZB,同比增長 23%;中國 產業資訊網預測,我國產生的資料量將從 2018 年的 7.6ZB 增至 2025 年的 48.6ZB,CAGR 達 30.35%,超過美國同期的資料產生量約 18ZB。2010-2018 年全球物聯網裝置數量高速 增長,CAGR 達 20.9%,2018 年全球物聯網裝置連線數量高達 91 億個。預測 2025 年全 球物聯網裝置(包括蜂窩及非蜂窩)聯網裝置將達到 252 億個。2018 年我國物聯網連線 規模為 23 億,預計 2022 年物聯網連線規模將達到 70 億。

(3)獨立廠商:雲原生大資料帶來多元化需求,各路豪強競相崛起

我們認為,獨立資料庫廠商有望快速發展,市場百花齊放,原因有以下三點:

1)對於獨立廠商而言,多元化需求帶來多重機遇。從需求看,半結構化資料、非結 構化資料快速爆發,各公司借需求多元化發展的趨勢,推出適合特定場景的資料庫產品。 如 SnowFlake 基於雲原生,在大資料時代做資料科學、資料分析、商業智慧。

2)雲計算推動分散式快速發展,各廠商不斷實現新品升級。雲計算快速發展,分佈 式技術逐漸成為主流發展趨勢,各獨立廠商不斷基於新架構釋出產品,如基於雲原生、存 儲計算分離等,帶來先進的效能、高彈性、易擴充套件等優勢。而傳統資料庫廠商在新架構之 上的技術轉型往往存在一定難度。

3)多雲快速發展,中立優勢明顯。公有云和私有云結合的趨勢日漸明顯。中立廠商 開發資料庫產品的同時往往會考慮多種環境,打通多個雲環境,是企業在選型雲產品的時 候更加靈活。 以非關係型資料庫、資料倉庫、HTAP 等品類為例,未來有望呈現多元化發展、百花

a. 非關係資料庫(NoSQL)領域:

以 MongoDB 為例,是一個基於分散式檔案儲存的資料庫,旨在為 WEB 應用提供可 擴充套件的高效能資料儲存解決方案,介於關係資料庫和非關係資料庫之間,具備高效能、易 部署、易使用,儲存資料方便等特點。

NoSQL 泛指非關係型資料庫,區別於關係資料庫,它們往往不保證關係資料的 ACID 特性,對於超大規模和高併發資料具有較好的處理能力。NoSQL 資料庫種類繁多,資料 之間無關係,容易擴充套件。NoSQL 資料庫具有非常高的讀寫效能,尤其在大資料量下,主 要在於它的無關係性,資料庫的結構簡單。目前對於非關係型資料庫主要有四種資料儲存 型別:鍵值對儲存(key-value),文件儲存(document store),基於列的資料庫 (column-oriented),圖形資料庫(graph database)。

b.資料倉庫領域:

OLAP 是資料倉庫系統的主要應用,其支援的物件只要是面向分析場景的應用,提供 結構化的、主題化的資料提供給運營,做業務反饋和輔助決策用,同時,有些場景下,也 可以由資料倉庫對業務進行支援。

以 Snowflake 為例,提出了雲原生資料倉庫 Cloud Native DataWarehouse(CDW) 的理念,利用雲原生的資料倉庫技術,採取計算、儲存分離架構,為客戶提供了靈活、按 需付費的應用模式。

Snowflake 重視雲原生資料倉庫的構建。傳統大廠例如 Oracle,Teradata,Netezza 因為本身產品架構的侷限性,在效能、併發性、易用性上並不能完全良好的解決企業業務 需求,Snowflake 提出了獨特的儲存、計算以及管理服務分離的架構。Shared-disk 架構指 資料儲存在同一位置,共享同樣的資源。這種架構容易在多使用者訪問的情況下導致系統崩 潰,同時也難以滿足高頻讀寫、資料複製與遷移等需求。Oracle Exadata 採用了這種傳統 的數倉架構,在延展性和併發性上相對落後。Shared-nothing 架構透過最佳化規則將資源分 攤到各個節點,每個節點不共享任何資料,資料的處理過程不存在爭搶資源的情況,從而 提供更有效率的延展性和併發性。Netezza,Teradata,Redshift 採用此架構,也是 Hadoop 工作的基本原理,但此方式節點資源沒有將儲存和計算分開。當升級或者擴容發生時,系 統 需要重 新分配節 點資源 ,那麼 資料本身 就會面 臨大量 的遷移。 Snowflake 在 Shared-nothing 的基礎上提出了 Multi-cluster, shared data 的概念,這種架構的關鍵在 於將儲存和計算徹底分離,從本質上解決了傳統數倉架構的痛點。資料即服務 DaaS 指與 資料相關的任何服務都能夠發生在一個集中化的位置,如聚合、資料質量管理、資料清洗 等,無需考慮資料來源,Snowflake 完全符合 DaaS 的概念。

c. HTAP 領域(同時支援 OLTP 和 OLAP):

HTAP 架構面向多種場景,系統統一,有望成為新一代資料庫的重要發展方向之一。 基於創新的計算儲存框架,HTAP 資料庫能夠在一份資料上同時支撐業務系統執行和 OLAP 場景,避免在傳統架構中,線上與離線資料庫之間大量的資料互動。此外,HTAP 基於分散式架構,支援彈性擴容,可按需擴充套件吞吐或儲存,輕鬆應對高併發、海量資料場景。 目前,實現 HTAP 的資料庫主要有 PingCAP 的 TiDB、阿里雲的 HybridDB for MySQL、 百度的 BaikalDB、騰訊的 TBase 等。其中,TiDB 是國內首家開源的 HTAP 分散式資料 庫。

國內格局:各方勢力迅速崛起,自主可控勢在必行

市場格局:關係型資料庫佔據主流,雲資料庫借勢崛起

超百億規模,關係型佔據主導,但整體佔比出現下滑趨勢。關係型資料庫在資料庫市 場的佔比常年維持在 85%以上,由於資料量的爆發、資料形式的多元化,關係型資料庫市 場比重近年來有所下滑,但未來較長一段時間內仍會是資料庫行業的主流。智研諮詢資料 顯示,2018 年我國資料庫軟體市場規模為 139.25 億元,其中,關係型資料庫規模約 118.36 億元,佔比約 85%。Oracle 資料庫佔比關係型資料庫超過 46%,國產資料庫軟體主要有 人大金倉、武漢達夢、神舟通用、南大通用、山東瀚高等。

基於公有云的資料庫後來居上,目前與傳統部署下的資料庫規模基本持平,隨著雲數 據庫的高速增長,未來將超過傳統部署下的資料庫市場規模。IDC 資料顯示,2019 年中 國關係型資料庫軟體市場規模為 13.4億美元。其中,傳統部署模式市場規模為 7.9億美元, 公有云模式市場規模為 5.5 億美元,整體市場同比增長 30.8%。IDC 預測,到 2024 年, 中國關係型資料庫軟體市場規模將達到 38.2 億美元,未來 5 年整體市場年複合增長率 (CAGR)為 23.3%。

傳統部署模式下,此前國內市場佔據優勢地位的仍然是國外的資料庫廠商,Oracle、 Microsoft、SAP、IBM 四家公司佔據 66.8%的市場份額,國產廠商加速發展。近幾年國 內傳統資料庫廠商在國內資料庫市場所佔的份額在逐漸上升。根據 IDC 資料顯示,在傳統 部署模式下,2019 年南大通用的市場份額達到了 4.2%,人大金倉的市場份額達到了 2.7%, 其他幾家國內廠商如武漢達夢、山東瀚高、神州通用等公司也快速發展。

雲資料庫領域,阿里巴巴佔據領先地位,雲資料庫廠商上升前景將在未來幾年迅速顯 現。根據 IDC 資料顯示,阿里巴巴集團(含螞蟻金服資料庫業務收入)以 48.1%的市場份 額排名第一;騰訊以 20.4%的市場份額排名第二,2019 年騰訊加快資料庫服務產品化的 速度,連續釋出多款新產品;AWS 以 10.4%的市場份額排名第三;Oracle、華為、微軟 分別以 7.0%、3.0%、2.5%的市場份額位列第四到第六位。雲廠商的資料庫大都先用於內 部業務的使用,經過多年打磨使技術更加成熟,再針對外界的其他業務場景做出更新,將 資料庫雲化、產品化提供給其他使用者,以阿里、騰訊為代表所研發的資料庫均是這種發展 路線。由於之前一直用於內部業務,並未產品化地作為商業資料庫軟體銷售,面向外界開 放的時間較短,因此整體市場份額暫時落後。以阿里巴巴的 OceanBase 為例,OceanBase 立項於 2010 年,2011 年應用於螞蟻金服的收藏夾功能中,經過多年的打磨與歷練,一直 到 2017 年才開始幫助外部客戶解決問題。我們判斷,未來雲資料庫將持續快速發展,雲 資料庫有望成為資料庫市場的主流。

國產替代:安全可控勢在必行,打磨產品換道超車

二十一世紀以來,我國的信創產業發展越來越受到國家的重視。2008 年的“微軟黑 屏事件”,2013 年的“稜鏡門”事件,都讓我們意識到擁有自主的資訊科技的重要性。近 年,中美貿易爭端帶來了一系列摩擦,尤其是華為、中興等公司受美國政府的打壓面臨巨 大困境,許多中國科技公司被美國商務部列入“實體清單”。中美貿易爭端的本質也是中 美科技戰,只有掌握技術的自主創新能力才能讓國家更繁榮發展。在這樣的背景下,資訊 產業的軟體和硬體的國產化需求會越來越強烈,政府將持續出臺政策扶持信創產業發展。

我國的信創產業迄今為止可以分為四個階段:

第一階段:從 2006 年到 2013 年。我國在 2006 年釋出了《國家中長期科學和技術發 展規劃綱要(2006 年-2020 年)》,明確提出要大力發展核心電子器件、高階通用晶片及 基礎軟體產品,這些產品簡稱“核高基”,其中基礎軟體指的就是作業系統、中介軟體和數 據庫。

第二階段:2014 年到 2016 年。在此期間,“核高基”專項開始在多方面突破核心技 術走向產業化,如海思自主研發的國內首款智慧電視 SOC 晶片實現了量產。

第三階段:從 2017 年到 2019 年。2017 年,“核高基”重大專項第二批工程啟動會 召開,2018 年“核高基”國家科技重大專項課題實施推進會在京召開。

第四階段:從 2020 年開始。2020 年被稱為信創產業大規模推廣的元年,國家將在戰 略層次不斷支援信創產業前進,推動從軟體到硬體構建信創生態。

針對“核高基”中的基礎軟體產品,阿里巴巴在 2008 年提出了“去 IOE”的概念。 所謂去 IOE,指的是在 IT 架構中去掉 IBM 的小型機、Oracle 資料庫和 EMC 儲存裝置。 這也是國內整個信創行業一直以來科技創新的努力方向和目標。

資料庫作為基礎軟體的一 種,在信創產業中是非常重要的一類,推動資料庫國產化將是信創政策中必不可少的一環。 我國透過前期的科研投入,在大資料相關技術領域已具備加快技術創新的良好基礎。 “十三五”期間,國家重點科技研發計劃實施了“雲計算和大資料”重點專項,部分領域 已取得較大進展。大資料也已列入“科技創新 2030—重大專案”,從大資料生命週期和信 息技術體系兩個維度全面規劃、全鏈條推進大資料技術體系建設。國家發改委組織建設國 家級大資料工程實驗室,加強大資料領域相關技術創新基地建設。各地也陸續推出一批與 大資料相關的政策措施。貴州、上海、京津冀、珠三角等 8 個綜合試驗區正在開展大資料產業發展試點。十九大報告中明確提出要建設“數字中國”,推動網際網路、大資料、人工 智慧和實體經濟深度融合,實施大資料戰略,加快建設數字中國。

安全可控背景下,以黨政軍為代表的信創行業正加速實現國產替代,傳統老牌資料庫 廠商是本輪紅利核心受益者,黨政信創正持續放量。2020 年,以黨政公文、OA 系統為代 表的信創資料庫招投標工作加速開展,2020 年 Q4 各資料庫公司整體進入業績兌現階段, 主要代表公司為人大金倉、武漢達夢等。我們認為,自 2021 年起,黨政資料庫建設有望 從以公文系統為代表的邊緣系統逐步向電子政務等核心系統領域邁進,同時伴隨十四五規 劃的逐步落地,軍方信建立設也將逐步加速。

行業信創正部分起量,金融、電信行業引領市場,未來各行業實現全面國產化替代可期。金融行業方面, 2020 年 10 月 19 日,易鯨捷中標 4.26 億元貴陽銀行核心業務系統易 鯨捷國產資料庫應用專案。2021 年 1 月 27 日,萬里開源中標中國光大銀行集中式資料庫 定製研發專案;2021 年 1 月 21 日,巨杉軟體中標唐山銀行新一代資訊系統專案叢集影像 平臺數據庫軟體專案採購。電信方面,中國移動國產資料庫替代走在前列,2020 年 9 月 16 日,武漢達夢中標蘇州研發中心 2020-2022 年移動雲國產資料庫專案;2021 年 1 月 13 日,阿里雲中標中國移動福建分公司 2020 年國產分散式關係資料庫軟體。

在安全可控的背景下,傳統資料庫廠商、雲廠商、獨立資料庫廠商有望在政策的不斷 驅動下投入技術研發,不斷打磨產品,進而縮小與海外資料庫龍頭的差異,藉此機會,各 廠商不斷在政府、電信、金融領域樹立標杆專案,未來有望不斷向更多的領域拓展,藉此 實現換道超車。

趨勢推演:大資料驅動產業變革,雲與開源助推企業快速成長

從整個大資料產業鏈來看,上游是硬體裝置和基礎裝置,下游則是各種應用軟體,而 資料採集、資料儲存和雲平臺、資料分析和挖掘則是位於產業鏈的中游。其中 Microsoft、 IBM、Oracle、Snowflake 等公司的資料庫軟體實現了資料分析和挖掘功能。由於大資料 一般有資料型別繁複、資料量龐大、分散式儲存等特點,僅憑藉傳統關係資料庫存取和分 析大資料存在一定的難度,因此 Oracle、IBM 等公司都嘗試將自己開發的一些產品與 Hadoop 等進行融合,取長補短,以滿足大資料處理的需求。大資料產業的快速發展給國 內資料庫廠商帶來眾多機遇。

雲計算與大資料高度結合,加速產業變革,資料庫上雲趨勢明顯,助推國內企業快速 成長。從技術升級來看,雲計算快速發展,加速釋放相應的配套服務紅利,尤其是混合雲 趨勢日漸明顯,不管公有云廠商還是獨立資料庫廠商均有望得到良好的發展機遇。根據 Gartner 的預測,到 2023 年將有 75%左右的資料庫會被部署或遷移到雲平臺上。從需求 來看,需要處理的資料越來越多,需要處理資料的頻率也越來越高,往雲端發展,可以同 時解決資料量大和使用頻率高兩個問題,同時具備高彈性、低成本等優勢。

國內雲計算龍頭多借助自身場景向外拓展,阿里巴巴、騰訊等公司面臨過許多短時間 內資料量巨大的場景。如阿里巴巴的雙十一,需要處理來自全國的海量使用者的資料,阿里 雲在 2019 年的雙 11,創造了 54.4 萬筆/秒的交易峰值,2019 年雙 11 單日處理資料量達 到了 970PB。騰訊近幾年的爆款手遊王者榮耀、春晚的微信紅包等也是面對極大的資料流 量。這種在任何歐美國家都不會遇到的複雜多變的應用場景、驚人的使用者數量以及瞬息萬 變的使用者需求,促使中國資料庫廠商快速崛起。阿里、騰訊等國內公司在大資料方面透過 了嚴峻的挑戰,有更多的經驗去進一步發展大資料技術,類似的資料處理經歷也能夠讓用 戶對他們的技術更有信心。由於分散式資料庫更多地與雲技術相結合,因此分散式資料庫 的進步與雲的服務模式關係密切。中國資訊通訊研究院的雲計算發展白皮書(2019 年) 的資料,在國內,IaaS 市場佔比達到 60%左右,這體現我國在雲基礎設施的建設方面有 了一定成就,能夠為分散式資料庫的進一步發展做好基礎,但是同時也反映出我國的 SaaS 和 PaaS 市場存在巨大的發展空間。

開源社群的持續火熱助推資料庫技術快速發展。開源模式是一種相對於專有模式的開 發模式,是指將原始碼進行公開,更好的促進軟體的快速創新。開源軟體層出不窮,任何人可以得到軟體的原始碼,加以修改學習,甚至在許可範圍內重新發放。

熱門開源專案持續湧現,科技巨頭和開源軟體公司積極參與。近年來,開源熱度持續 攀升,機器學習、容器、移動端開發等熱門領域開源專案持續快速增長。據 GitHub 資料 顯示,截止 2018 年,GitHub 已有 3000 萬開發人員,200 萬家企業和組織,擁有 9600 萬個程式碼庫。各大科技公司如谷歌、紅帽、微軟、阿里巴巴是開源專案的主要貢獻者,不 斷提升技術積累和影響力,為自身生態的構建和市場的拓展奠定基礎。開源資料庫包括 PostgreSQL、Hbase、Mysql 等。開源資料庫的比例在逐步上升,DB-Engines 的統計 結果顯示,截止 2020 年開源資料庫和商業資料庫的比例已經相近。

藉助開源的力量,國內資料庫企業快速實現技術創新,縮小差距甚至趕超海外資料庫 龍頭。根據 DB-Engines 的另一項關於兩類資料庫的受歡迎程度的調查結果顯示,開源數 據庫從 2013 年以來受歡迎程度一直呈現出增長的大趨勢。經過不斷的發展和完善,開源 資料庫的功能也變得越來越強大Rightscale 資料顯示 2018 年全球有 24%的私有云的底 層技術使用了開源雲計算平臺 Openstack,國內許多私有云也都是基於 Openstack 平臺。 而 Openstack 平臺的許多使用者在開發時使用了開源的 MySQL 的相關技術。雲資料庫架構 許多都以開原始碼為基礎進行開發,縮小了國內外資料庫公司在分散式資料庫領域的技術 壁壘。在分散式資料庫的開發中,國產資料庫公司與海外資料庫公司的差距較小,擁有趕 超前景。

重點公司資料庫業務梳理(詳見報告原文)

阿里巴巴:憑藉領先的雲技術,分散式資料庫大放異彩。

騰訊:圍繞 TDSQL 系列,提供領先的分散式資料庫服務。

華為 GaussDB:與 AI 深度融合,擁有異構計算創新架構。

PingCAP:聚焦開源分散式 HTAP 資料庫 TiDB。

星環科技:大資料基礎平臺綜合服務商。

巨杉資料庫:以分散式 SequoiaDB 為核心,聚焦金融行業。

人大金倉:政務大資料龍頭,與軍工領域深度合作。

武漢達夢:背靠 CEC,擅長混合型資料庫開發。

海量資料:資料庫、資料計算、資料儲存一體化服務商。

南大通用:國內份額領先,圍繞 GBase 與雲技術積極結合。

科藍軟體:專注銀行市場,擁有記憶體資料庫 Goldilocks。

萬里開源: MySQL 中國的白金認證合作伙伴。

風險因素

(1) 資料庫國產化進展不及預期 (2) 資料庫技術發展不及預期 (3) 行業競爭加劇。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關資訊,請參閱報告原文。)

19
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 3D列印中電子束熔化(EBM)的完整指南