2020年中國頒佈了“新基建”的指導意見,目的是為了服務數字經濟。數字經濟實際有三個關鍵的概念,第一個是“算力成為新生產力”,第二個是“5G、雲、AI”成為新生產工具,第三個是“資料是新生產資料”。然而在新基建當中,大家普遍對5G、人工智慧、超算、大資料中心等更瞭解,很少有人聽說過資料儲存。
其實,我們首先是不太瞭解“基礎設施”的基礎技術,是近年來的網際網路技術發展以及國際科技和貿易摩擦等原因,讓我們瞭解了ICT基礎設施的重要性。ICT基礎設施,一般包括計算、儲存、網路和能源幾個關鍵部分,大家普遍瞭解5G、雲、AI、計算等熱詞,甚至由於綠色節能問題,數字能源等基礎技術都已經被廣泛瞭解。
為什麼單單資料儲存不被瞭解呢?這是因為資料儲存的選擇,不是企業數字化運營最開始的起點,不是跟業務強關聯的基礎設施部分。為什麼要關注資料儲存呢?因為資料儲存對企業數字化轉型至關重要且影響巨大。尤其是資料的極致體驗、穩定可靠、資料安全、綠色節能等問題,如果資料儲存出現瓶頸,對企業的數字化運營的影響是與算力不足、聯接不廣同等重大的影響。
如果你對這裡提到的企業應用的資料儲存不太瞭解,我們可以對比一下消費電子產品中的資料儲存的情況,是比較類似的。好比我們選一臺智慧手機,關注5G、拍照、螢幕、處理器能力、記憶體和儲存等。記憶體和儲存空間很重要,但是往往不是第一時間的考慮,但是考慮不好記憶體和儲存的選擇,後續肯定很痛苦,比如刪聊天記錄,刪圖片/影片騰挪空間等。不僅如此,一旦手機丟失了,或者受到機械破壞,水質浸泡,誤刪除或者病毒入侵後可能導致關鍵的資料丟失。這些都是儲存平時不被感知,但是作為“基礎設施”至關重要的表徵。
同樣的,在新基建當中資料儲存也是非常重要的,但是沒有被顯性化地提出來。比如新型資訊基礎設施,資料中心中就是包含計算、儲存、網路和能源的,人工智慧是需要資料儲存提供海量資料的;比如在融合基礎設施當中,金融行業提供“兩地三中心多活”的資料儲存,能源產業需要資料儲存幫助進行“能源三維勘測”的資料密集型超算,生命科學需要資料儲存支撐“基因測序”;又比如,創新基礎設施當中,為科教中心提供HPC儲存等。
那麼,如何認識資料儲存呢?資料儲存的重要性有哪些呢?
華為OceanStor資料儲存
首先資料儲存是企業業務的生命線,要極度可靠。對於很多企業的經營管理者來講,最好平時運營業務的時候,想不到儲存,因為你想到他就意味著出事兒了。東京證券交易所在某年十月份,因為儲存故障導致業務大癱瘓,暫停交易一天,損失和影響不可估量;網際網路技術服務商微盟,資料被惡意刪除,恢復耗時七天七夜,賠償客戶損失1.5億;天津市第二人民醫院,2018年資料中心因持續大雨被淹,由於未做災備,導致醫院無法繼續開展業務。有一套好的儲存就不一樣了,例如2001年的911恐怖襲擊的時候,雖然世貿雙子塔的資料中心被毀壞,但是因為各大金融企業都建設了完備的金融災備方案,金融業務在幾個小時內就恢復了。不同於伺服器中的內建盤,或者我們平時看到的隨身碟,資料儲存在安全性上有專業的設計,包括資料冗餘備份、雙活架構、掉電保護、生產流程工藝保障,以及快照,複製,克隆,映象等。
其次,資料儲存關係客戶體驗,是企業獲客和運營能力的關鍵。比如,金融銀行的移動線上支付業務,鐵路12306購票系統,運營商的賬單計費,醫院的醫療資訊管理系統,在普遍移動網際網路應用的快速發展下,消費者都是不能容忍一秒鐘地等待的,現在的資料儲存的時延,已經從原本的10ms等級下降到100us的等級。另外,企業的很多經營分析活動,也是受限於資料儲存。在2020年的華為全聯接大會上,浦發銀行的客戶就介紹,如果資料的IO(讀寫)效能做不起來,配置再多的算力都沒有用,無法高效的利用大資料提升精準營銷的能力。還有就是企業是否能夠把資料治理好,形成統一的資料湖,對於“大資料”來講非常重要。
還有,資料儲存還是科技探索的“重器”。高效能計算一致是科研的一個珠穆朗瑪峰,決定者機構/企業的科研創新能力。歷史上我們都是關注算力的提升,例如比較出名的“銀河計算機”。但是近些年,業界已經普遍能夠提供充沛和經濟的算力,但是很多時候決定差異的地方已經從算力轉換到了對資料量的掌握以及資料處理能力的提升。在人工智慧的時代,是算力、演算法和算據缺一不可的情況,而且資料決定者資產的差異,而如何利用好這個資產很困難,因為資料量大、資料的型別複雜、資料處理的過程步驟過多。可以說高效能計算已經從計算密集型走向了資料密集型。
基因測序依賴高效能資料分析
最後,現在的經濟發展要環境友好,要綠色節能。根據華為GIV預測,全球資料量將從2018年的33ZB增加到2025年的180ZB,增長六倍。這將帶來大量的資料儲存需求,而資料儲存需要消耗電子裝置和電力能源。據統計,資料儲存在資料中心的ICT裝置中,耗電量佔比是25%,如果六倍耗電量提升是不可持續的。那麼,對資料儲存的資料縮減、功耗等進行最佳化就至關重要。
以上是從商業本身思考,如果從供應連續性考慮的話,資料儲存當中也有關鍵器件獲取的問題,比如機械硬碟目前技術主要掌握在日本,而新興的快閃記憶體技術則全球有更好的可獲得性,這也對很多大型企業,關注供應風險的企業,也是一個關鍵的考量點。如果進一步考慮資料主權的風險,企業需要做好資料接入的鑑權,分級保護,防範駭客攻擊等等,資料儲存對企業業務的網路安全、資料安全也能起到很好的保護作用。
所以,雖然資料儲存沒有被正式列在“新基建”的清單當中,但是作為數字經濟的三大要素之一的資料,對資料儲存有很高的依賴性。期望今天對資料儲存的介紹,能幫你解開一些迷惑。
我是2019年轉入華為資料儲存產業工作的。2012年華為出資將華賽收購後,開始正式進軍資料儲存產業。接著產業進入移動網際網路時代、介質技術向全快閃記憶體快速邁進、系統架構向雲化演進的整體浪潮,華為推出了OceanStor融合儲存,OceanStor Dorado全快閃記憶體,OceanStor Pacific海量資料儲存等系列產品,目前已經在中國取得了產業領導者的地位,在Gartner的魔力四象限評估中,已經多年被列為產業領導者,在全球已經位列市場規模第三(根據Gartner/IDC分析師報告資料),相信有更多的機會為新基建的發展貢獻力量。