首頁>科技>

背景

隨著資訊行業突飛猛進地發展,世界越來越數字化,網際網路上的資料呈爆發式增長。全球每天會產出超過500億EB的資料,且資料量大約每兩年都會翻一番。

隨著網際網路透過5G技術滲入到汽車、智慧家居等場景,使用者產生的資料越來越多,由此帶來的隱患也逐漸增加。

由於雲端儲存的盛行以及大型網際網路公司壟斷地位的加固,大量使用者的資料聚集在中心化的資料中心內。在這種場景下,使用者的資料可以被人工智慧演算法分析,從而利用使用者資料獲取利益,而且由於資料的中心化,使用者的隱私資料存在被審查以及洩露的風險。此外,資料的可用性也是問題,此前360網盤、新浪微盤等雲盤提供方相繼停止提供服務,導致大量使用者資料丟失。

透過結合區塊鏈,可以給網際網路上的資料一個新的去處,作為一種新的可選方案安全、去中心化地儲存使用者資料。

如果一個流程可以在數字世界被快速驗證,那麼就可以結合區塊鏈這個信任機器來進行處理。因為資料儲存是原生於數字世界的,資料儲存與區塊鏈的結合不需要透過預言機,只需要設計合適的驗證機制以及經濟激勵,就可以創造一種原生於網際網路的儲存協議。

並且網際網路上存在許多閒置的儲存資源,透過構建一種原生於網際網路的儲存激勵協議將這些分散閒置的儲存資源整合起來,在提升資源利用率的同時,可以提供廉價的儲存服務,同時擺脫中心化服務商的限制。

目前有多個專案致力於將儲存與區塊鏈結合,包括Filecoin、Arweave以及Storj等,都在透過各種設計和理念努力實現去中心化的儲存網路,Memo也將以實現真正安全可用的區塊鏈儲存系統為己任,以區塊鏈技術賦能實體產業為目標。

如何驗證資料儲存

相較於一次性的計算服務,儲存更具有持續性,所以需要尋找一個可靠的驗證機制和經濟機制來確保資料一直被儲存,目前已有的專案提出了各種應對的機制。

Filecoin

Filecoin是區塊鏈儲存領域最著名的專案,為了確保儲存礦工儲存資料,同時抵抗女巫攻擊和生成攻擊等,Filecoin提出了複製證明(Proof Replication)與時空證明(Proof of Space of Time)兩種機制,用於保護網路安全以及資料安全。

複製證明的邏輯是,礦工在收到使用者的資料後,首先將資料進行延遲編碼得到副本資料,然後生成一個零知識證明來保證編碼過程的正確性。透過這樣一次編碼,礦工將無法在儲存一份資料的同時聲稱自己儲存了多份。

在複製證明過程後,Filecoin還使用時空證明機制,保證礦工一直儲存資料,礦工需要定期為副本生成默克爾證明,並用零知識證明壓縮後提交到鏈上,如果礦工丟失資料,從而沒有及時生成證明或者生成了錯誤的證明,協議將會扣除礦工抵押的代幣。透過這個機制,Filecoin強制所有礦工都正確儲存資料。

Filecoin的方案去中心化非常明顯,但是在資料的可用性以及耐久性上都有較大妥協。

複製證明使用的延遲編碼為了安全考慮,使得完整的編碼過程將耗費幾小時,也就是說,使用者在將資料傳輸給礦工後,需要幾小時後才能保證資料被區塊鏈驗證,而且在解碼資料時,同樣需要一兩個小時,這樣的延遲使得Filecoin的儲存服務難以使用,並且Filecoin沒有設計任何資料修復措施,資料的耐用性無法保證,所以目前Filecoin的儲存算力幾乎全部為隨機資料,而不是使用者真實儲存的資料。

Arweave

Arweave另闢蹊徑地提出了資料永存的概念,即使用者將資料上傳到Arweave區塊鏈上以後,資料將依據Arweave的設計永久儲存,Arweave透過BlockWeave結構的挖礦來激勵礦工儘量多儲存區塊,在每次挖礦出塊的同時,礦工需要引用一個回憶塊,回憶塊的高度通過當前區塊的雜湊模的高度得到,從而保證了回憶塊的隨機性和不可預測性。透過這種方式,礦工會盡力多儲存資料,以確保自己可以獲得出塊獎勵。Arweave不採用密碼學來驗證資料,而透過經濟激勵的方式鼓勵多存資料的思路是挺創新的。

由於Arweave的設計依然沒有突破區塊鏈本身的侷限,所以在擴充套件性上存在很大的不確定性。

首先,當BlockWeave佔用的儲存空間超出了一般機器的儲存空間上限時,如1PB,全量儲存的礦池模式將取得極大優勢,普通機器僅作為礦機接入礦池,這會使得副本率大大降低。其次,隨著區塊高度的增加,每個區塊被抽中的機率越來越低,如果途中有某個區塊丟失但被抽中,BlockWeave的追加將停滯。

Storj

相比於其他的儲存專案,Storj並不把去中心化當成第一目標,而是致力於提高資料儲存的耐用性以及服務質量,在Storj的設計中,衛星(Satellite)節點作為完全可信的中心化節點管理資料,同時驗證儲存節點是否正確儲存資料。由於Storj加入了中心化節點,大大降低了設計難度,從而無需複雜的驗證機制,僅使用簡單的私有驗證即可。Storj的簡化設計提高了儲存的使用體驗,同時能儲存的相對可靠。

Memo

Memo從一開始考慮儲存證明時,就致力於設計一種可公開驗證方案,同時驗證資料的通訊開銷應儘量降低,而且不應生成證明和驗證證明的計算成本也應降低。為了滿足以上條件,Memo團隊設計了一種資料完整性驗證方案,對使用者對資料進行分片,並給分片編號,同時對每個分片生成驗證標籤,然後將分片資料與標籤傳送給儲存節點。

在每次驗證資料時,只需要指明分片驗證編號,比如100-200號分片,儲存節點將對應分片與標籤讀取出來,並生成一個幾百位元組的證明,透過這幾百位元組的證明即可證明全部分片的正確儲存,再結合機率抽查,可以實現用幾百位元組的證明來驗證幾十TB的資料。並且該驗證可以完全由區塊鏈來進行,從而實現完全的去中心化。

Memo資料完整性證明原理

Memo的資料完整性方案,實現了公開驗證,任何擁有該使用者公鑰的人都可以驗證證明的正確性,由此Memo不需要如Storj一樣,透過可信節點轉發流量。同時,除去資料讀取時間,生成證明可以在幾秒內完成,驗證證明可以在一秒內完成,這大大降低了節點的計算負擔,同時,透過證明壓縮,可以將證明的通訊開銷降至常數級。利用該方案,Memo可以在分散式網路中實現可信確權的資料儲存,這將提高閒置裝置的利用率,為使用者提供更廉價的儲存解決方案,同時避免資料受中心化機構操縱。從這個層面Memo就可以很好的解決網際網路資料儲存中被中心化服務商限制的問題。

Memo生態

基於Memo可公開驗證性的資料完整性方案,為了充分利用區塊鏈的安全可靠特性,並避免其成為整個系統的效能與成本瓶頸,在Memo 中,只有那些儲存系統中最為關鍵的資料,如角色(賬戶)資訊、智慧合約資訊以及費用結算等,才會被儲存到區塊鏈的主鏈中。而其他的資料,如資料位置資訊、使用者資料等,則被存放在價效比更高的邊緣儲存裝置中。同時,結合RAFI等資料可靠性的設計將被用於保障邊緣儲存裝置中的資料安全性與可靠性,在高性價比的前提下,提供一個高耐久性的儲存系統。

後續Memo將與多方開展合作,構建並完善Memo生態。首先立足於服務區塊鏈生態已有的儲存需求,使得區塊鏈世界在基礎設施層進一步去中心化,同時逐步推進企業與個人的需求對接,透過Memo重塑企業與使用者之間的關係。

7
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 酷開網路正式更名酷開科技 釋出共享屏App和共享屏Mini聯結器