回覆列表
  • 1 # 瓏hhh

    最近的一項調查顯示,隨著雲端物件庫成為事實上的資料湖,企業在查詢和統計堆積的所有資料時,處於艱難的境地。對於擁有大量空曠空間的人們來說,其存放的物品總是凌亂散佈,而這可能是人類的本性。

    最近的一項調查顯示,隨著雲端物件庫成為事實上的資料湖,企業在查詢和統計堆積的所有資料時,處於艱難的境地。

    對於擁有大量空曠空間的人們來說,其存放的物品總是凌亂散佈,而這可能是人類的本性。而目前也有這樣一個趨勢,即對於越來越多的企業來說,雲物件儲存正在成為事實上的資料湖。好訊息是,雲物件儲存成本相對更低,並且具有高度可擴充套件性,而且越來越易於訪問。例如,大多數雲Hadoop服務交換Hadoop分散式檔案系統(HDFS)的物件儲存,並且越來越多的雲計算提供商正在提供服務,提供臨時查詢或將雲物件儲存視為資料倉庫的擴充套件表。

    依賴雲端儲存作為預設目標或資料湖的另一個方面是需要協調通用目標中資料的積累,需要對資料隱私或資料保護更負責,尤其對於GDPR等規則生效的情況。

    Chaos Sumo公司計劃在今年夏天推出SaaS提供商的搜尋層以新增雲端儲存(現在稱為Amazon S3),該公司剛剛釋出了一項調查,顯示雲計算採用者感受到的一些痛點。

    無可否認,這個調查規模並不大,只有120名受訪者,主要針對的是資料操作專業人員,該示例很可能偏向已經接受雲計算的組織。例如,72%的人表示他們目前使用某種形式的雲物件儲存。對於那些使用亞馬遜S3的人來說,40%的受訪者表示他們預計明年他們使用S3儲存的比例至少會增長50%。

    對於企業來說,主要用於備份、儲存和歸檔。但是28%的人已經在使用資料湖的物件儲存,而另外18%的人計劃在未來的12-18個月內實施。毫不奇怪,對於這個以AWS為主的樣本,如今在使用Amazon Athena報告的類似比例(23%)。大約一半的受訪者表示,已使用Amazon Redshift資料倉庫,Spectrum現在可以將S3視為擴充套件表。

    Athena等工具的創新開放了對系統中資料的互動式訪問,而不是對儲存進行最佳化,而不需要ETL(儘管資料必須採用某種形式的半結構化儲存,如CSV、JSON、Parquet或其他格式)。

    但正如圖表所顯示的那樣,隨著資料在物件儲存中的湧現,越來越多的少數人擔心問責制問題。這正是Hadoop等平臺的商業銷售優勢,以及用於分析和資料準備的打包工具,這些平臺具有某種形式的資料沿襲,安全性和訪問控制作為其存在的理由。雲物件儲存在涉及治理或周邊安全時是赤裸裸的——傳統上是資料平臺、雲主機或消耗資料的分析工具的工作。

    因此,四分之一的受訪者擔心他們將不得不移動資料來分析資料,而數量較少但具有統計學意義的少數群體則對查詢資料、合規性和安全性表示擔憂。他們花費大量時間清理和準備資料,超過一半的受訪者表示花費每週至少6小時,其中近40%的受訪者表示每週花費超過11小時來完成任務。

    值得注意的是,只有7%的受訪者表示目前很容易分析當今在物件儲存中的資料。這就是調查贊助商Chaos Sumo公司的商業用途。該公司計劃引入它所謂的“資料結構”,將於今年夏天將S3資料開啟到Elastic search,供現有SaaS提供商使用OEM。預計S3將成為更多分析平臺和工具的良好去處。對於Chaos Sumo來說,將搜尋作為SaaS提供商的實用工具來增加這些資料的可見性可以更好地應用雲端儲存。

  • 中秋節和大豐收的關聯?
  • 水滸108將,你覺得他們死得值嗎?