回覆列表
  • 1 # 使用者2019259378857

    大資料與傳統的資料技術的差別:

    1、資料規模大:傳統資料技術主要是利用現有存在關係性資料庫中的資料,對這些資料進行分析、處理,找到一些關聯,並利用資料關聯性創造價值。這些資料的規模相對較小,可以利用資料庫的分析工具處理。而大資料的資料量非常大,不可能利用資料庫分析工具分析。

    2、非結構化資料:傳統資料主要在關係性資料庫中分析,而大資料可以處理影象、聲音、檔案等非結構化資料。

    3、處理方式不同:因為資料規模大、非結構化資料這兩方面因素,導致大資料在分析時不能取全部資料做分析。大資料分析時如何選取資料?這就需要根據一些標籤來抽取資料。所以大資料處理過程中,比傳統資料增加了一個過程Stream。就是在寫入資料的時候,在資料上打一個標籤,之後在利用大資料的時候,根據標籤抽取資料。這個過程就類似於尋找圖書:如果你在你個人書櫃裡,尋找一本書是很容易的,所以你買了書,可以直接放到書櫃上,不用做任何處理;而如果圖書館買了書,如果不做任何處理的話,你是很難找到一本書的,所以圖書館在新書入庫的時候,首先會對每本書打上標籤,而這個打標籤的過程,就是類似於Stream的工作。

  • 中秋節和大豐收的關聯?
  • 奪帥最後什麼意思?