資料作為一項重要資產,已經成為企業的共識,為了更好地儲存資料、挖掘資料,企業需要:·一個超級大的儲存…

127

一、概述上篇文章我們寫了Hadoop3.1.1的原始碼編譯,這裡我們將編譯的原始碼進行部署,作為我後面遠端程式碼除…

116

說完了Hive我們接著來看另外一個建立在Hadoop基礎上的儲存引擎HBase,HBase以記憶體作為快取資料落地到HDFS的Key-Value…

52

文件編寫目的日誌聚合是YARN提供的日誌集中化管理功能,它能將執行完成的Container任務日誌上傳到HDFS上,從而減…

91

在本文中,我們將介紹PVS-Studio靜態分析器對ApacheHadoop程式碼庫的觀察結果。為了獲得高品質的生產程式碼,僅確…

320

網際網路史上最全技術崗位詳解,包括:前端研發、後端研發、移動端研發、大資料、專案管理、測試、運維、技…

140

來了!來了!大資料的時代真的來了!一分鐘內,微博推特上新發的資料量超過10萬;社交網路“臉譜”的瀏覽量…

28

一.hadoop是什麼Hadoop被公認是一套行業大資料標準開源軟體,在分散式環境下提供了海量資料的處理能力。幾乎所…

58

本文約1600字,精讀耗時因人而異;建議速讀,耗時約2分鐘。人們經常談到創業只差程式設計師,拋開段子手的戲…

251

1概述ApacheKafka是一個分散式高吞吐量的流訊息系統,Kafka建立在ZooKeeper同步服務之上。它與ApacheStorm和Spark完美整合…

181

這是一部系統、深度講解大資料技術棧的著作,從資料收集、資料儲存、資源管理與服務協調、計算引擎、資料分…

268 1

Hadoop被公認是一套行業大資料標準開源軟體,在分散式環境下提供了海量資料的處理能力。幾乎所有主流廠商都圍…

323

最近遇到了很多正在研究ETL及其工具的同學向我們抱怨:同樣都在用Kettle,起點明明沒差異,但為什麼別人ETL做的…

341

以前,在人們的心目中,大資料就是Hadoop。近年來,大資料產業飛速發展,應用層和基礎層軟體不斷進步,但是實…

584

JAVA的精密,強大,擁有其它語言不可替代的效能和可維護性,早已經是成為最受歡迎的程式語言之一,很多人想…

72

訊息佇列作為系統解耦,流量控制的利器,是分散式系統核心元件之一。了解訊息佇列背後的實現是非常重要的。…

529

整個系列的文章從銀行資料倉庫架構,ETL,模型,資料管理以及幾大方面應用介紹了資料倉庫,可以讓大家對銀行…

143

最近簡單的研究了一下SparkonK8s,期間遇到了些許問題,在這裡總結一下分享給大家。環境介紹hadoop叢集:部署在…

94

實時資料的去中心化是Streamr專案很重要的一部分。在全球資料產量日益增長的背景下,尤其是隨著物聯網的廣泛…

38

延伸閱讀