首頁>科技>

對於企業而言,坐擁龐大的資料資源,想要實現大資料分析,首要的就是要搭建起自身的大資料系統平臺,而每個公司都有自己特定的業務場景,因此在大資料平臺上的需求是不一樣的。今天我們僅從通用的角度,來聊聊大資料分析需要什麼技術架構?

我們熟悉的以BAT為首的網際網路大廠,都擁有自身的大資料系統平臺,但是各自面臨的業務場景是不同的,比如說騰訊,主要是社交業務場景;百度,主要是搜尋業務場景;而阿里,主要是電商業務場景。

這樣不同的業務場景下,需要根據實際的業務需求,選擇適合自己的技術框架,來搭建自己的大資料架構體系。但是從技術架構體系的共性來說,是可以從通用的技術模組去理解,來幫助我們更好地學習和掌握大資料技術架構的。

大資料分析技術架構通用模組:

資料收集模組:主要負責收集各種資料來源的資料,包括日誌檔案、網路請求、資料庫、訊息佇列等,並將這些資料轉換為檔案或者訊息向後傳遞。

資料轉存模組:主要負責將資料定時傳遞到分散式儲存或者實時傳遞給下游的資料處理程式。

ETL模組:主要負責資料的清洗、格式和內容的處理和轉換、資料分級分揀、載入至資料倉庫等。

資料倉庫模組:這是整個架構的核心,資料倉庫是資料有組織的集中儲存的地方,負責資料的存取和管理。

元資料管理模組:主要負責記錄和約束資料倉庫中資料的含義和格式,控制著資料的生命週期和資料品質。

分析引擎模組:資料分析師互動最多的模組,主要負責執行各種分析語句或程式碼,完成各種分析任務。

作業管理與排程模組:負責分析作業的管理和定時排程,包括作業的增刪改查、檢視修改歷史、設定排程定時和執行引擎等。

資源分配與排程模組:主要負責在多作業同時執行的場景下,有效協調和分配叢集的資源,使資源利用率最大化。

關於大資料分析需要什麼技術架構,以上就為大家做了一個簡單的介紹了。大資料技術架構需要結合實際業務來考量,學習階段,先從通用層面去掌握,實際工作當中還需持續積累經驗,才能真正地掌握紮實,融會貫通。

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 拒付50億補償?加拿大大耍流氓,華為還是被拒了