回覆列表
-
1 # akmny15725
-
2 # 掉眼淚的冠軍
ETL:Extraction-Transformation-Loading的縮寫,資料的抽取、清洗、轉換、裝載 抽取主要是針對各個業務系統及不同網點的分散資料,充分理解資料定義後,規劃需要的資料來源及資料定義,制定可操作的資料來源,制定增量抽取的定義。 清洗主要是針對系統的各個環節可能出現的資料二義性、重複、不完整、違反業務規則等問題,允許透過試抽取,將有問題的紀錄先剔除出來,根據實際情況調整相應的清洗操作。 轉換主要是針對資料倉庫建立的模型,透過一系列的轉換來實現將資料從業務模型到分析模型,透過內建的庫函式、自定義指令碼或其他的擴充套件方式,實現了各種複雜的轉換,並且支援除錯環境,清楚的監控資料轉換的狀態。 裝載主要是將經過轉換的資料裝載到資料倉庫裡面,可以透過資料檔案直接裝載或直連資料庫的方式來進行資料裝載,可以充分體現高效性。在應用的時候可以隨時調整資料抽取工作的執行方式,可以靈活的整合到其他管理系統中。
ETL是資料抽取(Extract)、清洗(Cleaning)、轉換(Transform)、裝載(Load)的過程。是構建資料倉庫的重要一環,使用者從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉庫模型,將資料載入到資料倉庫中去。