首頁>Club>
5
回覆列表
  • 1 # 森林狼2011版

    ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將資料從來源端經過抽取(extract)、互動轉換(transform)、載入(load)至目的端的過程。ETL是將業務系統的資料經過抽取、清洗轉換之後載入到資料倉庫的過程,因而也稱為資料倉庫技術。其目的是將分散、零亂、標準不統一的資料整合到一起,為企業的決策提供分析依據。

    可以看出,ETL要做三部分工作,資料抽取、資料的清洗轉換和資料的載入。資料抽取一般是透過工具從各個不同的資料來源抽取到一箇中間層中,其中可以做一些資料的清洗和轉換,這個過程要注意抽取效率。資料清洗是指將不符合要求的資料除掉,包括錯誤資料、不完整資料、重複資料。資料轉換要做的工作是把所有資料的模板、標準、計算規則等進行統一,如儲存結構、資料編碼等。清洗轉換好的資料按著標準的ETL架構儲存到資料倉庫中,以備進行資料分析和決策。

    ETL是BI重要的一個環節,是進行資料分析的基礎。資料倉庫構建好後,才有可能基於資料倉庫來構建分析模型並根據需求展現最終的結果。做好一個BI專案,其中很大一部分工作是ETL,ETL的質量決定了BI是否成功。有的BI工具本身就帶著ETL功能,實際上是把前期和後期工作整合到一起了。當然專門的ETL工具就有很多,完全可以滿足BI的需要,因而在工作中除了要考慮工具的效能、效率,還要考慮專案的成本,經濟也是必須考慮的因素。實際上ETL不僅是BI的基礎,也是報表工具的基礎。報表工具價格比較廉,如FINE、RAQ、皕傑報表的價格與BI比起來實在算不了什麼,所以也就不與ETL一起說事兒了。

  • 中秋節和大豐收的關聯?
  • 每天大聲第朗讀英語真的可以培養語感嗎?