Framework 開源框架,這是在商業BI系統中所沒有的。我們可以使用它們來構建自己的BI工具,或者增強和擴充套件我們的BI解決方案。 Stand-alone Tools 獨立的BI工具,這是開源專案中數量最多的一類。很多工具只側重BI系統中的某個環節和方面,如ETL、Report、OLAP和Database等等。 BI Suit 在統一的架構下提供了多種BI系統的特性的工具集合。就目前的情況看,不管是商業軟體還是開源軟體,還沒有任何一個套件提供了完整的端到端的BI解決方案。這些開源的BI Suit是透過連線多個其他的元件和工具的方式形成套件的,由於BI系統涉及到的工具是非常多的,所以整合一套完整的BI解決方案是很困難的。 BI解決方案中的工具 一個完整的BI解決方案中有多種工具來完成BI系統中各個階段的工作。 ETL工具 資料抽取、轉換和載入工具。優秀的ETL工具應該具有以下特性: 1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定義流程並自動化執行ETL任務。 2、 Centralized Metadata Repository and Management。集中儲存和管理符合業界標準的元資料。 3、 Data Profile and Validation。可以檢驗資料的質量。 4、 High Performance。在大負荷的任務執行中仍然有良好的效能。 5、 Scalable, Platform Independent。具有良好的彈性,支援多種作業系統和資料庫系統,能操作多種異構的資料來源。 6、 Open Architecture and API。具有開放的架構和易於使用的二次開發介面。 目前較為知名的開源ETL工具有: 1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司開發,現在已經有三年多的產品應用歷史,成功應用於一些產品中,在點選流(ClickStream)分析應用中表現出色。KETL採用Plug-in的架構,使用Java開發。 2、 KETTLE,為一個元資料驅動的ETL工具。已經加入Pentaho。 3、 Clover ETL,為一個基於Java的ETL Framework,可以用來開發自己的ETL應用。 4、 Enhydra Octopus,為一個基於Java的ETL工具,使用JDBC來連線各種資料來源,易於使用和部署。
Framework 開源框架,這是在商業BI系統中所沒有的。我們可以使用它們來構建自己的BI工具,或者增強和擴充套件我們的BI解決方案。 Stand-alone Tools 獨立的BI工具,這是開源專案中數量最多的一類。很多工具只側重BI系統中的某個環節和方面,如ETL、Report、OLAP和Database等等。 BI Suit 在統一的架構下提供了多種BI系統的特性的工具集合。就目前的情況看,不管是商業軟體還是開源軟體,還沒有任何一個套件提供了完整的端到端的BI解決方案。這些開源的BI Suit是透過連線多個其他的元件和工具的方式形成套件的,由於BI系統涉及到的工具是非常多的,所以整合一套完整的BI解決方案是很困難的。 BI解決方案中的工具 一個完整的BI解決方案中有多種工具來完成BI系統中各個階段的工作。 ETL工具 資料抽取、轉換和載入工具。優秀的ETL工具應該具有以下特性: 1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定義流程並自動化執行ETL任務。 2、 Centralized Metadata Repository and Management。集中儲存和管理符合業界標準的元資料。 3、 Data Profile and Validation。可以檢驗資料的質量。 4、 High Performance。在大負荷的任務執行中仍然有良好的效能。 5、 Scalable, Platform Independent。具有良好的彈性,支援多種作業系統和資料庫系統,能操作多種異構的資料來源。 6、 Open Architecture and API。具有開放的架構和易於使用的二次開發介面。 目前較為知名的開源ETL工具有: 1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司開發,現在已經有三年多的產品應用歷史,成功應用於一些產品中,在點選流(ClickStream)分析應用中表現出色。KETL採用Plug-in的架構,使用Java開發。 2、 KETTLE,為一個元資料驅動的ETL工具。已經加入Pentaho。 3、 Clover ETL,為一個基於Java的ETL Framework,可以用來開發自己的ETL應用。 4、 Enhydra Octopus,為一個基於Java的ETL工具,使用JDBC來連線各種資料來源,易於使用和部署。