1. 什麼是hive •Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的資料檔案對映為一張資料庫表,並提供類SQL查詢功能。•本質是將HQL轉換為MapReduce程式 2. 為什麼使用hive •操作介面採用類SQL語法,提供快速開發的能力•避免了去寫MapReduce,減少開發人員的學習成本•擴充套件功能很方便3. hive 特點•可擴充套件Hive可以自由的擴充套件叢集的規模,一般情況下不需要重啟服務•延展性Hive支援使用者自定義函式,使用者可以根據自己的需求來實現自己的函式•容錯良好的容錯性,節點出現問題SQL仍可完成執行4. hive 與hadoop 關係發出HQL —> hive 轉換成mapreduce —> mapreduce —> 對hdfs進行操作5. hive 與傳統資料對比HiveRDBMS查詢語言HQLSQL資料儲存HDFSRaw Device or Local FS執行MapReduceExcutor執行延遲高低處理資料規模大小索引0.8版本後加入點陣圖索引有複雜的索引6. hive 的未來•增加更多類似傳統資料庫的功能,如儲存過程•提高轉換成的MapReduce效能•擁有真正的資料倉庫的能力•UI部分加強基本執行過程,描述如下:
1. 什麼是hive •Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的資料檔案對映為一張資料庫表,並提供類SQL查詢功能。•本質是將HQL轉換為MapReduce程式 2. 為什麼使用hive •操作介面採用類SQL語法,提供快速開發的能力•避免了去寫MapReduce,減少開發人員的學習成本•擴充套件功能很方便3. hive 特點•可擴充套件Hive可以自由的擴充套件叢集的規模,一般情況下不需要重啟服務•延展性Hive支援使用者自定義函式,使用者可以根據自己的需求來實現自己的函式•容錯良好的容錯性,節點出現問題SQL仍可完成執行4. hive 與hadoop 關係發出HQL —> hive 轉換成mapreduce —> mapreduce —> 對hdfs進行操作5. hive 與傳統資料對比HiveRDBMS查詢語言HQLSQL資料儲存HDFSRaw Device or Local FS執行MapReduceExcutor執行延遲高低處理資料規模大小索引0.8版本後加入點陣圖索引有複雜的索引6. hive 的未來•增加更多類似傳統資料庫的功能,如儲存過程•提高轉換成的MapReduce效能•擁有真正的資料倉庫的能力•UI部分加強基本執行過程,描述如下: