首頁>Club>
8
回覆列表
  • 1 # 愛可生雲資料庫

    Infobright是一款基於獨特的專利知識網格技術的列式資料庫。Infobright是開源的MySQL資料倉庫解決方案,引入了列儲存方案,高強度的資料壓縮,最佳化的統計計算(類似sum/avg/group by之類),infobright 是基於mysql的,但不裝mysql亦可,因為它本身就自帶了一個。mysql可以粗分為邏輯層和物理儲存引擎,infobright主要實現的就是一個儲存引擎,但因為它自身儲存邏輯跟關係型資料庫根本不同,所以,它不能像InnoDB那樣直接作為外掛掛接到mysql,它的邏輯層是mysql的邏輯層加上它自身的最佳化器。

    Infobright特徵

    優點:

    大資料量查詢效能強勁、穩定:百萬、千萬、億級記錄數條件下,同等的SELECT查詢語句,速度比MyISAM、InnoDB等普通的MySQL儲存引擎快5~60倍。高效查詢主要依賴特殊設計的儲存結構對查詢的最佳化,但這裡最佳化的效果還取決於資料庫結構和查詢語句的設計。儲存資料量大:TB級資料大小,幾十億條記錄。資料量儲存主要依賴自己提供的高速資料載入工具(百G/小時)和高資料壓縮比(>10:1)高資料壓縮比:號稱平均能夠達到 10:1 以上的資料壓縮率。甚至可以達到40:1,極大地節省了資料儲存空間。高資料壓縮比主要依賴列式儲存和 patent-pending 的靈活壓縮演算法.基於列儲存:無需建索引,無需分割槽。即使資料量十分巨大,查詢速度也很快。用於資料倉庫,處理海量資料沒一套可不行。不需要建索引,就避免了維護索引及索引隨著資料膨脹的問題。把每列資料分塊壓縮存放,每塊有知識網格節點記錄塊內的統計資訊,代替索引,加速搜 索。快速響應複雜的聚合類查詢:適合複雜的分析性SQL查詢,如SUM, COUNT, AVG, GROUP BY

  • 2 # 種豆大叔

    有啊,基於hadoop生態的資料倉庫不就是全開源的麼。

    資料倉庫架構中最重要的幾個部分:ETL、資料儲存、任務排程、元資料管理。

    ETL:使用sqoop、mapreduce、spark等

    資料儲存:使用hdfs

    任務排程:使用airflow

    元資料管理:使用atlas

  • 中秋節和大豐收的關聯?
  • 為什麼韓國總喜歡把他國的歷史文化據為己有?