回覆列表
  • 1 # 合肥解憂雜貨圖片鋪

    1. OpenRefine

      這是一款高人氣資料分析工具,適用於各類與分析相關的任務。這意味著即使大家擁有多川不同資料型別及名稱,這款工具亦能夠利用其強大的聚類演算法完成條目分組。在聚類完成後,分析即可開始。

      2. Hadoop

      大資料與Hadoop可謂密不可分。這套軟體庫兼框架能夠利用簡單的程式設計模型將大規模資料集分發於計算機叢集當中。其尤為擅長處理大規模資料並使其可用於本地裝置當中。作為Hadoop的開發方,Apache亦在不斷強化這款工具以提升其實際效果。

      3. Storm

      同樣來自Apache的Storm是另一款偉大的實時計算系統,能夠極大強化無限資料流的處理效果。其亦可用於執行多種其它與大資料相關的任務,具體包括分散式RPC、持續處理、線上機器學習以及實時分析等等。使用Storm的另一大優勢在於,其整合了大量其它技術,從而進一步降低大資料處理的複雜性。

      4. Plotly

      這是一款資料視覺化工具,可相容JavaScript、MATLAB、Python以及R等語言。Plotly甚至能夠幫助不具備程式碼編寫技能或者時間的使用者完成動態視覺化處理。這款工具常由新一代資料科學家使用,因為其屬於一款業務開發平臺且能夠快速完成大規模資料的理解與分析。

      5. Rapidminer

      作為另一款大資料處理必要工具,Rapidminer屬於一套開源資料科學平臺,且透過視覺化程式設計機制發揮作用。其功能包括對模型進行修改、分析與建立,且能夠快速將結果整合至業務流程當中。Rapidminer目前備受矚目,且已經成為眾多知名資料科學家心目中的可靠工具。

      6. Cassandra

      Apache Cassandra 是另一款值得關注的工具,因為其能夠有效且高效地對大規模資料加以管理。它屬於一套可擴充套件NoSQL資料庫,能夠監控多座資料中心內的資料並已經在Netflix及eBay等知名企業當中效力。

      7. Hadoop MapReduce

      這是一套軟體框架,允許使用者利用其編寫出以可靠方式併發處理大規模資料的應用。MapReduce應用主要負責完成兩項任務,即對映與規約,並由此提供多種資料處理結果。這款工具最初由谷歌公司開發完成。

      

  • 中秋節和大豐收的關聯?
  • RNG對陣C9最後一波團戰,Jensen原地給輔助加被動導致被翻盤,如何評價?