回覆列表
-
1 # 一網二屾
-
2 # 科訊SCI
首先要想資料探勘做得好,必須要滿足兩個前提條件
1.海量資料
2.處理海量資料的能力
海量資料而言目前在國內:阿里,百度,騰訊,位元組跳動屈指可數
阿里擁有大量的消費資料,百度擁有海量的搜尋資料,騰訊擁有海量的社交資料,位元組跳動也擁有基數龐大的使用者,並且他們都有基於hadoop,mpi以及圖計算框架(如spark,graphlab)進行二次開發成為自己的海量資料處理平臺(叢集),包括儲存資料、快速查詢資料、增量更新資料、繼承的資料探勘與機器學習演算法工具等,而且大資料都成為了BAT的戰略,相信會越來越好。
在國外:Google,Facebook,Amazon,IBM,MS等比較出眾
-
3 # 和睦相處46539
思邁特軟體企業資料探勘平臺(Smartbi Mining)是用於預測性分析的獨立產品,旨在為企業所做的決策提供預測性智慧。該平臺不僅可為使用者提供直觀的流式建模、拖拽式操作和流程化、視覺化 的建模介面,還提供了大量的資料預處理操作。此外,它內建了多種實用的、經典的機器學習演算法,這些演算法配置簡單降低了機器學習的使用門檻,大大節省了企業成本,並支援標準的PMML模 型輸出,可以將模型傳送到Smartbi統一平臺,與商業智慧平臺實現了完美整合。
1.資料的挖掘能力的大小,由現在或曾經所能掌握的資料量的能力所決定。
因為,大資料在中國並不算太先進和流行。所以,大部分的資料探勘技術以及人才,一般都在所掌握的資料量大的企業中。因為,這類企業更需要從所掌握的大量資料中進行挖掘,以為企業的發展、產品的設計等進行決策參考。
2.而資料探勘的關鍵在於演算法的應用。
目前比較流行的資料探勘演算法包括:決策樹法、粗糙集法、關聯規則法、遺傳演算法、神經網路法、模糊演算法等。
3.目前國內比較專業的資料探勘演算法,除了國際級的實驗室、科研機構外,企業中百度、阿里、騰訊都有一定的能力。尤其是百度,畢竟他們是以搜尋起家,靠技術打天下,靠資料檢索技術進行內容呈現。