首頁>科技>

在當今的人工智慧時代,資料分析和挖掘似乎已經是一個很古老的話題。這也難怪,對資料的分析甚至可以追溯到中國第一經——《易經》這部遠古文明的產物,至少17世紀就開始的數理統計學為資料分析準備了齊全的數學工具,而領域公認的第一個資料探勘演算法也早在27年前就發表了。

事實上,目前的人工智慧的發展是由資料驅動的。從資料中挖掘得到的知識在很大程度上成就了人工智慧的奇妙,比如機器翻譯、人臉識別、對話機器人等。目前人工智慧所面臨的問題是推廣,也就是需要在各行各業將人工智慧的能力發揮出來。

這個能力的發揮在很大程度上依賴於資料的使用能力。而資料使用的難度源於資料的複雜性和多樣性,我們需要一系列處理資料的工具,也就是資料探勘工具,它是人工智慧、機器學習任務的一個重要部分。

在過去二十多年中,資料探勘領域取得了很大的進步,從計算機科學的角度來看尤其明顯。儘管傳統的機率與統計領域對資料分析已經有了廣泛和深入的研究,但資料探勘這個術語是由計算機科學相關的社群所創立的。對計算機科學家來說,計算的可擴充套件性、可用性和計算的執行都是極為重要的。

“資料是新時代的石油。”

——Clive Humby

本文為大家推薦幾本經典的資料探勘好書。

01 資料探勘:原理與實踐(基礎篇)

作者:查魯·C. 阿加沃爾

推薦語:大資料和人工智慧時代的資料探勘教材和工具書。從四個“超級問題”出發,不僅詳解資料探勘的基礎知識,而且還介紹高階資料型別,結合複雜多樣的實際資料環境,探討資料探勘的應用場景和使用方法。

本書中文版分為基礎篇和進階篇。基礎篇(包括原書的第1-13章)詳細介紹了針對資料探勘的四個主要問題(聚類、分類、關聯模式挖掘和異常分析)的各種解決方法、用於文字資料領域的特定挖掘方法,以及對於資料流的挖掘應用。

02 資料探勘:原理與實踐(進階篇)

作者:查魯·C. 阿加沃爾

推薦語:大資料和人工智慧時代的資料探勘教材和工具書。從四個“超級問題”出發,不僅詳解資料探勘的基礎知識,而且還介紹高階資料型別,結合複雜多樣的實際資料環境,探討資料探勘的應用場景和使用方法。

03 資料探勘導論(原書第2版)

作者:陳封能 邁克爾·斯坦巴赫 等

推薦語:陳封能領銜編寫的資料探勘經典暢銷教材新版,斯坦福大學、密歇根州立大學、明尼蘇達大學、得克薩斯大學等知名高校的資料探勘課程教材。從基礎概念和演算法的角度介紹資料探勘所使用的主要原理與技術。

04 資料探勘:概念與技術(原書第3版)

作者:Jiawei Han, Micheline Kamber 等

推薦語:資料探勘領域最具里程碑意義的經典著作,完整全面闡述該領域的重要知識和技術創新。引入了許多演算法和實現示例,全部以易於理解的虛擬碼編寫,適用於實際的大規模資料探勘專案。討論了一些高階主題,例如挖掘面向物件的關係型資料庫、空間資料庫、多媒體資料庫、時間序列資料庫、文字資料庫、全球資訊網以及其他領域的應用等。全面而實用地給出用於從海量資料中獲取儘可能多資訊的概念和技術。

12
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 哪些網際網路產品適合中小企業使用?