首頁>科技>

內容提要:目前,市面上的人工智慧書籍並不少,作為一名人工智慧愛好者,該如何篩選書單?新年伊始,KDnuggets 整理了一份 AI 書單,請大家按需取用。

關鍵詞:AI 書單 機器學習 資料科學

專注於機器學習、大資料、分析學的頂級網站 KDnuggets,近期整理了一份書單,共 15 本書籍,涵蓋機器學習、NLP、資料科學等多個方向,書籍的作者也都是來自人工智慧領域的頂尖學者、研究者。

無論你是剛開始接觸人工智慧的初學者,還是對相關技術已經有所掌握,清單中的這些書籍總有一款適合你。所有書籍都可免費線上閱讀,可以說非常 nice 了。

簡介:這是一本實踐性很強的書籍,重點關注進行資料科學和使用 Python 實現機器學習模型。它很好地解釋了相關的理論,並根據需要引入了必要的數學運算,因此為全篇奠定了良好的節奏。

閱讀地址:

https://people.smp.uq.edu.au/DirkKroese/DSML/DSML.pdf

簡介:文字挖掘是一種從文字資料中,抽取有價值的資訊和知識的計算機處理技術,也是自然語言處理的熱門話題。

本書主要介紹整潔資料的文字挖掘與分析,所有程式碼都是基於 R 語言來編寫的,對於 R 語言新手來說很不錯。

全書一共分 9 個章節,介紹瞭如何使用基於 R 的整潔工具來進行文字分析。整潔資料具有簡單且新穎的結構,對其進行分析會更有效、更容易。

閱讀地址:

https://github.com/dgrtwo/tidy-text-mining

簡介:本書由哈佛大學 Miguel Hernan、Jamie Robins 教授編著,對因果推理的概念和方法做了系統性闡述。該書在知乎等各大平臺一直呼聲很高,是眾多計量學者期待已久的書籍。

因果推理是一個複雜的、包羅永珍的主題,但本書的作者盡其所能,將他們認為最重要的基本方面濃縮到大約 300 頁的文字中。如果你對建立自己的概念基礎感興趣,這本書可能是你的首選。

閱讀地址:

https://cdn1.sph.harvard.edu/wp-content/uploads/sites/1268/2021/01/ciwhatif_hernanrobins_31dec20.pdf

簡介:這本書在第二章介紹了統計概念,從這一章開始,這些概念便相互依存,並引發了更高階的主題,如統計推斷,置信區間,假設檢驗,線性迴歸,機器學習等。

薦書者表示,這是他一直在等待的資源,以他一直想要的方式有效地學習 Julia 的資料科學,希望也對你的口味。

閱讀地址:

https://statisticswithjulia.org/StatisticsWithJuliaDRAFT.pdf

簡介:在許多當代書籍中,資料科學已簡化為一系列程式設計工具,如果掌握了這些工具,它們有望為你完成資料科學。

一直以來,其它書籍似乎很少強調與程式碼分離的基本概念和理論。本書是與此趨勢相反的一個很好的例子,毫無疑問,這本書將為你提供紮實的基礎知識,為你從事資料科學事業提供必要的理論知識。

閱讀地址:

https://www.cs.cornell.edu/jeh/book%20no%20so;utions%20March%202019.pdf

簡介:一旦重數學(math-heavy)理論可能帶來的衝擊消失,你會發現從偏方-方差權衡到線性迴歸、模型驗證策略、模型提升、核心方法、一直到預測問題等主題,都會得到徹底的處理。而這樣透徹處理的好處是,你的理解將比僅僅掌握抽象的直覺更深入。

閱讀地址:

https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/understanding-machine-learning-theory-algorithms.pdf

簡介:這本書從描述 NLP 緩緩展開,介紹瞭如何使用 Python 來執行一些 NLP 程式設計任務,以及如何訪問自然語言內容來處理,然後轉向更宏大的概念,包括概念(NLP)和程式設計(Python)。

很快,它就涉及到分類、文字分類、資訊抽取以及其他通常被認為是經典自然語言處理的主題。

在透過這本書瞭解了 NLP 的基礎知識後,你就可以繼續學習更現代和前沿的技術。

閱讀地址:

https://www.nltk.org/book/

簡介:本書的作者之一 Jeremy Howard,是大資料競賽平臺 Kaggle 的前主席和首席科學家。他本人還是 Kaggle 的冠軍選手。他也是美國奇點大學(Singularity University)最年輕的教職工。

合著者 Sylvain 是法國巴黎高等師範學院的校友,並獲得巴黎十一大學(法國奧賽)的數學碩士學位。他也是 fast.ai 的前任老師和研究科學家,致力於透過設計和改進允許模型在有限資源上進行快速訓練的技術來使深度學習更加容易。

這本書的與眾不同之處在於,它是「自上而下」來講解的。它透過真實的例子來講解一切。在構建這些示例時,會越來越深入,會告訴讀者如何讓其專案越來越好。這意味著,讀者將在上下文中逐步學習他們所需要的所有理論基礎,從而瞭解其重要性,以及它如何工作。

作者表示,他們花了很多年的時間來建立工具和教學方法,使以前複雜的主題變得非常簡單。

閱讀地址:

http://50315d5e32ce03ba1773cc0ce6940a86.registreimarcasepatentes.com.br/read/

簡介:這本書在亞馬遜共 1200 多個評分,平均評分為 4.6(滿分 5 分),這就說明了,大多數讀者都認為該書很有用。很多讀者認為,這本書深入淺出,以一種易於理解的方式進行了介紹,並帶動你去使用 Python 語言寫簡單專案的程式碼中。

本書中提及到的知識點都非常淺顯易懂,十分適合入門學習。

閱讀地址:

http://do1.dr-chuck.com/pythonlearn/EN_us/pythonlearn.pdf

簡介:如果你對實際的 AutoML 知之甚少,那麼也不必擔心。本書以紮實的主題介紹開始,並逐章明確列出了值得讀者期待的每一章,這在一本由獨立的章節組成的書中是很重要的。

之後,在本書的第一部分,你可以直接閱讀有關當代 AutoML 的重要主題,並對此滿懷信心,因為這本書是在 2019 年被整理、編輯的。第一部分之後,將介紹用於實現這些 AutoML 概念的六種工具。

最後一部分是對 2015 年至 2018 年期間,存在了幾年的 AutoML 挑戰系列的分析,在這段時間裡,人們對機器學習的自動化方法的興趣,似乎出現了爆炸式增長。

閱讀地址:

https://www.automl.org/wp-content/uploads/2018/12/automl_book.pdf

簡介:這本《深度學習》應該不需要過多介紹,它由人工智慧界的領軍人物 Ian Goodfellow,Yoshua Bengio 以及 Aaron Courville 合著。馬斯克曾經評價道:「《Deep Learning》由領域內三位專家合著,是該領域內唯一的綜合性書籍。」

閱讀地址:

https://www.deeplearningbook.org/

簡介:本書的獨特之處在於,作者採用了「透過實踐來學習」的理念,整本書都包含了可執行的程式碼。作者試圖將教科書的優點(清晰度和數學),與實踐教程的優點(實踐技能、參考程式碼、實現技巧和直覺)結合起來。每個章節透過多種形式,交織散文,數學,和一個自包含的實現,教你一個關鍵思想。

閱讀地址:

https://d2l.ai/

簡介:這本書的第一部分涵蓋了純粹的數學概念,完全沒有涉及機器學習。第二部分將注意力轉向將這些新發現的數學技能應用於機器學習問題。

根據讀者的意願,可以採取自上而下或自下而上的方法,來學習機器學習及其潛在的數學知識。

閱讀地址:

https://mml-book.github.io/book/mml-book.pdf

簡介:本書是亞馬遜上的高分作品,作者是斯坦福大學的三位統計學教授。

作者對於如何傳達他們的專業知識,有一種自己的方法。他們的方法似乎遵循了一種邏輯有序的方法,即讀者應該在什麼時候學習什麼。然而,單獨的章節也是獨立的,所以拿起這本書,就可以直接進入模型推理的章節,只要你已經理解了這本書之前的內容。

閱讀地址:

https://web.stanford.edu/~hastie/Papers/ESLII.pdf

簡介:本書作者是來自南加利福尼亞大學、斯坦福大學和華盛頓大學的四位教授,他們都有統計學背景。這本書比《The Elements of Statistical Learning(統計學習基礎)》更為實用,它給出了一些使用 R 語言實現的案例。

閱讀地址:

https://statlearning.com/ISLR%20Seventh%20Printing.pdf

這些書籍不僅口碑極高,而且英文原版書都價格不低,基本在 50-100 美元不等。現在免費就可閱讀,讀到就是賺到呢~

https://www.kdnuggets.com/2020/12/15-free-data-science-machine-learning-statistics-ebooks-2021.html

64
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 起底小鵬飛行汽車(二)——工業“包裝”高手助力趙德力