-
1 # Howdy96032306
-
2 # 子牛吧
我目前也在學習。說下我的學習路徑:
1、python基礎語法
2、線性代數
3、人工智慧常用的一些演算法。。貝葉斯之類的。具體可知乎
4、選一個容易上手的框架。到GitHub上去找框架的一些用例。邊看邊學
5、敲程式碼。不停的敲
6、最好在有一點概念的時候確定一個目標方向。比如說是基於影象的還是基於自然語言處理的或者其他的。這樣有明確的目的學。會更好一點
以上是我的一些學習路徑。僅供參考。
-
3 # 碼靈
我使用Python已經7年多了,現在從事影片物體識別演算法開發,使用TensorFlow,也是基於Python語言。Python是一門解決所有問題的語言,值得你擁有!
我從2012年開始學習機器學習,因為沒人指導,走過很多彎路,浪費了不少時間和精力。剛開始我是看《機器學習實戰》這本書,雖然看不懂,但還是把書上的例子全跑了遍,漸漸地就發現不用明白演算法也能實現想要的功能。然後,我就直接開發自己想要的程式,遇到需要機器學習的部分就直接copy過來,一個周後demo就出來了,這時你就發現你已經入門了。剩下的就是了解各個演算法的使用範圍和侷限。
千萬不要掉到無盡的書堆裡去,要實踐和做專案!
呃,地鐵到站了,要上班去了,還沒寫完,有機會再繼續探討……
-
4 # 西線學院
本篇是使用 Python 掌握機器學習的幾個步驟系列文章的下篇,如果你已經學習了該系列的上篇,那麼應該達到了令人滿意的學習速度和熟練技能;如果沒有的話,你也許應該回顧一下上篇,具體花費多少時間,取決於你當前的理解水平。我保證這樣做是值得的。快速回顧之後,本篇文章會更明確地集中於幾個機器學習相關的任務集上。由於安全地跳過了一些基礎模組——Python 基礎、機器學習基礎等等——我們可以直接進入到不同的機器學習演算法之中。這次我們可以根據功能更好地分類教程。
第1步:機器學習基礎回顧&一個新視角
上篇中包括以下幾步:
1. Python 基礎技能
2. 機器學習基礎技能
3. Python 包概述
4. 運用 Python 開始機器學習:介紹&模型評估
5. 關於 Python 的機器學習主題:k-均值聚類、決策樹、線性迴歸&邏輯迴歸
6. 關於 Python 的高階機器學習主題:支援向量機、隨機森林、PCA 降維
7. Python 中的深度學習
如上所述,如果你正準備從頭開始,我建議你按順序讀完上篇。我也會列出所有適合新手的入門材料,安裝說明包含在上篇文章中。
然而,如果你已經讀過,我會從下面最基礎的開始:
機器學習關鍵術語解釋,作者 Matthew Mayo。
維基百科條目:統計學分類。
機器學習:一個完整而詳細的概述,作者 Alex Castrounis。
如果你正在尋找學習機器學習基礎的替代或補充性方法,恰好我可以把正在看的 Shai Ben-David 的影片講座和 Shai Shalev-Shwartz 的教科書推薦給你:
Shai Ben-David 的機器學習介紹影片講座,滑鐵盧大學。
理解機器學習:從理論到演算法,作者 Shai Ben-David & Shai Shalev-Shwartz。
記住,這些介紹性資料並不需要全部看完才能開始我寫的系列文章。影片講座、教科書及其他資源可在以下情況查閱:當使用機器學習演算法實現模型時或者當合適的概念被實際應用在後續步驟之中時。具體情況自己判斷。
第2步:更多的分類
我們從新材料開始,首先鞏固一下我們的分類技術並引入一些額外的演算法。雖然本篇文章的第一部分涵蓋決策樹、支援向量機、邏輯迴歸以及合成分類隨機森林,我們還是會新增 k-最近鄰、樸素貝葉斯分類器和多層感知器。
Scikit-learn 分類器
k-最近鄰(kNN)是一個簡單分類器和懶惰學習者的示例,其中所有計算都發生在分類時間上(而不是提前在訓練步驟期間發生)。kNN 是非引數的,透過比較資料例項和 k 最近例項來決定如何分類。
使用 Python 進行 k-最近鄰分類。
樸素貝葉斯是基於貝葉斯定理的分類器。它假定特徵之間存在獨立性,並且一個類中任何特定特徵的存在與任何其它特徵在同一類中的存在無關。
使用 Scikit-learn 進行文件分類,作者 Zac Stewart。
多層感知器(MLP)是一個簡單的前饋神經網路,由多層節點組成,其中每個層與隨後的層完全連線。多層感知器在 Scikit-learn 版本 0.18 中作了介紹。
首先從 Scikit-learn 文件中閱讀 MLP 分類器的概述,然後使用教程練習實現。
神經網路模型(監督式),Scikit-learn 文件。
Python 和 Scikit-learn 的神經網路初學者指南 0.18!作者 Jose Portilla。
第3步:更多聚類
Scikit-learn聚類演算法
首先,閱讀這些介紹性文章; 第一個是 k 均值和 EM 聚類技術的快速比較,是對新聚類形式的一個很好的繼續,第二個是對 Scikit-learn 中可用的聚類技術的概述:
聚類技術比較:簡明技術概述,作者 Matthew Mayo。
在玩具資料集中比較不同的聚類演算法,Scikit-learn 文件。
期望最大化(EM)是機率聚類演算法,並因此涉及確定例項屬於特定聚類的機率。EM 接近統計模型中引數的最大似然性或最大後驗估計(Han、Kamber 和 Pei)。EM 過程從一組引數開始迭代直到相對於 k 聚類的聚類最大化。
首先閱讀關於 EM 演算法的教程。接下來,看看相關的 Scikit-learn 文件。最後,按照教程使用 Python 自己實現 EM 聚類。
期望最大化(EM)演算法教程,作者 Elena Sharova。
高斯混合模型,Scikit-learn 文件。
使用 Python 構建高斯混合模型的快速介紹,作者 Tiago Ramalho。
如果高斯混合模型初看起來令人困惑,那麼來自 Scikit-learn 文件的這一相關部分應該可以減輕任何多餘的擔心:
高斯混合物件實現期望最大化(EM)演算法以擬合高斯模型混合。
基於密度且具有噪聲的空間聚類應用(DBSCAN)透過將密集資料點分組在一起,並將低密度資料點指定為異常值來進行操作。
首先從 Scikit-learn 的文件中閱讀並遵循 DBSCAN 的示例實現,然後按照簡明的教程學習:
DBSCAN 聚類演算法演示,Scikit-learn 文件。
基於密度的聚類演算法(DBSCAN)和實現。
第4步:更多的整合方法
上篇只涉及一個單一的整合方法:隨機森林(RF)。RF 作為一個頂級的分類器,在過去幾年中取得了巨大的成功,但它肯定不是唯一的整合分類器。我們將看看包裝、提升和投票。
-
5 # 大陸陸vs小可可
Python是一種程式語言
完成同一個任務,C語言要寫1000行程式碼,Java只需要寫100行,而Python可能只要20行。用Python完成專案,編寫的程式碼量更少,程式碼簡短可讀性強,團隊協作開發時讀別人的程式碼速度會非常快,使工作變得更加高效。優雅做開發不再是夢!
Python語言應用廣泛程式語言排行榜前五
根據TIOBE最新排名,Python已超越C#,與Java,C,C++成為全球前5大流行程式語言之一。從雲端、客戶端,到物聯網終端,python應用無處不在。從國內的百度、阿里、騰訊、網易、新浪,豆瓣,到國外的谷歌、NASA、YouTube、Facebook,Python的企業需求逐步上升,各公司都在大規模使用Python完成各種任務
Python程式設計簡單直接適合快速開發
Python是美國主流大學受歡迎的入門程式語言,誕生至今已經過25個年頭。相對於其他語言,它更加易學、易讀,非常適合快速開發。Python程式設計簡單直接,難度低於java,更適合初學程式設計者,讓初學者專注於程式設計邏輯,而不是困惑於晦澀的語法細節上。
由於Python本身有十分廣泛的應用,本期整個Python路線圖主要計劃分成16周,120天左右。
主要學習內容包括三大模組,十大部分:
一、Python初級開發工程師
1)python語言基礎(python基礎語法入門和專案實踐);
2)python語言高階(學會python語言高階技術,能利用python進行一般的資料處理和爬蟲);
3)python全棧工程師前端(學會常用的前端技術);
4)python全棧工程師後端(學會企業級後端框架Django,並能完成一個大型網站的構建);
二、Python高階開發工程師
5)python全棧工程師後端高階(掌握兩種輕量級和實時後端框架Flask和Tornado,完成兩個實際專案);
6)Linux基礎(掌握Linux常用命令和shell開發技術);
7)Linux運維自動化開發(掌握Linux運維自動化開發原理,並完成相應專案實踐);
三、Python大神級資料分析師
8)python資料分析(掌握python資料分析與視覺化,瞭解資料統計和進入資料分析的原理,完成相應專案);
9)python大資料(掌握python大資料的原理和實踐);
10)python機器學習(掌握機器學習基本原理,掌握有監督學習常用演算法,掌握無監督學習聚類演算法,完成多個實戰專案)。
對於Python學習部分相關資源可以看看我以往的文章。
希望今天的這篇Python學習路線圖能夠幫助大家更好去學習,早日成為Python大神。
-
6 # 你看我獨角獸嗎
畢竟都是從零開始過來的,我也給一點實用的乾貨。
這裡我把人群分為兩種型別,一種是有開發經驗的人,一種是無開發經驗的初學者。
無開發經驗的初學者書籍參考:
《Python核心程式設計》
《統計學習方法》 李航
學習路徑:
對於初學者,可能最重要的執行過程中要有適當的反饋,其實我很推薦初學的人去看吳恩達的《機器學習》課程,而且他最近新發布了一門《深度學習》課程,我也有看,也不知覺收穫了很多。然後可以試了一些很簡單的程式碼示例,像KNN、線性迴歸等最基本的演算法,等覺得自己已經有了基本的開發經驗和機器學習知識儲備,那麼可以繼續往下看。
有開發經驗書籍參考:
《機器學習實戰》
《資料探勘:概念與技術》
《機器學習系統設計》
《PRML》
《深度學習》
學習路徑:
最簡單的辦法,就是在kaggle上面找Playground型別(即訓練場)的比賽,下載資料集,然後就刷相應的討論區,在裡面多互動,然後榜上刷出一定成績,雖然寫的很簡單,如果能夠刷到Top10%內,這說明你已經對機器學習或者資料探勘有了初步的入門。
無論如何,學習知識都是要靠自己不斷挖坑、填坑慢慢領悟出來,這時候需要那麼一句毒雞湯:人永遠是要學習的。死的時候,才是畢業的時候。
-
7 # 夢似悄然低語
1、先掌握python基礎,資料很多。
2、學習吳恩達機器學習課程和深度學習課程,公式從頭推到尾,講義從頭啃到尾。
3、有了上面兩項基礎,學習python開源工具包和新的其它演算法,應該比較容易。
4、至於資料,逛逛部落格,github,kaggle,YouTube,公開課,電子書籍等等,有了上面三項基礎,加深理解和拓展你的機器學習世界。也可以看看最新論文。
5、最重要是把你學的知識應用到你所需要解決的問題上面,最重要的還是數學。也可以寫出自己的演算法,用python快速實現和驗證並改進。
個人之言,如有建議,洗耳恭聽,不勝感激
-
8 # 老薑說錢
作為一個過來人,我的建議是分三步進行:
第一步:學習基本 Python 技能
如果要使用 Python 進行機器學習,擁有對 Python 有基礎的理解非常關鍵。幸運的是,Python 是當前普遍使用的流行語言,並納入了科學計算和機器學習的內容,所以找到入門教程並不困難。在選擇起點時,很大程度上要取決於你之前的 Python 經驗和程式設計經驗。推薦一本最經典的入門書籍:《Python程式設計 從入門到實踐》
第二步:學習機器學習基礎技能KDnuggets 的 Zachary Lipton 指出,人們對於“資料科學家”的認知千差萬別。這實際上是對機器學習領域的反映。資料科學家在不同程度上使用計算學習演算法。要建立和使用支援向量機模型,熟知核函式方法是否是必需的?答案當然不是。就像現實生活中的許多事情一樣,所需要的理論深入程度與具體的實際應用有關。獲取對機器學習演算法的深入理解不是本文的討論範圍, 而且這通常需要在學術領域投入大量時間,或者至少要透過密集的自學才能達到。
好訊息是,你不必擁有博士級別的機器學習理論能力才能進行實踐,就如同不是所有程式設計師都必須接受計算機理論教育才能寫好程式碼。
吳恩達在 Coursera 的課程非常贊,如果你有時間,可以自己去 Coursera 完成這個課程 :Andrew Ng’s Machine Learning course 。另外推薦一本書:周志華的《機器學習》
第三步:開始用 Python 進行機器學習
這一步開始進入到實踐了,推薦看Peter Harrington的《機器學習實戰 》
這本書啃透,你的Python和機器學習已經是能達到掌握的水平啦!
另外也推薦你使用一些其他的機器學習框架:比如H2O,還有像http://www.datazen.ai/這樣的網站,裡面會整合很多機器學習框架,迅速完成建模實戰任務。
-
9 # 是創始人說
書籍:
機器學習系統設計
進度:100%專案:尋找實際資料練習機器學習實戰
進度:第2章專案:Python資料分析基礎教程:NumPy學習指南
進度:100%專案:numpy入門Python資料探勘入門與實踐
進度:Chapter3專案:集體智慧程式設計
進度:100%專案:使用庫重寫所有例子R語言-實用資料分析和視覺化技術
進度:100%專案:Python網路資料採集
進度:100%專案:爬蟲系統競賽:Kaggle練習題題解Euler專案題解入門numpypandassklearntensorflowSparkIntroduction to Apache SparkDistributed Machine Learning with Apache SparkBig Data Analysis with Apache Spark
回覆列表
這是一種方法:
0. Learn python the hard way
1. Andrew Ng
2. The Elements of statistical learning
3. Machine learning in action
最後去kaggle實踐或工作實踐。