我假設這個問題想問的是“機器學習演算法”怎麼入門。
1. 機器學習可以認為是計算機的進階課程。 所以要想入門機器學習,要先在機率統計,微積分,線性代數和程式設計的門裡。 這些“基礎課”是學習機器學習與資料探勘這樣“專業課”的基礎。
2. 所以無論是理工科還是學經管,大家一定要先把基礎打好。即使以後是決心要做VC,也還是要掌握一些基本的定量的概念。一不能人云亦云,二不能天天看自媒體補課。
3. 有了數學和程式設計的基礎,如果英文還可以,就可以看我推薦的入門書籍:
https://www.wukong.com/question/6471062370604024078/
如果英文不好,也可以看最後兩本中文版的書。
下面有幾個關於機器學習的點,大家可以從學習中體會一個General Picture.
4. 機器學習如果是一門科學的話,它是關於演算法的科學。 它與我們人類科學發現過程是類似的。首先透過我們的感官來得到證據(Evidence),之後構建很多假設(Hypothesis)試圖來解釋這些證據。能夠印證資料或證據的假設就是理論,如果不能解釋,就不斷的修正引數來調整假設,直到我們找到一個最合適的假設。 我們的科學發現過程如此,機器學習亦是如此。
5. 在上面提到的假設,在機器學習中主要就是一些函式-關於輸入和輸出的函式。 輸入輸出是我們從真實世界收集到的真實資料,我們要透過我們的經驗(educated guesses)用某一類函式作為模型,並透過調整引數來擬合數據。
6. 還有一類模型更復雜,更廣泛,比如深度神經網路,隨著它複雜度的增加,其實對模型的偏好(Bias)的影響在變少,反而是資料本事的作用更大,減少了人類先驗假設的影響。應為可以畢竟任何一種函式,屬於“無招勝有招”。如果《笑傲江湖》裡面的獨孤九劍一樣,不是真的無招, 是招數太過複雜,可以幾乎包含了任何招數。 深度網路不是無引數模型,是引數太多太複雜。
我假設這個問題想問的是“機器學習演算法”怎麼入門。
1. 機器學習可以認為是計算機的進階課程。 所以要想入門機器學習,要先在機率統計,微積分,線性代數和程式設計的門裡。 這些“基礎課”是學習機器學習與資料探勘這樣“專業課”的基礎。
2. 所以無論是理工科還是學經管,大家一定要先把基礎打好。即使以後是決心要做VC,也還是要掌握一些基本的定量的概念。一不能人云亦云,二不能天天看自媒體補課。
3. 有了數學和程式設計的基礎,如果英文還可以,就可以看我推薦的入門書籍:
https://www.wukong.com/question/6471062370604024078/
如果英文不好,也可以看最後兩本中文版的書。
下面有幾個關於機器學習的點,大家可以從學習中體會一個General Picture.
4. 機器學習如果是一門科學的話,它是關於演算法的科學。 它與我們人類科學發現過程是類似的。首先透過我們的感官來得到證據(Evidence),之後構建很多假設(Hypothesis)試圖來解釋這些證據。能夠印證資料或證據的假設就是理論,如果不能解釋,就不斷的修正引數來調整假設,直到我們找到一個最合適的假設。 我們的科學發現過程如此,機器學習亦是如此。
5. 在上面提到的假設,在機器學習中主要就是一些函式-關於輸入和輸出的函式。 輸入輸出是我們從真實世界收集到的真實資料,我們要透過我們的經驗(educated guesses)用某一類函式作為模型,並透過調整引數來擬合數據。
6. 還有一類模型更復雜,更廣泛,比如深度神經網路,隨著它複雜度的增加,其實對模型的偏好(Bias)的影響在變少,反而是資料本事的作用更大,減少了人類先驗假設的影響。應為可以畢竟任何一種函式,屬於“無招勝有招”。如果《笑傲江湖》裡面的獨孤九劍一樣,不是真的無招, 是招數太過複雜,可以幾乎包含了任何招數。 深度網路不是無引數模型,是引數太多太複雜。