成為一個合格的機器學習工程師，到底需不需要一個博士學位？

首頁>Club>羊鳳霞2021-01-15 01:48

成為一個合格的機器學習工程師，到底需不需要一個博士學位？

本人是入門級選手，想知道如果要成為這個領域的大牛，需要讀到博士的學位嗎？覺得論文的內容很深，能夠運用到實踐中嗎？

回覆列表

1 # 蘇州橋下一顆松

百分之90是腦洞大開的垃圾理論，能有應用意義的太少，合格用不上博士，但想發展的好肯定要是名校博士，最好是老美的高校

2 # 532967329

毋庸置疑，數學要求蠻高的，但這與博士學位沒有直接關係。機器學習很多演算法需要嚴格的數學證明，而且同一類問題往往從不同的角度產生不同的演算法。如果你喜歡鑽研數學，相信你一定能掌握這些演算法。在這個層面上，你並不需要一個博士學位。而發明一個有用的演算法，就需要非常強大的理論功底和工程素養以及創新能力，比如t-sne/xgboost等。這個層面上，由於博士有更強的學術研究的能力，這是優勢。
3 # 顏永2

你如果看過《生活大爆炸》，想必就不會有這種問題了。工程師是實際應用崗位。博士生是你的學位。兩者沒有什麼必然關係。只能說在中國，你如果獲得一個博士學位，然後去認證工程師的話，時間會短很多。本科生要考工程師，需要6年，碩士生要需要五年。博士生好像只需要三年就可以。

4 # 機器之心Pro

在人工智慧火熱的今天，對機器學習人才的需求也是越來越大，也需要越來越多的工程師來配合開發人工智慧應用。

在回答這個問題之前，覺得需要明確的一個概念是，開發機器學習應用，不只是研究上的事，還是工程上的事。而對此問題的答案是，合格的機器學習工程師，博士學位不是必要的。

舉個例子，剛成立一年左右的騰訊AI Lab 對外宣傳「現有50多位世界知名院校的AI科學家與200多位應用工程師」，值得注意的是這段描述中50多位AI 科學家的博士比例為 90%。也就是說，如果是博士學位也基本上上升到了AI 科學家的層次了。
在圈內熟知的年輕博士中，Ian Goodfellow 、Andrej karpathy 等的title也都是research Scientist。

此外，這個問題在國內也引起過極大的討論。也就是，為了在機器學習領域工作，是否需要該領域的 PhD？還有就是在學習機器學習之前，是不是一定要先修微積分、線性代數、機率論/統計學這些乏味的全套大學數學課程，然後再學 C/C++和並行分散式程式設計（CUDA、MPI、OpenMP 等等）？

Hacker News 一個評分最高的評論表示，即便你把這些內容學了個遍，還是得從頭開始應用機器學習演算法，先是 C，接下來是 MPI 或 CUDA，然後是 Numpy，然後你才能學會在 Theano 或者 TensorFlow 上應用它們（但有些人並不是很贊同有如此複雜的學習過程）。
而且，即使你是一個普通的工程師，但有豐富的程式設計經驗，完全有能力透過自學的方式學習機器學習程式設計。這裡向大家推薦一個機器之心很喜歡選擇的一個文章主題《沒有博士學位如何玩轉TensorFlow和深度學習》。

最後用機器之心不久之前發表的一篇文章資料說話（《AI人才爭奪戰持續升級，資料看懂華人工智慧人才分佈》）：

商務社交平臺脈脈釋出的資料來看，學歷結構上，目前國內 AI 人才的學歷構成以研究生為主，佔比達到 62.72%，反映出該行業由於涉及到多學科的交叉理論，對人才的學歷要求較高；本科以 29.94% 的佔比位居第二；博士佔比為 5.84%，位居第三。

但脈脈此資料的樣本源受到脈脈的使用者規模、分佈和行業集中度影響，結論僅供參考。
5 # 量化俠

筆者作為一名機器學習從業者，看到這個提問倍感親切，以下就從自身體會結合實際來談談對此問題的看法。

機器學習在海內外掀起一陣陣招聘熱潮，國內AI人才匱乏，招聘條件又極其嚴格，機器學習工程師招聘學歷要求的相關討論也是不絕於耳。這裡需要明確的是，博士學位更多的是對博士生涯學術態度和能力的一種肯定。如所學專業與AI及其基礎演算法相關，對於成為合格的機器學習工程師是有幫助的，但並非必備條件。
稀缺的人才

從近些年海內外發布的機器學習工程師職位要求來看，平均學位要求為碩士，對於碩士學位以上的人才，專業放開至理工科背景。由於國內AI專業缺失，因此實際招聘中遇到專業對口的本科人才已屬不易，對口專業主要包括機器學習、資料探勘、統計學等等。根據崗位功能，對於機器學習人才也有不同的需求，多數崗位偏向於應用層面，而只有少量崗位面向演算法開發。據不完全統計，全球每年培養的AI演算法開發人才不足百人。

高精尖的工程師

機器學習工程師是高精尖的代名詞，因為機器學習涵蓋了現代數學及其經典演算法，許多演算法可以在理工科課程中找到，可謂是集大成者。因此，從機器學習小白到大神有很漫長的路需要走。筆者根據幾年工作經驗，將不同階段所達到的水平以及技能加以概括，如下所示，希望拋磚引玉、交流分享，不足之處還請大家批評指正。
通常工科碩博的起點往往介於Level 2和Level 3之間，但要成為合格的工程師還需一路過關斬將、解鎖多項技能才能有質的提高。

6 # 西線學院

　　當你學習機器學習課程時，有沒有被資訊過載所淹沒？

　　大部分的學習者都遇到了這個問題，這不是他們的錯，因為絕大多數的機器學習課程都過於關注個別演算法了。

　　沒錯，雖然演算法很重要，但他們還是把太多時間花在了演算法上。

　　以至於......你幾乎很難在短時間內走完一遍機器學習的流程，從而感受到透過它解決具體資料問題的巨大興奮。
　　這些機器學習課程關注於演算法是因為它容易教。相比之下，如果機器學習老師要帶你走一遍機器學習的流程，那麼他需要搭建計算環境，完成資料採集、清洗、拆分，特徵處理，模型調參和模型預測，甚至他還需要一個面向學習者的互動介面。老師哪有這麼多的工具，與其手把手帶著學生走一遭，還不如學習機器學習演算法。

　　但這樣的問題是，很難有人能堅持透過自學，成為一個卓越的機器學習科學家。哪怕他是數學博士，或者技術高超的程式設計師，都很容易陷在細節中而難以有具體專案實現的成就感。

　　這份教程將會帶來完全不同的思路。它非常適合自學者，即便完全沒有程式設計的基礎，也能透過恰當的工具快速實現機器學習模型，解決工作、生活中遇到的具體問題。
　　值得注意的是，我們享用了世界頂級的機器學習資源，而不需要花費 1 分錢。

　　自我學習的方式

　　我們推薦透過 Doing Shit（不是技術術語）完成你的學習。

　　在這之前你也許已經學習過機器學習了，但從我和朋友們的經驗來看，往往會被各種神秘的符號、公式、大量的教科書和論文整的暈頭轉向，然後再也不想碰這惱人的玩意了。

　　我們的方法會更加友好，它的學習過程就像小朋友學習一樣，你會了解一些基礎的知識（但不一定要完全弄懂），然後透過好用的工具快速實現出來就好了。而當你被建模出來的結果吸引，那時候我們才談演算法背後的數學邏輯和計算邏輯。

　　所以我們會在學習中做很多機器學習專案，這樣的好處是當你面對一個工作機會時，你就是一個經驗豐富的機器學習科學家了！
　　當然自學本身是需要自律的，這本教程將一直陪伴著你，以下是 4 個步驟。

　　1.前提條件（不需要完全弄懂）

　　統計學、程式設計和數學（也可以不需要程式設計）

　　2.海綿模式

　　把自己浸泡在機器學習的各種理論中

　　3.目標實踐

　　透過機器學習包實踐 9 個有意思的題目

　　4.機器學習專案

　　深度參與到感興趣的專案和領域中

　　步驟 1：前提條件

　　機器學習之所以看起來很嚇人，是因為總伴隨著那些晦澀難懂的術語。實際上，即便你是中文系畢業的，也可以學好機器學習。不過，我們需要你在一些領域有基礎的理解。
　　好訊息是，一旦你滿足了前提條件，其餘的將會非常容易。事實上，幾乎所有的機器學習都是把統計學和計算機科學的概念應用於資料領域。

　　任務：確保你瞭解基礎的統計學、程式設計和數學

　　統計學：理解統計學、特別是貝葉斯機率對許多機器學習演算法來說都是至關重要的。

　　程式設計：懂得程式設計將會更靈活的應用機器學習。

　　數學：對原始演算法的研究需要線性代數、多變數計算的基礎。

　　步驟 2：海綿模式

　　海綿模式是儘可能吸收足夠多的機器學習理論知識。

　　這是一個合理的問題！

　　然而，如果你想把機器學習更靈活的應用於日常工作，學習一些基礎理論還是很有好處的，而且你並不需要完全弄懂。下面我們會劇透學習機器學習理論的 5 個理由。
　　（1）規劃和資料採集

　　資料採集真是一個昂貴和耗時的過程！那麼我需要採集哪些型別的資料？根據模型的不同，我需要多少資料？這個挑戰是否可行？

　　（2）資料假設和預處理

　　不同的演算法對資料輸入有不同的假設，那我應該如何預處理我的資料？我應該正則化嗎？假如我的模型缺少一些資料，它還穩定嗎？離群值怎麼處理？

　　（3）解釋模型結果

　　簡單的認為機器學習是一個“黑盒子”的概念是錯誤的。是的，並不是所有的結果都直接可以解釋，但你需要診斷自己的模型然後改善它們。我要怎麼評估模型是過擬合還是欠擬合？我要向業務利益相關者怎麼解釋這些結果？以及模型還有多少的改善空間？
　　（4）改進和調整模型

　　你的第一次訓練很少會達到最佳模式，你需要了解不同的調參和正則化方法的細微差別。如果我的模型是過擬合了，我該如何補救？我應該花更多時間在特徵工程上，還是資料採集上？我可以組合我的模型嗎？

　　（5）驅動商業價值

　　機器學習從來不會在真空中完成。如果你不瞭解武器庫中的工具，就無法最大化發揮它們的效能。在這麼多結果指標中，哪些是最佳化的參考指標？哪個更為重要？或者還有其他的演算法會表現更好嗎？

　　好訊息是，你不需要一開始就知道所有問題的答案。所以我們推薦你從學習足夠的理論開始，然後快速進入到實踐。這樣的話，你比較能夠堅持下來，並在一段時間後真正精通機器學習。

劇多

成為一個合格的機器學習工程師，到底需不需要一個博士學位？

相關內容