大部分機器學習的課都關注於模型,但在用機器學習解決實際問題的同學們都知道,模型只是整個故事裡的一塊。
如果你是參加比賽,那麼很重要的兩塊是調參和模型融合。如果你是將機器學習用進產品,那麼你80%時間可能花在收集和清理資料上,剩下的時間大都用來監測線上模型質量,和維護定期上線新模型上。
課程是這麼來的
某一天公司老闆突然提議說我們來開一門講如何落地機器學習到產品中的課,關注在模型以外的技術。
這一提議得到了家裡領導的積極贊同(領導指示:疫情後日常的斯坦福遛娃活動被取消了,趕緊拿個證把活動重新搞起來)。
所以9月開始,我將在兩領導的帶領下,開設《實用機器學習》課程。
課程將分四部分,包括:1)資料收集和處理,模型融合和評估,2)處理實際資料中遇到的各種偏移,和有結構的資料(時序,圖),3)自動調參、模型蒸餾、多模組融合,4)效能、公平性、因果推理。
在斯坦福的同學9月1號可以在系統裡選課,課號是 CS329P。我們也在同學校協商將課程影片免費放到網上。當然也有在考慮是不是推出一箇中文版本。
課程簡介
應用機器學習(ML)來準確和穩健地解決實際問題,需要的不僅僅是訓練最新的ML模型。首先,你將學習處理資料的實用技術。這很重要,因為真實的資料往往不是獨立和相同的分佈。
它包括檢測協變數、概念和標籤的轉移,以及對依賴性隨機變數的建模,如時間序列和圖表中的隨機變數。接下來,你將學習如何有效地訓練ML模型,如調整超引數、模型組合和轉移學習。最後,你將學習公平性和模型的可解釋性,以及如何有效地部署模型。
這門課將同時教授統計學、演算法和程式碼實現。作業和最後的專案強調解決實際問題。
授課大牛包括Google Brain高階研究科學家、AWS高階首席科學家和AWS副總裁/傑出科學家。
課程主頁在大家熟悉的d2l.ai:https://c.d2l.ai/stanford-cs329p/
同學們紛紛表示:期待中文版
參考資料:
https://zhuanlan.zhihu.com/p/404855524
https://www.bilibili.com/read/cv12933687
https://c.d2l.ai/stanford-cs329p/