首頁>科技>

斯坦福大學吳恩達教授在電腦科學課上闡述如何在人工智慧領域出類拔萃時說到:

深度學習的發展勢如破竹,即便已掌握了深度學習的基礎知識,在研究特定應用程式時,仍需閱讀論文以緊跟最新趨勢。

吳恩達教授分享了一個簡單有效的閱讀計劃技巧。包括以下步驟:

· 選擇一個感興趣的話題(如語音識別、文字摘要、GANs影象生成)。

· 逐步把文章量擴大到50篇以上。

此外,吳恩達教授還分享了幾個查詢資源的地方,如Twitter,Machine Learning subreddit(https://www.reddit.com/r/MachineLearning/),NIPS(https://nips.cc/),ICML(https://icml.cc/)和ICLR(https://iclr.cc/)(後三者為機器學習會議)。

那麼就這個方法來說,制定合適的論文清單需要花多少時間和精力?本文將傳授你一些小技巧。

如何開始?

第一步,選定主題/問題。在筆者的案例中,主題是如何將深度學習應用於各種型別貸款(抵押貸款、個人貸款、信用卡等)的信用風險評估。

一旦確定了主題就列出相關關鍵詞。筆者的關鍵詞是:信用、貸款、放貸、抵押、風險、評估、分數、銀行和金融。

瀏覽網路以獲取資源

尋找到合適的資源可能需要耗費1小時到一兩天,這取決於找到“完美”論文的決心有多大。但應當避免在搜尋上耗費不必要的時間,只要找到3-4篇論文,就可以真正開始閱讀了。下方列出了幾種尋找資源的有效方法。

標準Google搜尋

眾所周知,在Google搜尋上文提到的關鍵字是第一步。然後,筆者發現這種方法並不高效,因為其結果通常並無實際解決方案,而是適合所有讀者的主題概述。

然而,如果使用Google Scholar搜尋,找到所需內容的可能性則高得多。

搜尋高階機器學習會議

第二步是瀏覽過去幾年會議的所有標題,從中提取有趣論文。以NIPS會議為例,尋找已提交論文的列表。

· 首先,訪問https://nips。將年份切換為2019年、2018年、2017年等分別搜尋。

對會議進行逐年搜尋時,將https://nips.cc/Conferences/2019改為https://nips.cc/Conferences/2019/Workshopbook並點選回車鍵。攜有當年所有論文摘要的“研討會手冊”PDF文件將自動下載。

· 最後,瀏覽各部分,選擇與主題相關的論文。

其他會議網站也有“研討會手冊”,可通過類似途徑獲取。

搜尋最熱門的線上論文圖書館

這類網站包括arxiv.org,Semantic Scholar,Science Direct等。在每個平臺將先前選定的關鍵字通過“高階搜尋”選項篩選出有趣的內容。

注:有些檔案可能是私人的,需要購買。

深入研究論文

尋找與主題完全匹配的論文的過程可能既乏味又耗時,很可能會找到不完全匹配但主題相關的論文(在相同或相鄰領域)。

提醒一點,研究人員的論文是基於先前發現幷包含大量參考文獻的。

以下就是筆者如何利用這一點指導自己的:

1.看完NIPS 2018研討會手冊後,筆者發現了一個很棒的研討會,名為《金融服務業人工智慧的挑戰和機遇:公平、解釋性、精確性和隱私的影響》。

2.大多數論文並不完全是關於信用價值評估的,而是關於使金融領域的深度學習模型更易解釋的新方法。

這種方法幫助筆者拓展了資源列表並找到了真正有用的材料。

過濾不需要的內容

在最後一部分中,筆者想回顧一下在選定論文時需要考慮的幾件事,有助於過濾很多不需要的內容,專注於更少但品質更高的資源。

· 作者——論文可由不同領域的不同研究人員發表。筆者通常會在領英或推特上查詢作者的姓名與所在機構。例如,由大型銀行/金融機構的研究人員撰寫的一篇信用風險評估深度學習的論文,很可能是一篇高品質論文。此外,著名的學校(斯坦福、麻省理工、蒙特利爾大學)和公司(臉書、谷歌、百度)通常擁有最優秀的研究人員。

· 發表日期——深度學習領域迅猛發展,因此5年前的論文可能與現在無關。筆者傾向於尋找更近期的論文,但也從不忽視很久之前的優秀論文,尤其是介紹突破性技術的論文。

· 引用次數——如果一篇論文引用次數不高,這並不意味著該論文品質不高。筆者經常檢視論文的引用次數,只是為了了解論文的受歡迎程度,但這從來不是決定性因素。

我們一起分享AI學習與發展的乾貨

編譯組:溫媛、何柳

相關連結:

https://towardsdatascience.com/effective-way-for-finding-deep-learning-papers-daa27415ad16

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 小米用九年間成為最年輕的世界500強