回覆列表
  • 1 # 傑哥愛程式設計

    個人認為這個領域的發展前景和發展空間是非常巨大的,近幾年深度學習的崛起推動了這個領域的發展熱潮。但是,機器學習不管對於人才、技術本身的發展或者行業應用落地,還是處於一個非常不成熟的階段,遠沒有達到飽和,雖然我們國內自主培養的AI人才有著顯著提升,但是遠沒有達到飽和,尤其是這個領域頂尖的學者和創業者。這個領域需要大量優質人才。

  • 2 # 鐳射老林

    大約2014年,許多人開始意識到我們在機器學習領域所做的工作還遠遠不夠,它們僅能實現改變世界藍圖的一半,而另一半則是被我們視為資料科學最頂層的決策系統。上世紀90年代,我們對所建立的系統都十分樂觀。但漸漸地,我們發現,這些系統在應用到實際生活中時並沒有效果,比如在最佳化城市交通資料時,一個完美的最佳化演算法並沒有幫助,因為那時我們沒有任何關於城市交通的資料。所以現在,我們嚴肅認真地考慮重新回到基於資料科學的大規模最佳化和決策上。

    過去兩年中,機器學習領域的最大變化

    對於許多大型搜尋引擎公司來說,機器學習超過百分之五十的工作在於測試和驗證。因此,我對未來穩定、可靠且經過長期驗證的機器學習模型充滿期待,以及如何確保深度學習演算法不會在執行幾個月後走向奇怪的方向。對於機器學習演算法,會有工具幫助快速診斷目前正在發生什麼以及如何解決。例如,你有一些系統問題導致了隨機梯度下降的更新,並帶來了額外的延遲等,而對於這些問題你都可以很快地理解,並改進。但在我的學術生涯中,還沒有看到過類似的技術,所以我希望接下來的幾年,我們的機器學習模型可以在穩定性、安全性和長時間的可靠性上有更大的突破。

    首先我想展示一下一位同事最近的研究成果。他研究的是針對如飛機和汽車動力系統的操縱系統前期和後期條件型別分析,這曾經被認為是最重要的證明軟體正確性的方法之一。我的這位同事採用老式方法將系統與控制系統中的統計和數值方法結合,來證明如果有一個機器人控制演算法,即使是一個非線性的演算法,它也會按照所說的來做。現在,美國許多的自動駕駛系統研究在提高系統安全的問題上停滯不前,因此,這項工作將非常具有實用意義。

    在軍事方面,使用自動駕駛技術可以避免很多不必要的犧牲,僅僅使用一輛車就可以帶動其餘的自動駕駛車輛。雖然聽起來很簡單,但這項應用實現的最大阻礙還是證明我們所使用的機器學習系統和這些自主駕駛場景的可靠性。所以,當我們在新的研究領域找尋策略時,自適應演算法的安全性驗證相比於增加現有演算法速度的準確性,可能會更重要。

    我們還做了很多有趣的研究。如今,人類生物識別也已成為一個科學研究方向。與從演講錄音中提取演講內容相反,我的一位同事,Rita嘗試了從中提取其他的聲音訊號,進而得到關於演講者的資訊。我們可以從低解析度的資料中準確的預測出人的氣管形狀和大小,同時,這些資訊與人的身高、體重等其他身體特徵也密切相關。簡而言之,她可以在一場演講錄音中瞭解演講者的身高、體重、成長地等等。這也是機器學習新應用的一個例子。

    此外,一個研究的重要領域是逆向強化學習(Inverse Reinforcement learning)。眾所周知,在強化學習中,我們會定義一個獎勵函式(reward function),然後嘗試尋找最大化獎勵函式長期結果的策略。而在逆向強化學習中,我們則是嘗試根據其他個體選擇的行為來推斷它們的獎勵函式。比如,根據車流和行人已有的移動軌跡我們可以預測每個人、每輛車的移動可能。所以,當我們把目光投向計算機視覺的未來時,實際上我們已經將重心從觀測即時資訊,轉向了預測將來15秒的狀態資訊。這對於自動駕駛和人群的安全都將有重大意義。

    我們關注的另一個領域是,自主平臺在機器人相關方面的成熟應用。預測空間的3D模型在機器人技術進步的基礎上,也已經非常成熟了,而這也是將來機器人發展的基礎。如果你熟悉這一成熟技術背後的計算模型,從獲取資料到傳送到雲端,它使用了大量的EM 演算法以加速前後的推理。而我的一位同事的研究突破在於使演算法有了一個非常準確的增量,不再需要上傳資料到雲端。透過簡潔的代數技巧(algebra trick),我們可以模擬整個EM演算法的執行。更有意義的是,低功耗的遠端裝置就可以完成。

    接下來的兩年內,機器學習領域可能會有的突破。

    目前說機器學習領域已經飽和為時過早,我們還有很多有趣的方面沒有探索。情緒壓力測試是一個快速成長的領域,微軟是這方面的專家。在匹茲堡,我們也對這一領域充滿興趣。這裡有一個重要的應用,我們可以透過觀察人們說話時的面部特徵,評估他們對於某件事情情緒波動的程度。舉個例子,當用於醫療時,我們可以透過觀察病人的反應,判斷治療是否有效。一年前,我們曾有實驗表明,在醫生可以判斷病人生理特徵表現的六週前,我們就成功判斷了治療的效果,透過對面部肌肉的檢測我們可以獲得許多情緒資訊。因此,未來我們或許可以更快捷、有效地幫助患有精神疾病的病人。

    同時,對於大家關注的使用者和電腦間的對話系統,我們的兩位同事發現,對於複雜對話,病人談論到一些疾病症狀,或者學習上有疑問想獲得反饋的孩子們,機器能夠對對話產生更快、更成功的結果,因為機器可以根據使用者情緒調整反饋結果。

    所以,透過這些客觀證據我們可以看出,如果想建立一個優秀的對話系統,則需要考慮到實際情緒的相互作用。現在在CMU,我們有計算機視覺實驗室,有對於語言技術的研究,我相信在不久的將來,情緒認知也會是我們的研究重心。

    接下來,我想談談知識圖譜。在美國,許多企業和大學包括微軟,以及一些政府機構經過一系列的會議討論一致認為,我們需要分享構建的大型知識圖譜。因為對於對像阿里巴巴、亞馬遜這樣的零售公司來說,為各種產品構建單獨的知識圖譜是非常困難的,同樣的,對於做地圖的公司來說,為城市地標構建單獨的知識圖譜也非常困難。

    患者想要討論醫療健康問題、學生想討論關於學習的問題等等,在未來,商業領域之外的對話系統構建方面,我們還有很多工作可以做。醫療、教育、政府等,如果每個公司都單獨構建知識圖譜,那麼這將消耗大量資金,同時,不同的語言也會帶來很多不必要的資源浪費。因此,我們強烈認為,合作將是未來工作的基礎,我們將一起構造開放的知識網路。

    首先,我們可以將各種實體作為知識圖譜的節點,這些實體可以是埃菲爾鐵塔、CMU音樂學院、甚至可以是一個投影儀等等。對於這些數以萬億的實體,目前我們有很多型別的實體工具,它們各有利弊。成本高、針對性強的圖譜難以大範圍應用,通用的圖譜又過於耗時。例如GIS系統雖然已經很完善但仍難以應用到其他領域。所以,將來我們在構建和儲存實體時,需要在資料庫中為他們和其他實體建立對話聯絡。

    然後,我們要匹配引擎(matching engine)。這與搜尋引擎非常相似,同樣需要快速的深度學習能力。匹配引擎從演講、文字、可視範圍中選取內容,以構建知識圖譜中實體的機率分佈,這對於構建一個準確的匹配非常重要。所以,對基於知識圖譜實現具體應用的人們來說,他們需要處理機率集合以形成總體結論。

    大家都知道,現在大部分的知識圖譜是基於三元組的,三元組是一種原始的表達事實的方式。除了科學實驗,它還出現在一些與科學相關的領域,如經濟、金融等。專家們發現,因為缺乏統一的資料模式,即使有很好的資料集,它們還是很難在資料間建立連線。這也是我們希望透過構建全域性知識圖譜來幫助我們的地方。

    有趣的是,在構建全域性知識圖譜中,我們還有很多機器學習的問題需要解決,比如合併指向同一實體的不同物件或者區分相像但不同的物件等。雖然我們有很不錯的機率模型,但是在公共領域之外,它們無法像成熟的演算法一樣處理數萬億的內容(mentions)以建造理想的對話系統。發現問題,解決問題,這是一件非常令人興奮的事情。

  • 臺幣 28,000 買布偶貓划算嗎?內行人解析 5 大關鍵指標
  • 為什麼私募基金的門檻越來越低?