DeepMind是世界上前沿的人工智慧研究機構。在過去三年裡,DeepMind的虧損超過了10億美元。未來一年,還將償還超過10億美元的債務。但這並不意味著人工智慧正在崩析!
研究是要花錢的,DeepMind每年都在做更多的研究。投入的資金是巨大的,可能比以往任何人工智慧專案的投入都要多,但與科學領域一些規模最大的專案所花費的資金相比,還遠遠算不上史無前例。
大型強子對撞機每年耗資約10億美元,而發現希格斯玻色子的總成本據估計超過100億美元。當然,真正的機器智慧(也被稱為通用人工智慧)的價值遠不止這些,它可以驅動一臺像《星際迷航》(Star trek)那樣的計算機,能夠分析用普通英語提出的各種問題。
儘管如此,DeepMind不斷攀升的虧損規模還是值得深思的:2016年虧損1.54億美元,2017年虧損3.41億美元,2018年虧損5.72億美元。
在我看來,有三個核心問題:
DeepMind是否走在科學的正軌上?
從Alphabet的角度來看,這種規模的投資是否合理?
這些損失又將如何影響人工智慧?
關於第一個問題,我們是有理由懷疑的。DeepMind將大部分雞蛋放在一個籃子裡,這種技術被稱為深度強化學習。
該技術將主要用於識別模式的深度學習與強化學習相結合,基於獎勵訊號進行學習,例如遊戲中的分數或象棋等遊戲中的勝利或失敗。 2013年,DeepMind在一篇論文中給這項技術取了名字,該論文展示瞭如何訓練單個神經網路系統來玩Atari遊戲,比如《Breakout》和《Space Invaders》,與人類的水平相當,甚至比人類玩得還要好。
這篇論文是一篇工程傑作,可能是2014年1月DeepMind出售給谷歌的關鍵催化劑。這種技術的發展推動了DeepMind在圍棋和電腦遊戲《StarCraft)》中取得了令人印象深刻的勝利。
問題是,這種技術非常受限於於特定的環境。例如,在玩Breakout時,微小的變化就會導致效能急劇下降(比如將paddle up移動幾個畫素)。
DeepMind星際爭霸的結果同樣受到限制,當在單個地圖上玩具有單一“種族”角色的時,結果優於人類,但在不同地圖和不同角色上的結果較差。如果要切換角色,則需要重新訓練系統。
在某些方面,深度強化學習是一種渦輪增壓記憶; 使用它的系統能夠提供很棒的功能,但是他們對自己的工作理解很淺。
因此,當前的系統缺乏靈活性,無法在世界發生變化時進行相應的變化,甚至是微小的變化也不行。(DeepMind最近關於腎病的研究結果也受到了類似的質疑)
深度強化學習也需要大量的資料。例如:數以百萬計與自己對戰的圍棋遊戲資料。這遠遠超過了一個人想要在圍棋上成為世界級棋手所需要的資料水平,而且通常會非常困難或昂貴,往往需要谷歌規模的計算資源。
這意味著,在許多實際問題中,僅計算一項對於大多數使用者來說就太過昂。據估計,AlphaGo的訓練時間花費了3500萬美元;同樣的訓練將消耗的能量與12760個連續三天不睡覺的人腦消耗的能量相同。 但這只是經濟學。正如我和歐內斯特•戴維斯(Ernest Davis)在即將出版的新書《重啟人工智慧》(Rebooting AI)中所說:“真正的問題在於信任”。
目前,深度強化學習只能在控制良好、很少出現意外的環境中進行;這對於在2000年規則都沒有改變的圍棋遊戲來說是可行的,但是在許多實際情況中卻不可以。
部分原因是,很少有現實世界的問題像DeepMind關注的遊戲那樣受到特定環境的限制,因此DeepMind還沒有找到任何深度強化學習的大規模商業應用。到目前為止,Alphabet已投資約20億美元(包括2014年報道的6.5億美元收購價)。
相比之下,不包括宣傳在內的直接財務回報相對較低,去年的營收約為1.25億美元,其中一些來自於在Alphabet內部應用深度強化學習來降低冷卻谷歌伺服器的電力成本。 深度強化學習可以像電晶體一樣,是一項改變世界的研究發明,也可以是“尋找問題的解決方案”。
雖然適用於圍棋的技術,但可能不適用於DeepMind渴望的用人工智慧來解決具有挑戰性的問題(比如癌症和清潔能源)。IBM也體會到了這一難點, 他們在將Watson專案應用於醫學診斷時,收效甚微。
Watson在一些病例上做得很好,但在另一些病例上卻失敗了,有時會錯過像心臟病發作這樣的診斷,而這對一年級醫學生來說都顯而易見。
當然,這可能只是時間問題。至少從2013年DeepMind就開始致力於深度強化學習的研究,甚至比這更早,但科學進步很少能在一夜之間轉化為產品。
DeepMind或其他公司可能最終會找到一種方法,透過深度強化學習來產生更深入、更穩定的結果,或許是透過與其他技術相結合——或許不是。
最終,深層強化學習可能會像電晶體,成為徹底改變世界的企業實驗室的研究發明,也可能是約翰•梅納德•史密斯(John Maynard Smith)曾描述為“尋找問題的解決方案”的那種學術好奇心。“
我個人的猜測是,它最終將成為介於兩者之間的一個有用而廣泛的工具,但不會改變世界。 應該沒有人會把DeepMind排除在外,即使它目前的戰略不如許多人所希望的那麼豐富。深度強化學習可能不是通往人工智慧的坦途,但DeepMind本身是一個強大的機構,管理嚴密,資金充足,擁有數百名博士。
它在《圍棋》、《雅達利》和《星際爭霸》中所取得的成就吸引了更多的人才。即使人工智慧領域的風向發生變化,DeepMind也會很好的適應。而且,很顯然沒有人能比得上它。 此同時,在Alphabet的大背景下,每年5億美元並不是一個巨大的賭注。Alphabet明智地投資了其他AI專案,例如Google Brain,它本身也在快速增長。
Alphabet可能會以不同方式改變其人工智慧投資組合的平衡,但作為一家年收入1000億美元、從搜尋到廣告推薦等一切都依賴人工智慧的公司,Alphabet進行幾筆重大投資並不瘋狂。
最後一個問題,即DeepMind的經濟狀況總體上將如何影響人工智慧,很難回答。如果炒作超過了實際效果,它可能會帶來一個“人工智慧冬天”,甚至連支持者都不願意投資。
投資界注意到了重大虧損,如果DeepMind的虧損繼續以每年約兩倍的速度增長, Alphabet甚至最終也可能退出。這不僅是錢的問題。目前為止,還缺乏切實的財務回報。在某些時候,投資者可能被迫重新調整他們對人工智慧的熱情。
不僅僅是DeepMind。就在幾年前,許多有望實現的進步都還沒有實現,比如能夠自動駕駛的汽車,或者能夠理解對話的聊天機器人。
馬克·扎克伯格(Mark Zuckerberg)在2018年4月向國會做出的人工智慧將很快解決假新聞的承諾已經放緩,正如我和戴維斯所預測的那樣:“Talk is cheap,最終對人工智慧的熱情程度將取決於所提供的回報。” 就目前的機器智慧而言,炒作比構建更容易。雖然在廣告和語音識別等有限領域已經取得了巨大的進步,但人工智慧還有很長的路要走。
不能否認對大資料集進行合理分析的好處,即使在有限的形式下,人工智慧已經是一個強大的工具。雖然企業界對人工智慧並不樂觀,但他們也不會完全退出。
十年後,我們將得出結論,在21世紀的10時代,高估了深度強化學習,忽視了許多其他重要的研究領域。現在機器學習的研究人員經常問:“機器如何使用大量的資料來最佳化複雜的問題?”
我們可能還會問,“孩子們的能力和使用的資料都不及人工智慧系統,他們是如何學習語言和理解世界的?”
如果我們在後一個問題上花費的時間、金錢和精力比前一個問題更多,我們可能會更快地獲得通用人工智慧。
DeepMind是世界上前沿的人工智慧研究機構。在過去三年裡,DeepMind的虧損超過了10億美元。未來一年,還將償還超過10億美元的債務。但這並不意味著人工智慧正在崩析!
研究是要花錢的,DeepMind每年都在做更多的研究。投入的資金是巨大的,可能比以往任何人工智慧專案的投入都要多,但與科學領域一些規模最大的專案所花費的資金相比,還遠遠算不上史無前例。
大型強子對撞機每年耗資約10億美元,而發現希格斯玻色子的總成本據估計超過100億美元。當然,真正的機器智慧(也被稱為通用人工智慧)的價值遠不止這些,它可以驅動一臺像《星際迷航》(Star trek)那樣的計算機,能夠分析用普通英語提出的各種問題。
儘管如此,DeepMind不斷攀升的虧損規模還是值得深思的:2016年虧損1.54億美元,2017年虧損3.41億美元,2018年虧損5.72億美元。
在我看來,有三個核心問題:
DeepMind是否走在科學的正軌上?
從Alphabet的角度來看,這種規模的投資是否合理?
這些損失又將如何影響人工智慧?
關於第一個問題,我們是有理由懷疑的。DeepMind將大部分雞蛋放在一個籃子裡,這種技術被稱為深度強化學習。
該技術將主要用於識別模式的深度學習與強化學習相結合,基於獎勵訊號進行學習,例如遊戲中的分數或象棋等遊戲中的勝利或失敗。 2013年,DeepMind在一篇論文中給這項技術取了名字,該論文展示瞭如何訓練單個神經網路系統來玩Atari遊戲,比如《Breakout》和《Space Invaders》,與人類的水平相當,甚至比人類玩得還要好。
這篇論文是一篇工程傑作,可能是2014年1月DeepMind出售給谷歌的關鍵催化劑。這種技術的發展推動了DeepMind在圍棋和電腦遊戲《StarCraft)》中取得了令人印象深刻的勝利。
問題是,這種技術非常受限於於特定的環境。例如,在玩Breakout時,微小的變化就會導致效能急劇下降(比如將paddle up移動幾個畫素)。
DeepMind星際爭霸的結果同樣受到限制,當在單個地圖上玩具有單一“種族”角色的時,結果優於人類,但在不同地圖和不同角色上的結果較差。如果要切換角色,則需要重新訓練系統。
在某些方面,深度強化學習是一種渦輪增壓記憶; 使用它的系統能夠提供很棒的功能,但是他們對自己的工作理解很淺。
因此,當前的系統缺乏靈活性,無法在世界發生變化時進行相應的變化,甚至是微小的變化也不行。(DeepMind最近關於腎病的研究結果也受到了類似的質疑)
深度強化學習也需要大量的資料。例如:數以百萬計與自己對戰的圍棋遊戲資料。這遠遠超過了一個人想要在圍棋上成為世界級棋手所需要的資料水平,而且通常會非常困難或昂貴,往往需要谷歌規模的計算資源。
這意味著,在許多實際問題中,僅計算一項對於大多數使用者來說就太過昂。據估計,AlphaGo的訓練時間花費了3500萬美元;同樣的訓練將消耗的能量與12760個連續三天不睡覺的人腦消耗的能量相同。 但這只是經濟學。正如我和歐內斯特•戴維斯(Ernest Davis)在即將出版的新書《重啟人工智慧》(Rebooting AI)中所說:“真正的問題在於信任”。
目前,深度強化學習只能在控制良好、很少出現意外的環境中進行;這對於在2000年規則都沒有改變的圍棋遊戲來說是可行的,但是在許多實際情況中卻不可以。
部分原因是,很少有現實世界的問題像DeepMind關注的遊戲那樣受到特定環境的限制,因此DeepMind還沒有找到任何深度強化學習的大規模商業應用。到目前為止,Alphabet已投資約20億美元(包括2014年報道的6.5億美元收購價)。
相比之下,不包括宣傳在內的直接財務回報相對較低,去年的營收約為1.25億美元,其中一些來自於在Alphabet內部應用深度強化學習來降低冷卻谷歌伺服器的電力成本。 深度強化學習可以像電晶體一樣,是一項改變世界的研究發明,也可以是“尋找問題的解決方案”。
雖然適用於圍棋的技術,但可能不適用於DeepMind渴望的用人工智慧來解決具有挑戰性的問題(比如癌症和清潔能源)。IBM也體會到了這一難點, 他們在將Watson專案應用於醫學診斷時,收效甚微。
Watson在一些病例上做得很好,但在另一些病例上卻失敗了,有時會錯過像心臟病發作這樣的診斷,而這對一年級醫學生來說都顯而易見。
當然,這可能只是時間問題。至少從2013年DeepMind就開始致力於深度強化學習的研究,甚至比這更早,但科學進步很少能在一夜之間轉化為產品。
DeepMind或其他公司可能最終會找到一種方法,透過深度強化學習來產生更深入、更穩定的結果,或許是透過與其他技術相結合——或許不是。
最終,深層強化學習可能會像電晶體,成為徹底改變世界的企業實驗室的研究發明,也可能是約翰•梅納德•史密斯(John Maynard Smith)曾描述為“尋找問題的解決方案”的那種學術好奇心。“
我個人的猜測是,它最終將成為介於兩者之間的一個有用而廣泛的工具,但不會改變世界。 應該沒有人會把DeepMind排除在外,即使它目前的戰略不如許多人所希望的那麼豐富。深度強化學習可能不是通往人工智慧的坦途,但DeepMind本身是一個強大的機構,管理嚴密,資金充足,擁有數百名博士。
它在《圍棋》、《雅達利》和《星際爭霸》中所取得的成就吸引了更多的人才。即使人工智慧領域的風向發生變化,DeepMind也會很好的適應。而且,很顯然沒有人能比得上它。 此同時,在Alphabet的大背景下,每年5億美元並不是一個巨大的賭注。Alphabet明智地投資了其他AI專案,例如Google Brain,它本身也在快速增長。
Alphabet可能會以不同方式改變其人工智慧投資組合的平衡,但作為一家年收入1000億美元、從搜尋到廣告推薦等一切都依賴人工智慧的公司,Alphabet進行幾筆重大投資並不瘋狂。
最後一個問題,即DeepMind的經濟狀況總體上將如何影響人工智慧,很難回答。如果炒作超過了實際效果,它可能會帶來一個“人工智慧冬天”,甚至連支持者都不願意投資。
投資界注意到了重大虧損,如果DeepMind的虧損繼續以每年約兩倍的速度增長, Alphabet甚至最終也可能退出。這不僅是錢的問題。目前為止,還缺乏切實的財務回報。在某些時候,投資者可能被迫重新調整他們對人工智慧的熱情。
不僅僅是DeepMind。就在幾年前,許多有望實現的進步都還沒有實現,比如能夠自動駕駛的汽車,或者能夠理解對話的聊天機器人。
馬克·扎克伯格(Mark Zuckerberg)在2018年4月向國會做出的人工智慧將很快解決假新聞的承諾已經放緩,正如我和戴維斯所預測的那樣:“Talk is cheap,最終對人工智慧的熱情程度將取決於所提供的回報。” 就目前的機器智慧而言,炒作比構建更容易。雖然在廣告和語音識別等有限領域已經取得了巨大的進步,但人工智慧還有很長的路要走。
不能否認對大資料集進行合理分析的好處,即使在有限的形式下,人工智慧已經是一個強大的工具。雖然企業界對人工智慧並不樂觀,但他們也不會完全退出。
十年後,我們將得出結論,在21世紀的10時代,高估了深度強化學習,忽視了許多其他重要的研究領域。現在機器學習的研究人員經常問:“機器如何使用大量的資料來最佳化複雜的問題?”
我們可能還會問,“孩子們的能力和使用的資料都不及人工智慧系統,他們是如何學習語言和理解世界的?”
如果我們在後一個問題上花費的時間、金錢和精力比前一個問題更多,我們可能會更快地獲得通用人工智慧。