如果我們要創造真正的人工智慧,第一件要教會它的事就是思考。去年,人工智慧AlphaGo首次在人機圍棋大賽中戰勝了人類世界冠軍,鑑於圍棋的巨大複雜性,這次勝利抓取了所有人的目光。然而AlphaGo打敗了多位世界級圍棋棋手的勝利雖然令人印象深刻,但這種人工智慧並不完整,只能說它背後的工程師打贏了棋手而已。也就是說,這種人工智慧只能在有限的任務領域強於人類。
因此,即使AlphaGo在世上最複雜的棋牌遊戲中完勝人類,我們也不會在平凡的日常生活中依靠它,比如讓它給我們泡杯茶或者為家裡的車安排一次保養。
相比之下,經常出現在科學小說中的AI是廣義的人工智慧,和人類具有同等級別和多樣性的智力。雖然我們已經有了從疾病診斷到無人駕駛的各種人工智慧,但如何把這些狹義的人工智慧整合到一起仍然充滿了挑戰。
根據上週釋出的兩篇新論文,這家Alphabet神秘子公司-DeepMind的研究人員正在為一種廣義的人工智慧奠定基礎。雖然他們目前還沒有做到,但初步的實驗結果仍然在一些領域顯得非常有前景,在這些領域內,AI甚至具備了能超越人類的能力。
兩篇論文的主題都是關係推理,這種關鍵的認知能力幫助人們在許多不同的目標和想法上進行比較,例如比較一個物體是否較大或者一個物體是否比起另一個物體更靠左。
人們在每次嘗試解決問題時,總會使用關係推理,但是研究者們目前還沒想到如何賦予AI這種簡單的能力。
DeepMind的研究人員採用了兩種不同的方法來試圖解決這個問題。一種是透過一個簡單的靜態3D資料集來訓練一個神經網路,這種模仿人類大腦的神經網路叫做CLEVR。另外一種神經網路則用來理解2D物件如何隨著時間而變化。
在CLEVR中,首先給神經網路展現一系列簡單的事物,例如菱錐、立方體和球體。然後研究者們用自然語言對AI提出一系列例如「立方體和圓柱是同樣的東西嗎?」的關係推理問題。令人驚喜的是,這種神經網路在關係推理上的的準確性能達到95.5%,超過了人類的基準水平92.6%。
在讓神經網路理解2D目標是如何隨著時間變化時,DeepMind的研究人員創造了一種叫做視覺互動網路(VIN)的神經網路,這種神經網路能夠在一個影片序列中,根據過去的運動來預測一個物體將要出現的位置。研究人員首先為VIN提供了一個影片的三個連續幀,用它來生成一個狀態程式碼。這個狀態程式碼在影片幀中用一系列向量來表示幀內每個物體的位置或者速度。然後,研究人員為VIN提供一串狀態程式碼,這個組合成的序列被用來預測下一幀中的狀態程式碼。
為了訓練視覺互動網路,研究者使用了五種不同的物理系統。這些系統中的2D物件跨越了「自然影象背景」並和各種力量互動作用。例如,其中一個系統就是研究人員根據牛頓萬有引力定律來模擬彼此相互作用的物體。在另一個系統中,提供給神經網路一個檯球遊戲,來預測球未來的位置。
根據研究人員的結論,他們的視覺互動網路特別成功,並且優於目前最領先的影片預測模型。
這項工作是實現廣義人工智慧的重要一步,但是在人工智慧真正接管世界之前還有很多工作要去完成。哈佛計算神經科學家山姆·格甚曼(Sam Gershman)在談到如何實現廣義人工智慧的時候對麻省理工學院技術評論講道:「任何特定機器學習任務的超人類表現都不意味著超人類智慧。」
一切皆未然。
如果我們要創造真正的人工智慧,第一件要教會它的事就是思考。去年,人工智慧AlphaGo首次在人機圍棋大賽中戰勝了人類世界冠軍,鑑於圍棋的巨大複雜性,這次勝利抓取了所有人的目光。然而AlphaGo打敗了多位世界級圍棋棋手的勝利雖然令人印象深刻,但這種人工智慧並不完整,只能說它背後的工程師打贏了棋手而已。也就是說,這種人工智慧只能在有限的任務領域強於人類。
因此,即使AlphaGo在世上最複雜的棋牌遊戲中完勝人類,我們也不會在平凡的日常生活中依靠它,比如讓它給我們泡杯茶或者為家裡的車安排一次保養。
相比之下,經常出現在科學小說中的AI是廣義的人工智慧,和人類具有同等級別和多樣性的智力。雖然我們已經有了從疾病診斷到無人駕駛的各種人工智慧,但如何把這些狹義的人工智慧整合到一起仍然充滿了挑戰。
根據上週釋出的兩篇新論文,這家Alphabet神秘子公司-DeepMind的研究人員正在為一種廣義的人工智慧奠定基礎。雖然他們目前還沒有做到,但初步的實驗結果仍然在一些領域顯得非常有前景,在這些領域內,AI甚至具備了能超越人類的能力。
兩篇論文的主題都是關係推理,這種關鍵的認知能力幫助人們在許多不同的目標和想法上進行比較,例如比較一個物體是否較大或者一個物體是否比起另一個物體更靠左。
人們在每次嘗試解決問題時,總會使用關係推理,但是研究者們目前還沒想到如何賦予AI這種簡單的能力。
DeepMind的研究人員採用了兩種不同的方法來試圖解決這個問題。一種是透過一個簡單的靜態3D資料集來訓練一個神經網路,這種模仿人類大腦的神經網路叫做CLEVR。另外一種神經網路則用來理解2D物件如何隨著時間而變化。
在CLEVR中,首先給神經網路展現一系列簡單的事物,例如菱錐、立方體和球體。然後研究者們用自然語言對AI提出一系列例如「立方體和圓柱是同樣的東西嗎?」的關係推理問題。令人驚喜的是,這種神經網路在關係推理上的的準確性能達到95.5%,超過了人類的基準水平92.6%。
在讓神經網路理解2D目標是如何隨著時間變化時,DeepMind的研究人員創造了一種叫做視覺互動網路(VIN)的神經網路,這種神經網路能夠在一個影片序列中,根據過去的運動來預測一個物體將要出現的位置。研究人員首先為VIN提供了一個影片的三個連續幀,用它來生成一個狀態程式碼。這個狀態程式碼在影片幀中用一系列向量來表示幀內每個物體的位置或者速度。然後,研究人員為VIN提供一串狀態程式碼,這個組合成的序列被用來預測下一幀中的狀態程式碼。
為了訓練視覺互動網路,研究者使用了五種不同的物理系統。這些系統中的2D物件跨越了「自然影象背景」並和各種力量互動作用。例如,其中一個系統就是研究人員根據牛頓萬有引力定律來模擬彼此相互作用的物體。在另一個系統中,提供給神經網路一個檯球遊戲,來預測球未來的位置。
根據研究人員的結論,他們的視覺互動網路特別成功,並且優於目前最領先的影片預測模型。
這項工作是實現廣義人工智慧的重要一步,但是在人工智慧真正接管世界之前還有很多工作要去完成。哈佛計算神經科學家山姆·格甚曼(Sam Gershman)在談到如何實現廣義人工智慧的時候對麻省理工學院技術評論講道:「任何特定機器學習任務的超人類表現都不意味著超人類智慧。」
一切皆未然。