現在正是深度強化學習(Reinforcement Learning, RL)的巔峰時刻。不論是加持智慧機器人,模擬人類腦神經,還是超越醫生的醫療診斷,擊敗人類的圍棋比賽。
雖然這種強大的機器學習還並不足以與人類與生俱來的靈活與敏捷相媲美,但不可否認它是未來更高階智慧機器的敲門磚。
只不過,它不能停止前進。因為這些演算法背後的概念基於試錯,一個強化學習的AI代理只有在其做出正確的決定,並得到獎勵後,才能真正完成它的學習過程。
而對於複雜的問題,AI代理需要不斷地試錯才能做出正確的決定,而這背後的時間代價過高。即便它趨於實用化,我們仍有自己這一關需要克服,因為人類無法完全滿足人工智慧機器的巨大能源需求。
簡單來說,我們現在遇到的問題就是,訓練人工智慧需要耗費大量人力物力,我們目前使用的許多系統都是在大規模GPU網路、超級計算機上訓練的,訓練過程需要耗用難以想象的巨大能量。
人工智慧之所以如此擅長影象識別/自然語言處理,是因為它基本上只是反覆做同樣的事情,每次只進行微調,直到把事情做對。
這並不是執行幾次模擬就足夠的,要訓練出一個強大的人工智慧系統,可能需要數百甚至數千小時。不僅如此,訓練開支可以說是鉅額。
如果人工智慧就是人類未來,以目前的能耗模式,未來也許根本就不存在。
於是乎,解決方案來了:量子計算。一個由維也納大學、麻省理工學院、因斯布魯克大學、萊頓大學等地科學家組成的國際研究團隊,於近日發表了研究報告,展示了混合人工智慧系統的“量子加速”。
研究團隊的側重點是將量子和經典計算相結合,他們沒有完全使用量子力學原理構建該強化學習系統,而是透過一種更為實用的混合辦法,該混合型人工智慧可以同時篩選出幾種不同的問題解決方法。
論文中提到,對於實際應用來說,關鍵問題是AI代理的學習速度。儘管已經有很多研究使用量子力學來加速AI代理的決策過程,但尚未證明可以縮短學習時間。
論文中提出了一個強化學習實驗,在該實驗中,透過使用量子通訊通道與環境,加速AI的學習過程。實驗進一步表明,將這一方案與經典通訊相結合,可以對加速予以評估,並允許對學習進度進行最佳化控制。
在使用10000個AI代理並經過165項實驗後,研究團隊從實際實驗資料中發現,在挑戰更復雜的問題時,混合量子系統顯示出明顯的優勢。
實驗中,團隊將經典系統與加入特殊量子晶片的混合量子系統進行對比。所謂特殊,是指團隊使用的量子晶片基於奈米光子,稱為奈米光子處理器的可程式設計晶片。簡言之,它們用光來代替電。
實驗結果顯示,加入量子計算的強化學習人工智慧,要比沒有加入量子計算的快60%以上。論文作者表示,該實驗首次展示了新增量子計算可以加速AI代理的實際學習過程。
這種混合型人工智慧一旦規模化,就會對現實世界問題產生影響,例如構建一個高效的量子網際網路,因為可以輕而易舉地將該裝置整合到未來的大規模量子通訊網路中。
在那之前,團隊仍然還有許多工作要做,因為此次的實驗並不是最終目標,更像是一個小規模的模型。一旦明確如何將該技術應用到更大的實際問題上,它就能發揮作用。