當前,以深度學習為代表的人工智慧技術已經應用到各個行業。驅動人工智慧技術蓬勃發展的是各行各業積累的大資料。可以說,正是在大資料的“餵養”下,人工智慧技術才真正茁壯成長。
然而,在近日召開的香山科學會議第667次學術討論會上,與會專家指出,大資料的“紅利”效應正在逐漸減弱,人工智慧技術的單點突破難以持續支撐行業發展,亟須在資料科學和計算智慧方面突破一些關鍵核心技術。
主流AI演算法未充分考慮大資料複雜性
人們常常用海量性、多樣性、高速以及價值密度低來描述大資料的特點。但真實的大資料往往更加複雜,比如具有不完全性、不確定性、動態性、關聯性等特點。反觀經典的人工智慧演算法,它們對資料的假設往往過於簡單。比如,假設資料是靜態的,產生於獨立同分布的取樣過程;訓練資料是可靠的、資料所承載的資訊是完全的等。
“資料的真實複雜性和演算法的簡單假設之間存在著巨大鴻溝,這使得經典智慧演算法在很多複雜任務上表現欠佳,亟待進一步的研究和探索。”會議執行主席之一、中國科學院院士梅巨集強調,大資料是人工智慧獲得成功的物質基礎,但目前主流的人工智慧演算法並未充分考慮大資料本身的複雜性。
從計算和通訊領域看,大資料與人工智慧技術在大規模工程化應用方面取得了長足進步。然而,大資料處理的技術進步主要體現在:以軟硬體垂直優化和體系重構的極端化方式來適應資料規模、傳輸頻寬和處理速度的提升,研究人員對大資料固有的非確定性和複雜性尚沒有深刻認識;與此同時,人工智慧技術也面臨魯棒性、可解釋性和複雜系統認知瓶頸等挑戰。
梅巨集進一步指出,當前資料智慧存在低效、不通用以及不透明三大問題。“現在的資料智慧就像工業革命前的‘蒸汽機原型’一樣,低效而昂貴;它只能針對不同應用定製不同模型,難以建立通用模型。”梅巨集說,更重要的是,當前並沒有對資料智慧形成深刻認識,只是知其然,而不知其所以然。
人機融合或可彌補資料自動推理弱點
在中國科學院自動化研究所研究員陶建華看來,雖然當前人工智慧在資料自動推理中依然面臨很多技術難點,但是人機融合的推理方式可以有效地彌補這些弱點。人機融合推理著重於研究一種由人和機器相互協作下的新的推理模式,包含“機器懂人”和“人懂機器”兩方面的含義。
對人的推理思維的理解是“機器懂人”的關鍵。其核心問題是如何構建能夠反映人推理過程的思維形式化計算方法。該方法將人的推理思維形式化描述、概率推理、構建知識圖譜,以及與現實場景的資訊進行有機融合,從而可以將人的推理過程有效的輸入到機器中,並與機器的推理網路進行結合。
此外,解決“人懂機器”問題將有助於人對機器智慧輔助增強。機器推理過程的可解釋性,對於構建人機融合的推理過程尤為關鍵。過程可解釋的機器推理方法提供了解決問題的新方法,適當的擴充套件流程,並最大限度地減少人為錯誤的機會,可以幫助人類和機器協同做出更為準確和迅速的推理與判斷。
微軟亞洲研究院副院長劉鐵巖結合他們的實際工作舉例道:“我們在深度強化學習的基礎上,利用‘完美教練’技術來處理資訊的不完全和不確定性,從而很好地解決了麻將這一複雜的博弈問題。我們的演算法在2019年3月登陸知名的競技麻將平臺,經過5000局的鏖戰,成功晉級十段,其穩定段位顯著超越人類頂級選手,成為首個超人麻將AI。”這是在處理資料不完全性和不確定性方面做出的有益嘗試。
劉鐵巖指出,大資料特性在不斷演化,且愈發複雜。新型智慧演算法需要針對資料特點有的放矢地解決問題,這樣才能填補資料與演算法間的鴻溝,使人工智慧綻放更多的價值。