首頁>科學>

2020年11月20日,由中國科學技術協會主辦,中國國際科技交流中心、中國人工智慧學會、新加坡通商中國承辦的“中新數字經濟與人工智慧高峰論壇”雲端召開。主題報告環節,中國科學技術大學機器人實驗室主任陳小平教授為我們帶來了《從封閉性到非封閉性:2020到2035年智慧機器的機遇和挑戰》的精彩演講。​

陳小平

中國科學技術大學機器人實驗室主任、教授

以下是陳小平教授的演講實錄:

非常高興有這個機會進行中、新學術交流。本報告包括四方面內容。第一,關於人工智慧(簡稱AI)的兩種型別,一種是Thinking machines;另一種是Intelligent machinery。它們之間有比較大的區別,智慧機器人屬於後者。第二,用人工智慧的觀點來看機器人領域,我們認為核心挑戰是降射,英文是grounding,但是我對“降射”給出了不同於文獻中的其他定義。第三,在這樣一種挑戰下,現有人工智慧技術有沒有可能大規模產業應用?這是有爭論的。有人認為是不能應用的;我們的觀察是:在滿足封閉性條件的場景中,現有人工智慧技術已經可以大規模應用了。第四,封閉性要求是比較強的,有些應用很難滿足封閉性要求,所以存在另一個挑戰:如何超越封閉性?我會和大家分享中科大機器人團隊在過去10 年中為超越封閉性所做過的一些嘗試,主要有開放知識和融差性原理這兩方面的研究。

關於兩類人工智慧,這個觀點是圖靈提出來的。圖靈在1950年的文章中提出圖靈測試,這是非常重要的。可是在1948年圖靈還有一篇文章,我覺得更加重要,這篇論文始終沒有正式發表。這篇手稿的標題就叫做Intelligent machinery(智慧機器)。圖靈提出,智慧機器就是“用機器替代人的每一個部分”,而且舉了具體的例子——無人駕駛汽車。所以無人駕駛汽車是圖靈設想過的。但是他分析後認為,在當時的技術條件下,是沒辦法研究Intelligent machinery 的,所以提議先研究沒有感知和行動能力的thinking machines( 思維機器)。圖靈測試就是針對Thinking machines 的,他還建議了一些具體的研究課題,包括圍棋、語言學習、機器翻譯等。所以,實際上圖靈考慮了兩類人工智慧——思維機器和智慧機器。

我把兩類AI 的根本區別總結在圖1裡。事實上,人工智慧涉及三層空間——現實層、資料層和知識層。如果只考慮上面兩層,即資料層和知識層,這就是思維機器;如果同時考慮全部三層,就是智慧機器。它們之間最重要的差別是:智慧機器要涉及感知和行動,而思維機器則不涉及感知和行動,至少不涉及行動。機器人自然屬於智慧機器,要同時涉及三層空間。

在過去的六七十年時間裡,人工智慧有三次浪潮。我們回顧一下,主流的研究有兩大類,一類是訓練法,包括深度學習;還有一類是強力法,包括推理和知識系統。強力法是第一、二次浪潮的主力,現在關注的人較少,但強力法並沒有消失,只不過換了一個賽道,我稱之為“大知識”,國際上流行的術語是Knowledge technologies。

2017年AlphaGo Zero 獲勝,我認為這標誌著第三次浪潮的結束和第四次浪潮的開始。我們是這樣看待當前和未來人工智慧發展態勢的。

關於第四次浪潮,其他的學者也有類似的看法,比如深度學習團隊,從2017年開始就在多次演講中提到他們的深度學習2.0計劃。在2020年8月29日中國人工智慧大會的特邀報告中,Y.Bengio 教授給出了一個更加完整的DL2.0方案。值得注意的是,該方案中他們計劃研究的目標功能,居然都屬於強力法!與強力法途徑不同的是,他們想用深度學習來實現這些功能。

強力法有模型、推理機/ 搜尋演算法和最佳化三個主要成分,其中模型是關鍵。對於思維機器來說,模型就是知識庫,儲存的是抽象知識;對於智慧機器來說,模型包含知識庫和模型降射兩部分,其中模型降射是知識庫到現實世界的對應。

圖2中有一個推理機(推理程式),還有知識庫+ 降射。假設想讓機器人在就餐過程中幫助我們,就需要編寫一個知識庫,描述就餐的相關知識,比如“餐具可以盛食物”“米飯是食物”等。寫了這些知識之後,就可以向推理機提問,比如:“碗能不能盛米飯”?這個問題在知識庫裡是沒有描述的,但經過推理, 強力法AI 會回答yes。再問“碗能不能盛湯?”推理機回答yes,問“碗能盛什麼?”回答“能盛米飯、湯……”。一般而言,凡是知識庫在邏輯上隱含的所有碗能盛的東西,推理機都能找出來,所以編寫知識庫不需要寫出全部知識;還可以向推理機提問更復雜的問題。上述這些都是思維機器研究的內容,可以不涉及降射。

對於智慧機器人來說,只有知識庫不夠,還必須考慮降射。知識庫裡的每一個符號所代表的現實世界中的物件,都要透過降射對應起來。比如,知識庫中的符號bowl 代表現實世界中的碗,這個對應就要透過降射來實現,否則機器人只知道一個空洞的符號bowl,卻在現實世界中找不到碗,於是也就無法完成使用者交給它的相關任務(比如“盛飯”“盛湯”等)。表面上看,這件事情很簡單,其實包含著很大的難題。比如有一個碗,看起來像盤子,但其實是宋代的汝窯碗,所以也是碗,也要在降射裡把它和bowl 對應起來,這樣機器人才能夠找到這隻碗。

更有挑戰性的是下面這個例子:破碗是不是碗?通常認為,破碗也是碗,於是我們在降射中把破碗也和bowl 對應起來。這麼做的結果是什麼?剛才看到了,推理機推出的一個結論是:碗能盛湯,而且這個推理和降射無關,所以現在推理機仍然會推出“碗能盛湯”,但現在碗實際上是包含破碗的,所以機器人可以用破碗盛湯,這顯然是錯誤的!由此可見,不適當的降射可導致知識庫出大問題,因此破碗不能在降射中與bowl對應,這樣破碗就變成一個未知變元。一般情況下,AI 設計者能不能預先想到所有未知變元?這就是著名的“知不知”(How to know unknown)問題,是一個非常難的問題。

再看訓練法。在一個影象分類比賽中,一個神經網路只要用帶標註的資料訓練好了,能以很高的準確率識別1000類物件,其中一類是衛生紙。下面我們問:髒的衛生紙是不是衛生紙?如果衛生紙是拿來用的,而不是僅僅要求分類,那麼髒的衛生紙就要和衛生紙區別開,這就意味著:被分類的物件不是預先設計好的1000類,而是1001類。這是降射問題在訓練法中一種表現,我們在訓練法中同樣遇到了“知不知”問題:能不能提前想到所有未知變元?如果想不到,如何收集相關的資料,訓練出合適的神經網路?所以,訓練法(包括深度學習)並沒有給出降射問題的解決方案,同樣面臨著降射挑戰。

一般地說,降射挑戰背後的原因是場景變異無盡性:人們通常只想到典型場景和一部分非典型場景,其他沒想到的可能場景到底有多少、有哪些,是不知道的。而這些無法提前想到的場景往往與想到的場景有所不同,即出現某種“變異”,而變異場景往往包含著未知變元(如破碗或髒衛生紙),它們的出現可導致已經建好的AI 模型(知識庫和神經網路)失靈。

由此我們得到一個一般性的觀察:在正常情況下,任何AI model,無論是強力法還是訓練法的模型,都會丟失一些變元。由於目前強力法和訓練法都不能有效處理未知變元或丟失變元,所以都無法勝任存在場景變異無盡性的應用。這是目前人工智慧遇到的一個根本性挑戰。

面對這個挑戰,現有人工智慧技術是不是就無能為力了?也不是,有一個簡單的辦法——封閉性準則:把典型場景和一部分非典型場景選出來,把它們封閉化,而其他場景都被排除,可以不考慮。這裡的“不考慮”不是簡單的忽略,而是透過採取具體措施,保證不考慮的場景即使出現了,也不會產生致命的後果,不會影響應用。這套方案叫做封閉性準則。

我發現,阿爾法狗也是符合封閉性準則的。我把第四代阿爾法狗的工作原理總結成一張圖,說明它在圍棋博弈樹上下棋的原理。圍棋棋盤有361個落子,另外還有一個特殊的落子pass,所以黑棋的第一步棋總共有362 個落子,第四代阿爾法狗直接選其中勝率估計最大的那個落子。白棋的第一步棋也是類似的,但是少一個選項,只有361個落子可選。如果是第四代阿爾法狗走棋,它也是選擇勝率估計最高的那個落子走。之後黑棋和白棋的決策原理是一樣的,總是選擇當前可選落子中勝率估計最高的那個落子走。

由於圍棋博弈樹上總共有大約10300種不同的棋,太多了,落子的勝率估計沒辦法實際計算出來。第四代阿爾法狗用蒙特卡洛樹搜尋,自己和自己下了2900萬局棋(自博),從這些自博資料中反推出了所有落子的勝率估計,儲存在一個深層殘差網路中。之後,它下棋就是按勝率估計的進行決策,根本不考慮不同的對手的下棋策略有什麼不同。實驗結果是,四代以100比0戰勝了三代,而三代戰勝了所有人類圍棋高手。阿法狗四代沒有和人下過,因為它的博弈水平遠遠超過了人類。

阿爾法狗第四代有哪些核心技術?他們2017年的論文裡說得非常清楚,只有四項核心技術,其中前兩項是強力法,後兩項是訓練法,而且有一個重大創新,就是簡化的決策論規劃模型。為什麼簡化模型可以成為重大創新?論文裡沒有說,我幫它說清楚了,這個重大創新就是遵守了我提出的封閉性準則。

封閉性準則對強力法有三個條件,對訓練法也有三個條件,我發現阿爾法狗四代都是符合的。

阿法狗的成功及它之前的相關研究表明:雖然強力法、訓練法和它們的結合都解決不了圍棋問題,但是把圍棋問題封閉化之後,用強力法和訓練法的結合就可以戰勝人類,並遠超人類。這是人工智慧第三次浪潮取得的重大突破,是人工智慧發展史上的一個新的里程碑。

在《智慧系統學報》2020年1期的文章中,我提出現有人工智慧技術的一個可行應用模式:將應用場景封閉化,根據需要應用強力法、訓練法以及它們的結合。這個模式是我從過去5 年的產業調研中發現的,適用於這個模式的場景非常多。這個模式中的封閉化包含完全封閉化、半封閉化和柔性化,需要企業研發人員根據應用的實際情況展開,所以他們是未來15年人工智慧產業落地的主力軍。

最後簡單提一下超越封閉性的問題,過去10年裡,中科大機器人團隊做過一些嘗試。這張圖裡是我們的“可佳機器人”,它的預期目標是在家庭環境中當機器人保姆。我們使用了強力法和訓練法,但仍然有一些問題不能解決,所以提出了“開放知識”和“融差性”原理。應用這兩種辦法,可以讓可佳機器人在非封閉性場景中更好工作,比如完全自主地操作微波爐加熱食品。最初版本在2010年就實現了基本功能,但環境一旦發生改變,機器人可能就無法正常完成任務。去年我們得到一個改進版,人可以給機器人搗亂,破壞機器人工作的條件,這是體現環境變化的一種方式,在實際應用中也經常發生。在這種情況下,可佳機器人依然可以正常完成任務。我們還研製了一種柔性手爪,它不需要獲得準確的資訊,就能抓很多不同形狀、大小和硬度的東西,比如能“一視同仁”地抓木塊和豆腐。其中的主要原理就是融差性。還有情感互動機器人“佳佳”,也是在非封閉性條件下工作的。現在的一項主要研究是要識別非關鍵詞意圖,這種使用者意圖是用關鍵詞無法表達的。

最後對未來15年做一個展望。首先是大規模產業應用,根據封閉性準則,只要對應用場景做封閉化,現有人工智慧技術就能成功應用。所以,大批企業無需等待更強大的人工智慧技術的出現,就能實現很多行業和產業部門的轉型升級。

第二點展望。在未來15年中,人工智慧的發展模式會發生一個重要的轉變,過去完全是基礎研究驅動的,而未來15年中大規模產業應用將成為主要驅動力,而且中低端產業是驅動力的主要來源,因為中低端產業是和使用者的需求直接掛鉤的,是最能反映使用者需求的改變。同時,基礎研究將在AI 的更深層次展開探索,從而為2035年之後的產業應用奠定基礎。

第三點展望是關於人工智慧倫理的,這也是當前的一個重大課題,同時也是未來戰略競爭的一個新維度。過去的競爭是產業競爭,後來變成產業+ 科技,現在正變成產業+ 科技+ 倫理。

11
最新評論
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 走進石墨烯小世界之石墨烯氣凝膠