自從在1956年的達特茅斯會議上人工智慧一詞首次被提出後,經過了六十多年的發展,人工智慧已經成為了一門廣泛的交叉和前沿科學。在2020年,由於疫情的影響,大量工作被迫在線上進行,因此與網際網路相關的學科和產業都得到了快速的推動和發展,新一代人工智慧技術的蓬勃發展,在社會生產與生活方面都帶來了深刻的變革。本文就人工智慧相關領域,將對過去的研究熱點和2020年的新研究技術做一個回顧總結,並對之後的發展趨勢做一個預測。
研究熱點
近日,清華大學人工智慧研究院釋出了《人工智慧發展報告2020》,這份報告所使用的資料基於由清華大學唐傑教授團隊自主研發的 “科技情報大資料探勘與服務平臺”(簡稱 AMiner),作者對最近十年間人工智慧領域的各種頂級會議和期刊所收錄的全部論文和專利進行分析統計,結合了知識圖譜、自然語言處理、視覺化和文獻計量等技術手段展現了人工智慧領域近年來的科研熱點和成果產出。
在這份報告中,評選出了過去十年間最熱門的十大AI研究熱點,分別為深度神經網路、特徵抽取、影象分類、目標檢測、語義分割、表示學習、生成對抗網路、語義網路、協同過濾和機器翻譯,其中深度神經網路以98.16的分數高居榜首。
排名 |
AI 熱點名稱 |
主題論文量 |
主題論文引用量 |
頂會頂刊高引前10出現次數 |
AMiner 指數 |
1 |
深度神經網路 |
5405 |
299729 |
125 |
98.16 |
2 |
特徵抽取 |
1747 |
95205 |
8 |
21.51 |
3 |
影象分類 |
612 |
50309 |
16 |
14.14 |
4 |
目標檢測 | 472 |
49602 |
13 |
12.73 |
5 |
語義分割 |
275 |
27893 |
23 |
12.01 |
6 |
表示學習 |
711 |
49892 |
8 |
11.88 |
7 |
生成對抗網路 |
362 |
24536 |
22 |
11.44 |
8 |
語義網路 |
1192 |
44897 |
2 |
10.60 |
9 |
協同過濾 |
289 |
36681 |
12 |
9.98 |
10 |
機器翻譯 |
389 |
23119 |
14 |
8.84 |
表1 AMiner 評選出的近十年十大AI研究熱點
在這十大研究熱點中,不管是論文發表數量,被引用次數還是在高引前10出現的次數,深度神經網路都遙遙領先。深度神經網路(Deep Neural Network)是機器學習領域中的一種技術,也是深度學習的基礎。它也稱多層感知機,可以理解為在輸入層和輸出層之間具有多個隱藏層的神經網路。在這一領域中,包括了目前經常用到的卷積神經網路,迴圈神經網路等。在目前的日常生活中,人臉識別、音影片識別、自動翻譯和無人駕駛等各個領域都需要深度神經網路作為基礎,同時它也是後面幾個研究熱點的重要基礎。
排名第二的特徵提取是從初始的一組測量資料開始,然後建立提供資訊和非冗餘的特徵,目前已經廣泛應用於機器學習和影象處理等領域中。影象分類是指根據各自在影象中所反映的不同特徵,來把不同類別的目標區分開來的影象處理方法,目前許多的深度學習模型的識別能力已經超過人類,可以完全代替人的視覺判讀,它也是人臉識別和無人駕駛等領域的重要研究內容。
熱點技術
北京智源人工智慧研究院從2020年全球的人工智慧領域研究成果中評選出了一份年度成就名單,並且詳細列舉了2020年AI的熱點技術,而參與評選的評委均是來自計算機科學下各個領域的頂尖學者。
這份名單總共包含十項熱點技術,涵括了國內外的最新研究成果:
1、OpenAI釋出全球規模最大的預訓練語言模型GPT-3。該模型具有1750億個引數,是距今為止規模最大的預訓練語言模型。該模型是根據多個NLP基準進行評估的,匹配了“已關閉”問題解答任務的最新效能,無需微調就可以很好地勝任各種任務。圖1 預訓練語言模型GPT-3
2、DeepMind的AlphaFold2破解蛋白質結構預測難題。2020年11月30日,Google旗下的DeepMind團隊所研究和設計AlphaFold2的在第14屆國際蛋白質結構預測競賽以接近90分的高分取得了冠軍,並且《自然》、《麻省理工技術評論》等媒體稱其為“巨大進步”、“解決了五十年來生物學的大挑戰”。從標準來看,AlphaFold2目前的預測結果已經非常接近於實驗所確定的蛋白質結構,這為後續的疾病預防、治療等帶來巨大的操作空間。圖2 AlphaFold2系統示意圖
3、深度勢能分子動力學研究獲得戈登·貝爾獎。在11月19日美國亞特蘭大舉行的國際超級計算大會SC20上,北京應用物理與計算數學研究院王涵所在的 “深度勢能” 團隊所研究的 “分子動力學”,將第一性原理精度分子動力學模擬規模擴充套件到1億原子,同時計算效率相比此前人類最好水平提升1000倍以上,極大地提升了人類使用計算機模擬客觀物理世界的能力,為以後的化學、力學、材料學等領域的研究提供了巨大的支援。圖3 深度勢能分子動力學架構圖
4、DeepMind等用深度神經網路求解薛定諤方程促進量子化學發展。薛定諤方程作為量子力學的基本方程之一,求解薛定諤方程可以為化學反應提供線索,即知道化學反應的結果。來自DeepMind的研究者引入了一種全新的深度學習架構——費米子神經網路(Fermionic neural networks),相比於之前被廣泛視為量子化學的黃金標準的耦合聚類方法,這種新方法得到的準確度顯著更高,並且使用的資料也更少。圖4 FermiNet全域性架構圖
5、美國貝勒醫學院透過動態顱內電刺激實現高效率“視皮層列印”。2020年5月,美國貝勒醫學院研究者利用動態顱內電刺激新技術,成功讓盲人 “看見” 了這些W,S,Z這些簡單的字母。結合其它領域的發展,下一代視覺技術有可能可以更加精準地刺激大腦初級視覺皮層的每一個神經元,幫助盲人處理更加複雜的視覺資訊,使其重見“光明”。圖5 視皮層列印技術
6、清華大學首次提出類腦計算完備性概念及計算系統層次結構。2020年10月,在最新一期《自然》雜誌上,出現了一項類腦計算體系結構的突破性進展。該技術由清華大學科研團隊提出,他們提出了一個名為“類腦計算完備”的新概念,它放寬了對硬體完整性的要求,並提出了相應的系統層次結構,其中包括圖靈完備的軟體抽象模型和通用的抽象神經形態架構。這一體系可以確保程式語言的可移植性、硬體完整性和編譯可行性。《自然》雜誌審稿人認為這一研究將被證明是神經形態計算領域以及面向人工智慧研究的重大發展。圖6 “類腦計算完備”的系統層次結構
7、北京大學首次實現基於相變儲存器的神經網路高速訓練系統。北京大學楊玉超團隊提出並實現了一種基於相變儲存器電導隨機性的神經網路高速訓練系統,該系統在誤差直接回傳演算法的基礎上進行改進,為人工神經網路在終端平臺上的應用及片上訓練的實現提供了新的方向。圖7 基於相變儲存器的神經網路高速訓練系統
8、MIT僅用19個類腦神經元實現控制自動駕駛汽車。自動駕駛汽車是當前機器學習研究者和工程師們正在探索的最複雜的任務之一,它涉及了不同領域的方方面面。MIT的研究者受線蟲等小型動物大腦的啟發,僅用數十個神經元即可控制自動駕駛,比之前減少了數萬倍的神經元數。該方法將人工智慧和生物神經系統結合起來,為後續的研究帶來了新的角度。圖8 架構的端到端表示
9、Google與FaceBook團隊分別提出全新無監督表徵學習演算法。2020年年初,Google與Facebook分別提出SimCLR與MoCo兩個演算法,大幅度提升了自監督學習效能,它們都表明了無監督學習模型可以接近甚至達到有監督模型的效果。圖9 SimCLR演算法的網路結構
10、康奈爾大學提出無偏公平排序模型可緩解檢索排名的馬太效應問題。排序是匹配使用者和內容的主要手段,而目前的排序演算法存在對使用者和內容雙方不公平的問題。因此Thorsten Joachims 教授的團隊提出了一種兼顧公平性、穩定性和實用性的FairCo 演算法。該演算法透過構建公平性的無偏統計量,控制曝光公平性以及實際排序的質量,並隨著資料的變化而自適應地動態調整。以上十大技術即是國內眾多頂尖學者所評選出的2020年年度技術,它們分別代表了人工智慧領域下各個子領域的最新研究成果,並且為後續的研究提供了新的研究角度和技術支援。
趨勢預測
在疫情爆發之前,人工智慧已經進入到生活的各個方面,在各個傳統學科都應用到了人工智慧。而疫情的爆發對線下產業造成了巨大的衝擊,但它並沒有對人工智慧的發展造成影響,反而還間接促進了它的快速發展。
在當下的這場疫情中,病毒相關資料的收集和分析是各個國家都在做的重要事情,相關文獻更是大量被髮表出來。因此結合這場疫情來看,更加智慧的大資料分析是各個國家和地區都迫切需要的,當這些龐大的資料被準備處理,我們將更容易地控制疫情的爆發。
2021年1月18日,曠視人工智慧治理研究院和人民智庫聯合釋出了《2020年度全球十大人工智慧治理事件》,回顧並分析了過去一年中最具理論價值、實踐價值、新聞價值、以及研究價值的人工智慧大事。其中多個事件都與隱私保護相關,因此機器學習向分散式隱私保護方向演進將是未來一段時間的重要趨勢,並且目前多個國家已經出臺相關資料保護法規,透過嚴格的法規來限制機構之間隱私資料的互動。
同時人工智慧演算法是推薦系統和搜尋引擎等系統的核心技術,而因果學習能夠獲取資訊檢索中各個變數的因果關係,使得推薦系統和搜尋引擎更加精確符合使用者需求,因此基於因果學習的資訊檢索模型與系統也將成為未來重要的發展方向。