本文5238字,建議閱讀8分鐘。
本文介紹一年一度的《AI研究排名2019年版》。
引言
我們一年一度的《AI研究排名2019年版》終於出爐了(想了解我們去年釋出的第一屆排名,請參閱此文
https://medium.com/@chuvpilo/whos-ahead-in-ai-research-insights-from-nips-most-prestigious-ai-conference-df2c361236f6)。這回我們分析了在兩大最負盛名的AI研究會議:神經資訊處理系統(NeurIPS或NIPS)和國際機器學習大會(ICML)上發表的研究成果。我們使用會議記錄(NeurIPS 2019和ICML 2019),逐一研究了2200篇被接受的論文,詳細列出了作者及所屬組織,最後計算出每家組織的出版指數(參閱下面的“方法”部分)。可以從相當於完整論文(full paper)的角度對出版指數有一個最直觀的認識:谷歌的出版指數167.3可以解讀為2019年穀歌在這兩大AI頂會上出版了167.3篇完整論文。我們先介紹有關研究方法的詳細資訊,然後介紹2019年AI研究排名,並顯示進一步的值得關注的描述性統計資料,最後探討誰在AI方面處於領先。
方法
我們出版指數所用的方法受到《自然指數》(Nature Index)的啟發:
為了收集一個國家、地區或機構對某論文的貢獻,並確保它們的計數不超過一次,《自然指數》使用分數式計量(FC),該計量值考慮了每篇論文的作者份額。每篇論文的總FC為1,這個1在所有作者之間平分,假設每個作者的貢獻同等。比如說一篇文章有10位作者,意味著每位作者獲得的FC為0.1。如果是屬於不止一家機構的作者,該作者的FC將在每個機構之間平均分配。對屬於某機構的各個作者的FC求總和,即可計算出該機構的總FC。對於國家/地區而言,計算方法相似,不過一些機構設有海外實驗室,這些實驗室將被計入所在國/地區的總分,因此情況來得複雜一點。
唯一的區別是,我們的出版指數將海外實驗室計入總部所在國/地區(而非所在國/地區)。這一點有爭議,不過我們認為這種方法更客觀地反映了智慧財產權的分配以及各自給總部而非給本地實驗室帶來的收益。
下面是計算出版指數的一個例項。如果某論文有五位作者,其中三位來自麻省理工學院(MIT)、一位來自牛津大學,另一位來自谷歌,每位作者將獲得1分的五分之一,即0.2分。因而單單就該論文而言,MIT的出版指數將提高3 * 0.2 =0.6分,牛津大學的出版指數將提高0.2分,谷歌的出版指數將提高0.2分。由於MIT位於美國,因此擁有MIT將使美國的出版指數增加0.6分。同樣,由於牛津大學位於英國,因此歐洲經濟區+瑞士該類別將增加0.2分。最後,谷歌是一家總部位於美國的跨國公司,因此美國的出版指數再增加0.2分,因此總分增加0.8分。如果某作者隸屬多家機構,我們將他/她的分數分配到每一家所屬機構。比如以上面為例,如果最後一位作者標註屬於兩家機構:谷歌和斯坦福大學(而不僅僅屬於谷歌),谷歌和斯坦福大學都會另外得到0.2 / 2=0.1分。
最後,我們認為將NeurIPS和ICML上出版的論文合併到同一個資料集很合理,原因是它們在頂尖AI研究人員當中都有相似的知名度、相似的機構參與度以及相似的論文接受率(NeurIPS的論文接受率為21.2%,ICML的論文接受率為22.6%)。
2019年AI研究排名
2019年AI研究方面處於領先的全球40大組織(工業和學術界)(附出版指數):
1.谷歌(美國)— 167.3
2.斯坦福大學(美國)— 82.3
3.麻省理工學院(美國)— 69.8
4.卡內基梅隆大學(美國)— 67.7
5.加州大學伯克利分校(美國)—54.0
6.微軟(美國)—51.9
7.牛津大學(英國)— 37.7
8. Facebook(美國)— 33.1
9.普林斯頓大學(美國)— 31.5
10.康奈爾大學(美國)— 30.9
11.佐治亞理工大學(美國)— 30.1
12.得克薩斯大學奧斯汀分校(美國)— 29.9
13.伊利諾伊大學(美國)— 29.4
14.哥倫比亞大學(美國)— 29.2
15.清華大學(中國)— 28.4
16.加州大學洛杉磯分校(美國)— 27.2
17.蘇黎世聯邦理工學院(瑞士)—27.0
18. IBM(美國)— 25.8
19.華盛頓大學(美國)—24.0
20.法國國家資訊與自動化研究所(法國)— 23.2
21.洛桑聯邦理工學院(瑞士)—22.3
22.北京大學(中國)— 21.6
23.多倫多大學(加拿大)—21.4
24.哈佛大學(美國)—19.2
25.杜克大學(美國)—18.7
26.紐約大學(美國)— 17.7
27.劍橋大學(英國)— 15.1
28.南韓科學技術院(南韓)— 14.8
29.以色列理工學院(以色列)— 14.6
30.加州大學聖迭戈分校(美國)— 14.6
31.威斯康星大學麥迪遜分校(美國)— 14.4
32.亞馬遜(美國)— 14.3
33.馬薩諸塞大學阿默斯特分校(美國)— 13.8
34.倫敦大學學院(英國)— 13.7
35.蒙特利爾學習演算法研究所(加拿大)— 13.5
36.南加州大學(美國)— 13.5
37.賓夕法尼亞大學(美國)— 13.3
38.首爾國立大學(南韓)-12.7
39.約翰•霍普金斯大學(美國)— 12.6
40.日本理化學研究所(日本)— 12.3
2019年AI研究方面處於領先的前20大地區(附出版指數):
1.美國— 1260.2
2.歐洲經濟區* +瑞士—431.5
3.中國—184.5
4.加拿大—80.3
5.日本—49.4
6.南韓—46.8
7.以色列—43.3
8.澳洲—27.0
9.印度—17.1
10.新加坡—13.2
11.俄羅斯—10.6
12.臺灣—5.3
13.沙烏地阿拉伯—5.0
14.阿拉伯聯合大公國—2.3
15.伊朗—2.2
16.南非—1.0
17.智利—1.0
18.馬來西亞—0.7
19.土耳其—0.6
20.紐西蘭—0.5
*屬於歐洲經濟區(EEA)的國家包括:奧地利、比利時、保加利亞、克羅埃西亞、塞普勒斯共和國、捷克共和國、丹麥、愛沙尼亞、芬蘭、法國、德國、希臘、匈牙利、愛爾蘭、義大利、拉脫維亞、立陶宛、盧森堡、馬耳他、荷蘭、波蘭、葡萄牙、羅馬尼亞、斯洛伐克、斯洛維尼亞、西班牙、瑞典、英國、冰島、列支敦斯登和挪威。
2019年AI研究方面處於領先的20大國家(附出版指數):
1.美國— 1260.2
2.中國—184.5
3.英國—126.1
4.法國— 94.3
5.加拿大—80.3
6.德國— 64.5
7.瑞士— 59.3
8.日本—49.4
9.南韓—46.8
10.以色列-—3.3
11.澳洲—27.0
12.印度—17.1
13.荷蘭—15.3
14.新加坡—13.2
15.丹麥—12.2
16.義大利—11.5
17.瑞典—11.3
18.俄羅斯—10.6
19.芬蘭—9.6
20.奧地利—7.4
2019年AI研究方面處於領先的前20所美國大學(附出版指數):
1.斯坦福大學—82.3
2.麻省理工學院—69.8
3.卡內基梅隆大學—67.7
4.加州大學伯克利分校—54.0
5.普林斯頓大學—31.5
6.康奈爾大學—30.9
7.佐治亞理工學院—30.1
8.得克薩斯大學奧斯汀分校—29.9
9.伊利諾伊大學—29.4
10.哥倫比亞大學—29.2
11.加州大學洛杉磯分校—27.2
12.華盛頓大學—24
13.哈佛大學—19.2
14.杜克大學—18.7
15.紐約大學—17.7
16.加州大學聖迭戈分校—14.6
17.威斯康星大學麥迪遜分校—14.4
18.馬薩諸塞大學阿默斯特分校—13.8
19.南加州大學—13.5
20.賓夕法尼亞大學—13.3
2019年AI研究方面處於領先的全球前20所大學(附出版指數):
1.斯坦福大學(美國)— 82.3
2.麻省理工學院(美國)— 69.8
3.卡內基梅隆大學(美國)— 67.7
4.加州大學伯克利分校(美國)—54.0
5.牛津大學(英國)— 37.7
6.普林斯頓大學(美國)— 31.5
7.康奈爾大學(美國)— 30.9
8.佐治亞理工學院(美國)— 30.1
9.得克薩斯大學奧斯汀分校(美國)— 29.9
10.伊利諾伊大學(美國)— 29.4
11.哥倫比亞大學(美國)— 29.2
12.清華大學(中國)—28.4
13.加州大學洛杉磯分校(美國)— 27.2
14.蘇黎世聯邦理工學院(瑞士)—27.0
15.華盛頓大學(美國)—24.0
16.法國國家資訊與自動化研究所(法國)— 23.2
17.洛桑聯邦理工學院(瑞士)—22.3
18.北京大學(中國)— 21.6
19.多倫多大學(加拿大)—21.4
20.哈佛大學(美國)—19.2
2019年AI研究方面處於領先的前20家公司(附出版指數):
1.谷歌(美國)— 167.3
2.微軟(美國)— 51.9
3. Facebook(美國)— 33.1
4. IBM(美國)— 25.8
5.亞馬遜(美國)— 14.3
6.騰訊(中國)— 8.8
7.阿里巴巴(中國)-7.5
8.博世(德國)— 7.2
9.優步(美國)— 7.1
10.英特爾(美國)— 6.9
11.豐田(日本)-6.0
12. Yandex(俄羅斯)— 5.8
13.百度(中國)— 5.5
14. 英偉達(美國)— 5.2
15.蘋果(美國)—4.6
16. Salesforce(美國)— 4.2
17. PROWLER.io(英國)— 4.2
18. Criteo(法國)—3.9
19.華為(中國)— 3.7
20. NEC(日本)—3.5
進一步分析
學術界vs工業界-總出版指數中所佔的份額:
學術界:77.8%工業界:22.2%NeurIPS 2019和ICML 2019上2200個論文標題中排名前150個的單詞:
人均出版指數排在前30位的國家或地區(出版指數除以國家人口「百萬人」)
1.瑞士—6.97
2.以色列—4.88
3.美國—3.85
4.新加坡—2.34
5.加拿大—2.17
6.丹麥—2.11
7.英國—1.90
8.芬蘭—1.75
9.法國—1.41
10.瑞典—1.11
11.澳洲—1.08
12.南韓—0.91
13.荷蘭—0.89
14.奧地利—0.84
15.德國—0.78
16.拉脫維亞—0.67
17.比利時—0.44
18.愛沙尼亞—0.44
19.日本—0.39
20.挪威—0.32
21.塞普勒斯—0.28
22.阿拉伯聯合大公國—0.26
23.臺灣—0.22
24.愛爾蘭—0.21
25.義大利—0.19
26.沙烏地阿拉伯—0.15
27.希臘— 0.14
28.中國—0.13
29.捷克共和國—0.11
30.紐西蘭—0.11
顯示AI研究領域排名全球前40位的組織的樹狀圖(面積與出版指數成比例):
排名前40位的這些組織共佔總出版指數的55%,在總共2200篇論文中佔到1212.3篇。
衡量AI研究方面的競爭(赫芬達爾指數):
赫芬達爾指數(又叫赫芬達爾–赫希曼指數)是衡量參與者數量相對行業的指標,也是表明參與者當中競爭程度的指標。
算式:
赫芬達爾指數算式:si是市場份額(百分比用作整數,用75而不是0.75表示),N是參與者數量。
解釋:
•H低於100表示?6?7?6?7行業競爭激烈。
•H低於1500表示行業不集中。
•H在1500至2500之間表示行業中度集中。
•H高於2500表示行業高度集中。
至於我們的資料集(使用每家組織在總出版指數中的份額):H = 146.47,表示行業不集中。換句話說,沒有跡象表明2019年AI研究有壟斷現象。
關於中美競相稱霸AI的戰略性競賽現狀,今天正在上演一場激烈的辯論。我們傾向於站在更全面的角度來看待,不過開始分析之前,先回顧一下歷史:
2016年,AI領域發生了兩件大事:3月,谷歌的AlphaGo成為第一個擊敗9段圍棋職業高手李世石的計算機程式。10月,奧巴馬總統政府釋出了有關AI未來方向和考慮因素的戰略:《為AI的未來做準備》。這兩件大事在中國營造了“人造地球衛星時刻”,這有助於說服中國政府優先考慮並大幅增加對AI的投入。作為迴應,2017年7月,中國政府定於2030年之前實現雄心勃勃的AI目標:中國力爭到2020年成為AI經濟體的一線國家,到2025年實現重大的新突破,到2030年成為AI的全球領導者。該戰略就是著名的《新一代AI發展計劃》,該戰略刺激了許多政策,並刺激政府部門、地方政府和私營公司往研發方面投入數十億美元。CNAS之類的某些智庫認為,中國的AI戰略反映了奧巴馬政府報告中的關鍵原則——?6?7?6?7現在採納這些原則的是中國,而不是美國。這種仿效策略並不陌生:用Peter Thiel的《從0到1》中的話來說“中國一直在直接仿效發達國家工作成功的所有東西:19世紀的鐵路、20世紀的空調,甚至整座城市。他們可能會跳過幾個步驟,比如不安裝固定電話而直接採用無線,但他們依然在仿效。”2017年恰好是我們開始跟蹤分析AI研究現狀的一年,於是我們確立了中國的基準,下表顯示美國在總出版指數方面比中國領先11倍:2017年AI十大領先國家:美國比中國領先11倍
2019年,美國領先7倍(美國是1260.2,中國是184.5),因此差距顯然在縮小。此外,艾倫AI研究所的分析(https://medium.com/ai2-blog/china-to-overtake-us-in-ai-research-8b6b1fe30595)發現,中國在引用率最高的10%論文中的作者份額穩步上升:2018年,中國的份額為26.5%,緊隨美國的29%。有人可能會說,在未來十年,美國在AI方面的競爭力面臨不利。然而我們認為,結果將取決於現代AI的三大要素(演算法、硬體和訓練資料)取得的進展之間的相互影響,做好這三大要素才能稱霸這個領域。
我們認為,未來幾年美國在AI演算法方面會有強大的領先地位,這離不開幾十年來MIT、斯坦福大學、卡內基梅隆大學和加州大學伯克利分校等世界一流大學在電腦科學發展方面取得的成績。此外,谷歌和Facebook等公司在AI會議上樂意公開發表內部研究成果,這提供了不斷壯大的生態系統和某種交流機會,以便頂級AI研究人員在學術界和工業界之間從容轉換角色(比如Yann LeCun或吳恩達)。
此外,美國是矽谷的大本營,自從叛逆的八人幫離開肖克利半導體實驗室於1957年成立快捷半導體以來,矽谷就一直處於硬體創新的最前沿。深度學習演算法極其耗費計算資源,挖掘比特幣的耗電量比瑞士全國耗電量還大。我們認為,在今後十年,中國要想在硬體方面趕上美國極其困難。
然而,訓練資料是美國佔優勢值得懷疑的方面,這是有意為之。實際上,這是更廣泛的隱私與公共利益之爭的一部分,美國傾向於選擇隱私,而中國傾向於選擇公共利益。現在在中國,AI掃描數億隻街道攝像頭拍下的人臉、讀取數十億條微信訊息,並分析數百萬條健康記錄,這一切都以資料是為了公共利益為由。這種隨處可得的訓練資料加上全國14億人口,為中國創造了巨大的戰略優勢。
雖然很難得出結論,但我們仍認為前兩個因素(演算法和硬體)將壓倒後一個因素(資料的可用性),未來幾年美國會保持其在AI領域的領先地位。
—完—
-
1 #
-
2 #
強七倍,美國理應高枕無憂,為何舉國打壓幾個不足掛齒的中國科技公司?
-
3 #
雖然中國基礎研究不如美國,但AI的應用與推廣,中國將遙遙領先!因為中國的體制有助於AI的成長。
-
4 #
資料可能側重點不同,會有不同結果。希望大家理性看待。有人藉此就能激動起來狂黑中國科技發展,我也是難以理解。中國建國以來不過七十年,要走人家工業革命以來的300年多年的路程,而且缺人缺錢缺技術,能走到現在實屬不易。有些人心態不對,非要中國什麼都世界第一,不是第一就心態崩潰,罵國家罵人民罵科學家,擠兌中國自己,戰鬥力還頗強,不許反駁,反駁就開罵。這是精神病,從極端的自大到極端的自卑,分裂人格。
-
5 #
搞不清那句真話,一會中國威脅論,一會又差七倍
-
6 #
根本的差距是對人才的吸引力……
-
7 #
多看看國家的進步,面對西方國家的技術壁壘,中國取得目前的成果確實不易
-
8 #
沒有好的科技體制很難超越,很多方面確認一直在模仿,原創有嗎?
-
9 #
我來告訴你吧,這個資料根本反應不出真實的AI實力,看看你的論文來源雖然是國際上享有盛名的研究會議,但是基本都是美國在把持的,你在人家的地盤上跟人家比誰的家當多,逗我呢吧?! 釋出這個的目的是,給不明真相的人造成一種美國AI領先中國很多的錯覺,形成輿論效應,讓更多這方面人才往美國走而已。
-
10 #
同一起跑線,中國又落後了!
-
11 #
沒事,組織全體開會研究研究
-
12 #
資料控看到這樣的報道最爽
-
13 #
科技是第一生產力,美國資本家底厚著呢
-
14 #
我特別感受並認同對爭議的處理方法,實事求是的使用分數式計量(FC)賦予分值,以下是摘自原文:“唯一的區別是,我們的出版指數將海外實驗室計入總部所在國/地區(而非所在國/地區)。這一點有爭議,不過我們認為這種方法更客觀地反映了智慧財產權的分配以及各自給總部而非給本地實驗室帶來的收益。”。
-
15 #
從基礎層面看,美國人工智慧領先;從應用層來看,中國領先。
-
16 #
美國Al大多都在實驗室
-
17 #
文章本身表現出美國的不自信,高科技是需要資金來支撐,網際網路中國要支付美國一萬億,積體電路採購也有四千億,未來幾年中國可以不支付這些錢而用來發展自己的高科技,鹿死誰手,不言而喻
落後不可怕,可怕的是不思進取或說風涼話。