首頁>科技>

2019 年6月, 國際著名人工智慧天使投資人 Ian Hogarth與 Nathan Benaich 合著釋出《 2019年人工智慧全景報告》 。報告從研究、人才、行業、政治等方面,總結了過去一年人工智慧相關研究和技術進步、人才發展趨勢、產業格局變化和各國政策動向,並對未來一年進行了預測。同時,報告詳細分析了中國人工智慧技術在日常消費、農業、機器人和半導體等領域的進展。報告認為,人工智慧將成為全球科技進步的加速器,為駕馭如此巨大的轉型,必須全面深入地了解人工智慧各方面。

一、 研究與技術突破

(一)強化學習開闢新天地

1、 強化學習在遊戲領域表現卓越DeepMind公司使用多智慧體訓練演算法完成的 AlphaStar 系統可以綜合各種最為有效的策略組合並建立一個相互競爭的智慧體聯盟,來共同探索巨大的策略空間。AlphaStar 在《星際爭霸》等策略類遊戲中表現突出。另外, 人工智慧模型 OpenAI Five的智慧程度進一步得到提升,與2018年8月份版本的 OpenAI Five相比, 2019 年 4 月份版本的 OpenAI Five 的訓練計算量增加了8倍,在《魔獸爭霸 2》和《雷神之錘 III 競技場奪旗》等遊戲中紛紛戰勝人類。

2、 智慧機器人訓練過程更加註重與真實環境互動強化學習模型的“ 驅動式學習”概念被提出,即通過“ 觀摩遊戲” 的策略訓練一臺機器人同時執行多項複雜任務, 對於每項任務無需進行單獨的針對性訓練。在該策略中,訓練人員可以遠端操控智慧機器人,使之用各種方式與外界環境進行互動,從多個維度對智慧機器人在真實環境中進行訓練,與針對單一任務訓練相比訓練效率和訓練效果均得到提升。在基於驅動式的訓練中,智慧機器人不僅能學習儘可能多樣化的技能,並使每項技能均對擾動具有魯棒性。例如, 加州大學伯克利分校的機器人學習實驗對 BLUE 機械臂進行了實際環境中的訓練,使其在手動靈活性方面取得了巨大進步。

3、 強化學習訓練趨向於線上規劃學習動態模型谷歌訓練的強化學習網路 PlaNet可以從影象中學習環境動態資訊,並通過準確預測數個時間段後的獎勵進行線上規劃,選擇將要進行的動作。這種訓練方式與最先進的 A3C 和 D4PG 演算法相比,在訓練時間大致相同的情況,使模擬環境互動作用減少了50倍(表 1)。經過 2000 張影象訓練之後,PlaNet 的表現與受過10萬張影象訓練的 D4PG 演算法基本相似。

表 1: PlaNet 模型與其他模型訓練效果對比表

(二)機器學習在生命科學領域發現新應用1、 AlphaFold模型預測蛋白質的 3D 結構DeepMind 公司訓練的 AlphaFold 能夠使兩個深度卷積神經網路協同工作, 第一個神經網路預測氨基酸對之間的距離,第二個神經網路預測連線這些氨基酸的化學鍵之間的角度,並建立蛋白質距離圖來生成 3D 蛋白質結構。該方法在預測蛋白質 3D 結構上遠遠超過先前最先進水平, 給未來機器學習在生物學方面的廣泛應用指明了方向。

2、 機器學習演算法合成化學分子上海大學馬克·沃勒(Mark Waller) 教授團隊同時使用三種不同的神經網路並結合蒙特卡洛樹搜尋組成了 3N-MCTS 演算法。3N-MCTS 演算法通過提出有限數量的自動提取轉換將搜尋引向最正確的方向,並預測擬議的反應是否真正可行。在化學分子合成方面, 3N-MCTS 演算法可解算 80%以上的分子測試集,每個目標分子的時間限制為 5 秒,與現有先進的計算機輔助合成規劃相比,合成速度大大提升。

3、 深度學習與醫學融合加深隨著深度學習、計算機視覺等技術的發展,人工智慧被越來越多的應用於眼部疾病、心臟疾病的診斷。基於 3D U-Net架構的神經網路可以進行數字光學計算機斷層攝影掃描,並建立眼睛的“組織圖”,並通過該組織圖對患者病症進行種類和嚴重性的分級分類。另外, 接受過 5.4 萬名患者訓練的端到端深度學習網路在心臟病診斷領域已經達到人類專家級水平,以門診中的單導聯心電圖軌跡作為原始資料, 深度學習網路已經可以成功分辨12種心律類別。

4、腦機介面成為發展熱點哥倫比亞大學的研究人員通過深度學習技術分析癲癇患者在連續收聽語音時的腦經神訊號, 能夠對病人想要表達內容進行語音合成,準確度達到 75%。另外, 神經網路被證明可恢復殘疾人士的肢體控制能力。 研究人員根據從患者大腦記錄的原始顱內電壓訊號對神經網路進行訓練,神經網路可以判斷手臂的預期活動,並使用電刺激和神經網路解碼器永久恢復四肢癱瘓患者前臂的運動能力。相比於支援向量機(SVM) 技術,神經網路方法對故障更具魯棒性, 並可以通過遷移學習技術使患者掌握新的動作。

(三) 自然語言處理實現突破式發展

1、 預訓練語言模型谷歌 BERT 模型、艾倫研究所 ELMo 模型、 魯德和霍華德ULMFiT 模型和微軟 MT-DNN 模型紛紛證明預訓練語言模型可大大提高各種自然語言處理任務的效能。 通過使用網路上的未標記文字對神經網路進行訓練, 可以在自然語言處理任務中創造收益,並建立多種新的商業應用程式,就像 ImageNet 遷移學習驅動了計算機視覺的更多工業應用一樣。

2、無雙語語料情況下的機器翻譯臉書(Facebook) 展示了如何充分利用單語資料,以擴大機器翻譯的應用範圍。 該技術首先通過自動推斷雙語詞典將模型初始化,並利用去噪自動編碼器來充分利用較強的語言模型,其中,由編碼器構建的表徵只能在當前兩種翻譯語言之間共享。 這項工作將若干原理應用於開發簡單易懂的、基於短語的統計型機器翻譯(PBSMT)系統和神經機器翻譯(NMT)系統,神經機器翻譯系統學習如何在無雙語文字的情況下進行翻譯。

3、 通用語言理解評估基準新效能基準,即通用語言理解評估(GLUE),可測試自然語言處理模型在各種語言理解任務上的表現。 人類對語言的理解較為概括和靈活,通用語言理解評估基準測試為在跨邏輯、常識理解和詞彙語義任務中評估自然語言處理系統提供了單一基準,基準測試旨在支援各系統共享各項任務的一般語言知識。

二、人才

(一) 人工智慧論文發表情況

1、谷歌在人工智慧領域仍佔據主導地位在 2018 年神經資訊處理系統大會上,谷歌依舊佔據主導地位, 在以第一作者發表論文數量的排名中,谷歌仍舊位列榜首(表2) 。表 2: 2017-2018 各大機構發表第一作者論文數量對比

2、歐洲發表論文數量最多,中國的平均引用率不斷增長美國和歐洲在人工智慧科研領域仍然具有更高的影響力,來自美國的人工智慧領域研究成果被引用率比全球平均水平高出83%,來自歐洲的人工智慧論文總量佔據世界第一,中國人工智慧領域研究成果的影響因子雖然在過去一年呈現上升趨勢,但總體被引用率仍低於世界平均水平(圖 1) 。

圖 1: 各地區人工智慧作者的領域加權引用影響力( 1998-2016 年)

(二) 中美高校加大人工智慧人才培養

中美各大高校紛紛加大對人工智慧研究型人才培養的力度。2018-2019 年,全球人工智慧領域 44%的博士畢業生來自美國,中國排名第二為 11%。 中美各大高校紛紛加大對人工智慧佈局力度(圖 2),麻省理工學院在計算與人工智慧領域新增投資 10 億美元,加速人工智慧邁向新一代, 與 2012 年相比,清華大學和斯坦福大學的人工智慧課程註冊人數分別增加了近 16 倍和 5 倍。

圖 2: 入門級人工智慧課程註冊人數增長率( 2012-2017 年)

(三) 人工智慧人才薪資結構面臨調整

高階人工智慧人才薪資不斷上升,大型科技企業內資深工程師的年薪接近 100 萬美元。 另一方面,每小時 1.47 美元的資料標籤工作崗位卻實現了巨大增長。如總部位於北京的馬達智數公司(Mada Code)將微軟和卡內基梅隆視為客戶,並聲稱擁有一支由 2 萬多名自由職業者組成的團隊,為其標註資料。

(四)產業人才需求發生變化從產業人才發展看,加拿大、英國和瑞士是人工智慧產業人才的“平臺型”國家,吸引外國人才和對外國輸出本土人才的數量均較多。美國和中國是人工智慧產業人才的“穩定型”國家,兩國人工智慧產業發展處於全球領先地位,生態系統內部更為成熟、穩定,兩國人才流入和流出均趨於平緩。同時,中美兩國的大型科技企業對人工智慧專項人才的需求量自去年起有所下降,這說明人工智慧產業發展已經從科學研究階段嚮應用落地轉化。

三、行業

(一)人工智慧領域投資情況分析

圖 3: 全球人工智慧領域投資情況 圖 4: 全球各地區人工智慧投資佔比( 投入資本單位:百萬美元)

人工智慧領域風險投資金額逐年擴大, 2018 財年的資本投資比 2017 財年高出 80%左右(圖 3),其中北美地區投資最多,佔有 55%的市場份額(圖 4) 。 另外,大型科技企業收購人工智慧初創企業趨勢愈演愈烈。 自 2010 年以來, GAFAM5已累計收購60 家人工智慧初創企業(圖 5) 。

圖 5: 各大科技巨頭收購人工智慧初創企業數量

(二) 智慧機器進入落地應用階段

1、 智慧機器人進一步發展成熟各大智慧機器人制造企業紛紛採取行動。艾波比集團(ABB)投資 1.5 億美元,用於在上海建設全球最先進、自動化程度最高、最靈活的機器人工廠。另外智慧機器人全棧初創企業發展迅猛,人工智慧初創企業 Bright Machines由歐特克和偉創力國際公司的元老領導,首輪融資籌集了 1.79 億美元,僱員增長到 300 人,以催生由智慧化軟體定義機器自動製造產品的製造模式。

2、智慧機器人與其他行業結合日益密切美國工廠安裝的機器人數量創歷史新高。 2018 年,美國工廠新增了 35880 臺機器人,比 2017 年增加了 7%。 圖 6 顯示了2011-2018 年各個行業中機器人數量變化情況。

圖 6: 2011 至 2018 年間各行業的機器人數量( 單位: 臺)

智慧機器人推動了製造業的智慧化發展。 智慧機器人制造公司伯克希爾格雷(BerkshireGrey) 提供了自動揀選機器人、移動式地面機器人系統以及產品包裝與分揀解決方案,以提高吞吐量,並簡化電子商務運營的實際供應鏈。

(三)亞馬遜擴大其運營基礎設施並推出倉儲機器人

2016 至 2019 年,亞馬遜在美國總部的運營中心建築面積增加了 45%,數量增加了兩倍。 同時, 亞馬遜推出了更多倉庫機器人,用於運營和分揀,其倉庫中有 20 萬臺機器人, 數量高於本年初所宣佈的 10 萬臺。亞馬遜近期著力對其倉庫進行諸多改進,例如, 防止Sunny照射天花板天窗以減少眩光、 在地面上安裝 QR碼、 重新定向空調等以免吹動周圍的輕質物體等,方便機器人巡視。

(四)自動駕駛汽車現規模擴大市場前景廣闊

一年來,自動駕駛汽車市場規模不斷擴大並已達到數十億美元。通用(General Electric)旗下自動駕駛汽車公司 Cruise 融資後估值達 190 億美元, 2018 年 Cruise 預算達到 7.28 億美元, 2019年預算將增至 10 億美元。 優步方面, 2016 至 2018 年,優步每年在自動駕駛上的研發支出分別為 2.3 億美元、 3.84 億美元、 4.57億美元, 員工人數超 1000 人, 融資後估值達到 72.5 億美元。 谷歌旗下公司 Waymo 運營成本在 10 億美元以上,目前正在尋找外部投資者。 同為自動駕駛汽車公司的 Nuro 和 Aurora, 前者在三年內完成了由軟銀遠景基金主導的 B 輪融資,融資金額高達 9.4億美元,後者從紅杉資本、亞馬遜和美國普信集團手中獲得了 5.3億美元的 B 輪融資,增強了其資產負債表的財務實力, 所籌資金已增至 6 億美元。 福特則為研發自動駕駛撥款 40 億美元。自動駕駛汽車測試里程和保有量增減不一。 2018 年 Waymo無人駕駛汽車行駛 100 多萬英里,是第二名 Cruise 的 2.8 倍,是第三名蘋果的 16 倍。 2018 年,在加利福尼亞汽車行駛里程為14435 英里,自動駕駛汽車行駛里程僅佔人類的駕駛里程數的0.00066%, 加利福尼亞和世界各地的自動駕駛車輛有所增加,但仍有多個國家有所減少。

圖 7: 全球機動車管理局批准總數 圖 8: 各國具有自動駕駛汽車城市數量( 單位: 輛) (單位:個)

(五)進行需求預測

機器學習將推動各行業預測性需求的發展。 能源領域,Invenia 公司是這一領域的早期領導者, 可利用天氣資訊、電網執行資料和電力輸送方向來預測需求。 防災預測領域, 一些企業使用機器學習自動校準對了解、預測和管理水資源至關重要的水文模型。 出行領域, 航班和酒店需求隨季節、天氣或大型外部事件而波動。可將機器學習加以擴充套件,幫助航空公司和酒店進行需求預測。機器學習系統可幫助預測酒店潛在預訂、特定航線需求,或服務中斷情況。 物流領域, 概率模型和多智慧體系統可用於學習如何最為合理地分配資源(如車隊),以應對動態變化的需求,使資源利用率最大化。資源配置最優化問題一旦解決,具有廣泛的應用前景。 零售領域, BlueYonder 人工智慧平臺使莫里森(英國的連鎖超市)的 2000 萬項補貨決策中有 99%完全自動化,同時提高了盈利能力,並減少了浪費。

(六) 改進機器的閱讀能力

自然語言處理方面的突破已開始應用於需要處理大量文字或快速處理文字會帶來大量經濟回報的行業。機器學習非常適合於金融和情報領域, 從大量線上資料中獲取重要訊號,機器可用分析文字的增長速度快於人工分析師, 成為專業分析師的得力助手,使得機器學習廣泛應用於企業領域。 例如, 自然語言處理公司Primer 使用自然語言處理與生成來自動執行查詢、閱讀、交叉引用和總結等通常由分析員承擔的任務。

(七)醫療保健進展

2018-2019 年,美國食品藥物管理局批准了三種基於人工智慧的醫療器械。 2018 年 4 月批准 IDx 軟體通過眼睛掃描檢測糖尿病視網膜病變。 2018 年 5 月批准 Imagen 軟體通過二維 X 光片檢測成年患者的腕關節骨折,預期用途涵蓋初級保健、急救醫學、緊急護理和整形外科。 2018 年 11 月批准 MaxQ 軟體通過對成人非造影頭部計算機斷層掃描(CT)病例的臨床評估,優先對有顱內出血跡象的患者進行治療。同時, 製藥企業與人工智慧驅動的藥物開發公司正在加強合作。

(八)人工智慧專利進展

2012 至 2017 年,人工智慧同族專利的增長率高於人工智慧科學出版物(年度增長率分別為 28%和 6%,圖 9)。隨著機器學習的商業應用不斷擴大,科學論文與專利數量的比值急劇下降。其中, 計算機視覺是最為熱門的專利領域(圖 10) ,而在計算機視覺領域中,最為熱門的是生物統計學(即與生物資料有關的應用)。

(九)人工智慧硬體

一年來,移動晶片組的人工智慧效能基準制定工作不斷推進,市場競爭壓力加劇。 美國高通公司的驍龍(Snapdragon)處理器通過展示浮動和量化神經網路方面的強大效能和硬體加速而獲勝。基準測試任務包括分類、人臉識別、去模糊、超解析度、分割和增強; 在對手機的人工智慧任務效能進行基準測試方面, 三星、華為和小米手機位居榜首,谷歌的 Pixel3 手機排名第 22 位。

谷歌、 英偉達、亞馬遜則將計算和競爭推向極致加入競爭, 預計到 2025 年,為人工智慧服務的應用可生成 40 萬億 GB 資料。

(十) 5G 將成為普遍存在人工智慧計算的支柱

5G 可為人工智慧計算提供更快、更穩定的資訊傳輸。目前,中國的 5G 進展遠遠領先於美國。 據估計,華為佔據了全球 28%的電信市場, 根據德國專利資料公司 IPlytics 的資料顯示,華為擁有的 5G 標準專利最多(1529 項),其次是芬蘭的諾基亞(1397項)。 華為既擁有專利優勢,也有最大的商業動力,有望成為構建網路供應商、裝置製造商和應用開發商生態系統的關鍵參與者。

四、對未來一年人工智慧發展的預測

預計從 2019 年 6 月起的未來 12 個月,將有一批新初創企業正在應用近期在自然語言處理領域實現的研究突破, 上述企業將集體籌集 1 億多美元。 分領域看, 自動駕駛技術仍主要處於研發階段,未來 1 年所有自動駕駛汽車公司的行駛里程將均不超過1500 萬英里。 在隱私保護方面, 財富 2000 強企業中將有一家除谷歌、 蘋果、 Facebook、亞馬遜、微軟之外的公司採用隱私保護機器學習技術,以增強其資料安全性和使用者隱私政策。 在高等教育方面,越來越多的機構將設立專門的人工智慧本科學位,以填補人才空缺。 在 AI+量子計算方面, 谷歌在量子計算硬體方面取得了重大突破,將催生至少 5 家嘗試進行量子機器學習的初創公司。 此外, 隨著人工智慧系統的日益強大,人工智慧治理將成為一個更大的爭議話題。至少將有一家大型人工智慧企業對其治理模式做出了重大變革。

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 馬雲:如果沒有“愛商”,技術越強大越可怕