撰寫 | Icya
2019年9月27日,一年一度的雲棲大會落下帷幕。本次大會聚集了來自世界上幾十個國家的上千名科學家、CTO、企業家,及超過6萬名從業者和愛好者,共同探討數字經濟背景下的AI未來。
“十年前,我們討論的是雲端計算和大資料的萌芽,五年前進入移動網際網路的大時代,站在十年展望未來,整個社會都在全面進入數字經濟時代。”阿里巴巴董事局主席兼執行長張勇在主論壇演講中說。
阿里巴巴董事局主席兼執行長張勇
三年前,馬雲首次在雲棲大會上提出“五新”,新零售、新制造、新金融、新技術、新能源。張勇表示,發展到今天,“五新”已經成了“百新”、“萬新”,背後共同點正是各行各業都在全方位走向數字化和智慧化。
此前,在阿里巴巴20週年慶祝晚會上,馬雲與張勇正式交接,卸任阿里巴巴集團董事局主席。但馬雲留給阿里巴巴和智慧新經濟這筆豐厚的AI資產,才剛剛被世人揭開冰山一角。
優勝劣汰,是必然的市場規律。
相比亞馬遜、微軟、IBM和谷歌,阿里巴巴在人工智慧方面起步較晚。在阿里AI產品還未成熟的時候,為了避免過早地被福斯輿論拉入永無休止的資訊戰,阿里AI採用後發制人的策略,成立前沿技術研究機構達摩院,藉助阿里雲的競爭優勢,以“雲+AI+IOT”模式展開雲、管、邊、端、AI、物聯網的全鏈路、一體化佈局,巧妙地在產品毛坯時期避開了各大巨頭的炮火,在2018年之後接連斬獲國際獎項。
接下來,我們將和您一起探討阿里巴巴人工智慧的經營策略、商業模式、技術優勢、面臨的挑戰和未來思考,看阿里巴巴AI生態佈局的步步為營。
從iDST到達摩院,阿里巴巴的AI佈局
達摩院是孕育阿里巴巴人工智慧的技術沃土。2017年10月,阿里巴巴在雲棲大會宣佈成立全球研究機構達摩院,研究物件涵蓋機器智慧、智聯網、金融科技等多個產業領域,在機器智慧、區塊鏈、量子計算、自動駕駛等基礎性技術領域進行深度佈局。
iDST,資料科學與技術研究院是達摩院的前身,於2014年在矽谷成立,是阿里最神祕的部門。iDST在推動阿里技術與業務融合過程中扮演著重要的中轉站角色,肩負著馬雲“讓資料驅動未來”的商業夢想。2014年前後也是AI逐漸聲名大噪的時期,現在榜上有名的AI獨角獸大多是這一時期入場。
在達摩院機器智慧實驗室主任金榕看來,達摩院的設立主要有兩個目標:一是把達摩院的AI 基礎能力(原子能力)放到平臺上支撐所有現行業務,如阿里內部跟語音識別有關的業務全線使用達摩院的底層語音平臺,但會根據具體業務做定製化的改變;二是上雲,通過內部核心業務驗證後,使用者的接受度和滿意度達到一定指標,產品上雲商業化,進一步放大價值,服務整個社會。
經過兩年的發展,現在的達摩院超過半數科學傢俱有名校博士學位,辦公室分佈在四個國家、八個主要城市,其中機器智慧團隊擁有20多位知名大學教授,近10位IEEE FELLOW。馬雲希望阿里巴巴能夠成為百年老店,希望達摩院至少能夠活得比阿里巴巴要長。
在達摩院的推動下,阿里巴巴在AI平臺、AI演算法、AI引擎框架、AI雲服務、AI晶片、產業AI等多個領域進入市場,以“雲+AI+IOT”的模式完成從單點系統到技術生態的全面佈局。
AI雲服務層:阿里雲的人工智慧叢集包括GPU、FPGA、NPU、CPU、超算叢集、第三代神龍架構等在內的公共雲服務,共同形成面向人工智慧產業的支援。
AI平臺層:飛天AI平臺、飛天大資料平臺、AIOT平臺等大降低了AI開發門檻。其中,AI飛天平臺是國家首個雲端商業化機器學習平臺,支援上百億特徵、千億訓練樣本的超大規模經典演算法,降低35%訓練成本,多個場景下提升400%訓練速度,首創公共雲上視覺化建模,為開發者提供了接近本地開發的體驗。
AI演算法層:達摩院在自然語言處理、智慧語音、視覺計算等領域取得40多項世界第一。其中,自然語言處理在SQuAD機器閱讀評比中精確閱讀率首次超過人類,智慧語音入選MIT Technology Review 2019年“全球十大突破性技術”,打電話語音客服機器人被認為是“比谷歌更好的語音技術”,世界計算可識別超過100萬種物理實體。
從產業生態角度看,AI技術本質上是一種底層的基礎設施,發展早期一般由科學家的技術驅動。隨著時間的推移,AI產業生態佈局進入穩定期,AI技術全線植根原有體系架構,這個階段最能體現團隊的競爭潛力,革命性創新往往出自對市場深度洞察和具有領導力的團隊。
從資料資產管理角度看,資料作為人工智慧演算法的重要燃料,是推動人工智慧商業化的基礎支撐,雲端計算的佈局與分散式儲存能夠讓人們更加方便、快捷地自助使用遠端計算資源。這一過程中,計算雲與儲存雲之間的資料傳輸積累了海量資料資產,為AI的演算法和資料建模提供了豐富的資料資源,持續提升AI深度學習的效率。
阿里巴巴人工智慧的競爭優勢阿里巴巴的核心業務可以分為四大板塊:核心電商、雲端計算、數字媒體及娛樂,業務創新。其中,Gartner資料顯示,以2018年收入記,阿里雲的行業地位是全球第三、亞太最大的基礎設施即服務(IaaS)和基礎設施公用事業服務提供商。
以2019財年(截止2019年3月31日的完整會計年)來看,阿里巴巴公司營收3768億元,同比增幅高達51%。雲端計算業務在2019財年收入247億,同比增長84%,自2014財年以來的CAGR為100%,付費使用者達140萬;在2020財年第一季度收入78億元,同比增長66%。
據市值風雲報道,阿里雲服務在2019財年付費使用者達140萬,包含《財富》雜誌評選的中國品牌500強當中超過半數中國品牌,也包含超過半數的A股上市公司。
阿里巴巴CTO張建鋒認為“雲+大資料”是構建很多行業的基礎,沒有這個基礎,今後面向數字經濟的條件都不具備;有了這個基礎之後才能去暢想,才能有未來。
在本次雲棲大會的演講中,張建鋒說:“今天大家都處於資料大爆炸的時代,數字經濟非常重要的話題裡,資料正成為一個核心的資源,也是核心的生產資料。從去年開始,阿里雲也升級成為阿里雲智慧,我們不僅提供雲的基礎設施,也提供四大核心技術(阿里雲、海量資料、物聯網、移動化)綜合性解決方案,這是阿里雲接下去幾年要去努力實現的事情。”
商用以小博大:以家庭大腦為抓手下沉生活場景
AI作為阿里巴巴的新賽道,以“雲+AI+IOT”的方式深入雲、管、邊、端全鏈路佈局,升級傳統AI知識建模方式,在任務獲取方面針對知識資源的特性進行相應調整和改變,驅動大資料分析與決策,為未來的萬物互聯打下基礎。張勇在2018年致股東的一封信也指出,阿里也在為即將到來的物聯網時代做著充分的佈局和準備。
阿里巴巴副Quattroporte、人工智慧實驗室總經理陳麗娟在本次雲棲大會演講中指出,無論世界變化多麼快,前沿技術和家庭場景這兩個趨勢是大家一定要把握的,這也與馬老師近期提出的“3H”戰略不謀而合,即Happy、Health、Home。未來的技術發展將不是以平臺為中心,而是以家庭為中心,5G、IOT時代變化的最終是為了實現更美好的生活。
陳麗娟表示,“家”是社群最重要的組成部分,是未來阿里“雲+AI+IOT”的重要落地場景。陳麗娟說:“家庭大腦既是神經中樞也是生態聯結器,是未來社群的智慧引擎。”據陳麗娟介紹,阿里巴巴的“家庭大腦”由AI、終端、人機互動系統三部分組成,綜合家庭的碎片化、組織化特徵以“家庭大腦”為抓手,實現使用者的線上生活和雲端定居。
作為阿里巴巴“家庭大腦”與實體世界進行人機互動的中樞,在本次雲棲大會上,天貓精靈釋出了基於人機互動系統AliGenie4.0版本的新品,包括語音技能平臺、數字內容平臺、IOT接入平臺、Inside平臺。與此前版本相比,AliGenie4.0系統首次在智慧音箱全領域實現了全雙工自然對話技術,可以在播報內容的同時收聽指令,一次喚醒即可進行多輪連續自由對話,並且可以隨時打斷;其中部分對話已經可以進行上下文感知,提升了自然語言連續對話能力。
在使用者語音指令理解方面,AliGenie4.0還在全球首次提出具有上線文感知能力的語音語義一體化技術,將下一輪文字識別語義理解的錯誤率降低了58.5%。此外,新系統還支援方言識別和方言語音合成,目前已經能夠識別四川話和廣東話。
數字中臺:城市級“雲+AI+IOT”解決方案
在本次雲棲大會上,阿里雲公佈了城市大腦三年來取得的一系列進展:全球23個城市引入城市大腦,覆蓋交通、城管、文旅、衛健等11個領域,48個場景。工業大腦、農業大腦等一系列大腦的相繼誕生,也加快了數字技術在眾多領域的落地。
阿里巴巴中臺事業群副Quattroporte牆輝表示,為了支援數字浙江的建設,阿里目前正在將中臺建設、運營中積累的一系列技術能力應用到政府領域。其中,業務中臺支援所有業務相互連線,實現全域性業務程式串聯;資料中臺實現資料的全面融合,把資料演算法能力植入業務流程。
阿里巴巴副Quattroporte、達摩院人工智慧中心負責人華先勝也為我們分享了城市大腦助力政府數字化轉型的實際應用。其中,城市大腦AI規模化實戰技術——天譜、天曜、天機、天鏡、天擎以及城市大腦AI計算平臺,為數字經濟社會的未來發展提供解決方案。
在過去幾年,依託阿里“雲+AI+IOT”的應用能力,先後為鑫光伏、天合光能、協鑫整合、徐工集團等大型製造企業提供服務。在物聯網專家楊勇看來,基於阿里雲可以輕鬆安全地將裝置連線至雲,從邊緣裝置到雲端,從各種裝置上收集資料、分析資料,幫助製造業提高運營效率,如阿里雲ET工業大腦進入協鑫光伏切片生產車間,生產良品率已經提升1個百分點,每年可節省上億元的生產成本。
此前,在2018年廣東雲棲大會上,阿里雲釋出了“飛龍網際網路平臺”,提出通過新平臺,助力數字廣東實現雲未來。
晶片佈局:站在AI獨角獸背後
阿里巴巴人工智慧的對外投資主要聚焦細分領域頭部企業,圍繞各行業的硬核科技佈局AI整體生態。目前,AI獨角獸商湯、曠視、依圖和寒武紀背後都有阿里的身影。
值得一提的是,在AI晶片領域,2017年阿里投資了深鑑科技、寒武紀;2018年4月,阿里收購唯一擁有自主嵌入CPU IP Core的中國產晶片公司中天微,成立AI晶片自研團隊;2018年9月,據新浪科技報道,阿里巴巴CTO張建鋒宣佈,阿里把此前收購的中天微和達摩院自研晶片業務整合成“平頭哥半導體有限公司”推進雲端一體化的晶片佈局,其思路是先期讓阿里雲伺服器用上自己的晶片,後期開放給行業做普惠。
在本次雲棲大會現場,阿里巴巴釋出了第一顆自研AI晶片——含光800。這顆晶片是一款AI推理晶片,主要用於雲端視覺場景,可為業界提供強大AI推理算力。張建鋒表示,全球晶片領域阿里巴巴還是一個新人,玄鐵和含光800是平頭哥萬里長征的第一步,未來來有很長的路要走。
含光800效能的突破得益於軟硬體協同創新:硬體層面採用自研晶片架構,通過推理加速等技術有效解決晶片效能瓶頸問題;軟體層面集成了達摩院的演算法,針對CNN及視覺類演算法深度優化、計算、儲存密度,可實現大網路模型在一顆NPU上完成計算。
根據現場演示,城市大腦處理杭州主城區交通視訊,需要40顆傳統GPU,延時為300ms,使用含光800僅需要4顆,延時降至150ms;拍立淘商品庫存每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。
目前,雲端計算、大資料、物聯網、移動網際網路與AI的發展與融合已經成為不可阻擋的趨勢。相比網際網路產業,傳統產業的革新對技術的需求更為龐大,涉及的產業鏈更長,但是,傳統產業對新技術的應用以及IT能力良莠不齊,複雜的需求和巨大的資源消耗也為AI商業化落地提出了不容忽視的高標準、高效能、高要求。
阿里巴巴人工智慧面臨的挑戰阿里AI這五年,背後是達摩院這群科學家們的執著與付出。達摩院人工智慧中心負責人華先勝表示,阿里巴巴人工智有今天的成績,也有諸多的挑戰。
商業化營收:實驗室結果與真實世界的割裂
華先勝博士調侃道:“實驗室的結果和真實世界是兩回事,如果把實驗室的結果當成是真實世界,那出了實驗室我們基本上都要懷疑人生了。”
據內部人士回憶,在iDST運營的早期,科學家們脫離業務線只做純粹的基礎技術研究,使得iDST上下的研究缺乏目的性,很多人也不知道自己的演算法、模型要解決哪些具體問題,從研發到落地出現了巨大的斷層。為了尋求商業場景讓科學家們深入一線,在2015年7月,iDST的人馬進行了調動,螞蟻金服Quattroporte胡曉明受命,帶領這群搞研究和搞學術的下一線深入場景、接觸業務,並且科學家、研究員下一線接觸業務已成為傳統沿襲至今。
那麼,為什麼說實驗室結果與真實世界是兩碼事?
業內講,搞研發只考慮前沿技術的可實現,不考慮未來商業的生產成本。因此,科學家們造出的第一級產品往往都不接地氣,到真正的商業級應用還有相當大的一段距離。並且,這些問題客觀存在於從科研到商用供應鏈的每一個環節中。這就意味著,阿里AI將持續面對“高額研發成本支出與收益回報不成比例”這一挑戰。
競爭對手:虎狼環伺、新貴入局、競爭加劇
從全球範圍的智慧雲服務領域看,除了阿里雲,這一領域的主要玩家有亞馬遜的AWS、微軟的Azure,谷歌、IBM、Oracle等。從市場角度看,市場表現出對企業聚焦TOB業務帶來的營收和綜合抗風險實力提升的認可,對潛在價值的挖掘表現出較高預期。
據市值風雲報道,公有云當前大約2/3的市場份額被前五大廠商瓜分:亞馬遜、微軟、IBM、谷歌以及阿里巴巴。據Synergy Research Group資料,截止2018年第三季度,亞馬遜AWS市場份額為34%,微軟Azure市場份額為14%,IBM和谷歌各佔7%左右,阿里巴巴4%。
得益於產品、團隊和相對熟悉的服務場景,阿里雲多年積累的客戶關係、品牌口碑、以及自身的研發體量,都決定了公司得以在短期內取得優異成績。但是,後續的商業戰場將呈現出強敵虎狼環伺、新貴潛在對手彎道超車的局面。無論是雲端計算領域的原住民還是行業新貴,都將開始加碼投入雲服務建設,可以預見未來競爭市場競爭的激烈程度。
從阿里巴巴本身來說,未來阿里雲和AI的權重將繼續加大,對這方面的營收要求將會持續體現在公司層面的成本管控和利潤率方面。因此,越是強調開源,強化對技術生態環境的完善,越是能夠加速人工智慧的商用落地。
數字資產:坐在金山上啃饅頭,也很難吃成胖子
“坐在金山上啃饅頭”是達摩院金融智慧實驗室負責人漆遠加入iDST時聽馬雲說過的話。金山就是阿里巴巴擁有的豐富資料資產。但是,即便是坐擁金山啃饅頭,也難以一口吃成個大胖子。“如果資料的價值不能被挖掘出來,那不過就是普通的土壤。”
自1946年第一臺計算機誕生,人們一直希望計算機能夠具有更加強大的功能。隨著深度學習理念的復興,計算能力的提高和大資料的積累,人工智慧的發展突飛猛進,不僅創造一些新行業,也給傳統行業賦能。今天,勞動工具轉向了基於資料、資訊、知識、價值和智慧的智力工具。
阿里巴巴開源技術委員會負責人賈揚清認為,人工智慧的深度學習,10%是AI,90%是大資料。從技術角度講,雲端計算是基礎,AI是核心,資料是燃料,人工智慧的八項技術——知識圖譜、搜尋技術、群智慧演算法、機器學習、人工神經網路與深度學習、專家系統、計算機視覺、自然語音處理與語音處理的背後都是大資料的整合處理與決策應用。
To C的雲端計算、大資料、AI服務,與To B服務存在諸多差異,如使用者需求、基礎設施建設、解決方案的通用性等。阿里巴巴的核心電商業務為阿里AI積累了豐厚的C端資料資產,相比之下,阿里在B端和G端的解決方案,如城市大腦的全鏈路、更大規模、更多維度的資料整合,應用時間還比較短,演算法和算力的成熟度並不能與C端服務相提並論。
真假剛需:“玩一下”與“離不開”難辨真偽
“使用者玩一下的層面的需求,是個假剛需。”華先勝博士在演講中說:“只有真正的剛需,才能有效訓練機器。”
業內人士稱,現在幾乎90%的人工智慧公司都採用專案制的形式摸索著做專案,這就需要對真假剛需做判斷。碰上“玩一下”就是假剛需,對團隊是真消耗,碰上“離不開”的真剛需,才能推動團隊產生正向的收益。
使用者玩一下,既沒有辦法沉澱資料,積累的資料量又不能摸索出演算法規律去訓練機器;離不開式的人機互動可以持續鍛鍊機器智慧。隨著使用者對AI的持續使用,使用者需求升維,機器也將受到不同程度需求導向式的訓練。比如,某語音識別產品的詞彙包當下的詞彙量是140萬個。隨著使用者使用頻次的提升和使用場景的更換,使用者開始對產品提出更多維度的語音識別使用要求,詞彙拓展量需要擴容到200萬個,而當下該產品的技術並不能達到使用者心目中的標準,這種反饋機制會推動產品根據使用者需求持續迭代,從而完成對機器的有效訓練。
從目前的市場現狀來看,“玩一下”這樣的專案沒有辦法產生有效的現金流。但“玩一下”和“離不開”的需求都在需求池裡面,在沒有經過市場檢驗前,誰也不知道自己的專案是“玩一下”還是“離不開”。與此同時,更大規模、更多維度的大型人工智慧應用、災備處理和預測預警,從目前的人工智慧技術成熟度來看,仍舊存在大量應用不了的場景和落地不了的解決方案。
此外,在資本層面,未來的獨角獸和新百億市值公司如何突圍,也將是創投領域持續關注的焦點。
隨著人工智慧技術在產業網際網路場景深度下沉,AI技術在基礎層、技術層和應用層迎來全新挑戰,考驗著玩家的研發、管理、培訓、商業化等各方面的綜合競爭實力。未來,如何借勢國內外巨頭們建成的基礎架構、利用現有生態去實現更多的創新生產、逐漸提高行業效率改進實施流程,需要阿里AI技術研究機構多維度、多角度的思考與探究。
人工智慧產業發展的未來思考隨著產業網際網路的深入發展,資訊構成的數字世界和人類生活的實體世界將會進一步互融互通。在產業網際網路的江湖裡,成長都是指數級的,沒有誰可以真正的高枕無憂。與時俱進、尊重使用者體驗是網際網路產品的金科玉律。
第一,強化資料資產的安全保護。
產業網際網路時代,實體行業的生產屬性意味著更大規模與更多維度的節點資料,涵蓋物流、資金流、資訊流與服務流等商業全流程。對生產資料的聚合分析將從業務洞察發展為業務決策,梳理統一與單一化模型分析將不能滿足企業在實際應用場景中的資料應用需求,這對資料資產安全管理提出了更高的要求。
張輝文表示,產業網際網路資料安全發展面臨的核心問題是“人的問題”,急需關注由人引發的操作風險。無論技術進化到何種程度,做最後決策的是人,最複雜的因素也仍然是人。從目前全球資料安全環境來看,諸多國內外安全事故的原因都來自運維工程師的違規、升級補丁等操作。如,谷歌、亞馬遜等國外雲服務商都從曾因為運維人員操作不當出現過大規模宕機的問題。此外,某國外銀行的使用者個人資訊洩露事故,也需要引起國內廠商對安全管控的重視。
從AI技術安全形度來看人工智慧的未來發展,張輝文認為,深度學習模型需要安全加權和安全性方面的持久練習,未來希望在各主管部門、行業領先企業的帶動下,產業能夠形成AI資料資產安全保護的標準化制式,為AI技術長遠發展找到最安全的落腳點,最終迴歸到資料安全維度保護使用者隱私和財產安全。在維護資料資產安全,需要企業做正確的決策,推動產業建立秩序、合規發展。
第二,做好城市級服務的發展規劃。
在《2019城市商業魅力排行榜》中,一線城市和新一線城市聚集了全國80.17%初創公司,56.63%是高新科技型公司,54.55%的上市公司和67%的創業平臺,並吸引了高達96%的創投基金的資金流入。
城市群創新氛圍的競爭中,頭部城市在這些指標中的表現至關重要。京津冀城市群的北京,仍是全國創業氛圍最佳的城市之一;在長三角城市群裡,上海、杭州、蘇州、南京、寧波、合肥等城市是“未來化”發展的創新核心矩陣,數字經濟、城市級服務、高新技術產業園區的建設、人才引進,都將在新的未來城中開啟產業變革。
綜合分析,珠三角、京津冀、長三角基本代表了當前城市群的“未來感”先頭部隊,這三個城市群內的城市未來可塑性平均值大幅領先於其他城市群,也將是“雲+AI+IOT”解決方案城市級應用的重點部署區域。
第三,產業創投既要投戰略也要投人才。
AI技術的跨越式發展需要具備前瞻性的思考,AI技術也會因為產業生態所處的不同階段、使用者需求的不斷變化去應對各種未知的挑戰。當AI技術處於瓶頸期時,需要企業運用資本運作和自身力量,尋找合作伙伴形成強有力的生態矩陣去彌補技術維度上的不足,或通過多種技術的結合,與合作方進行相關的併購整合將單點整合為系統,增強整個產業生態的技術壁壘。
可以預見的是,行業之間的界限會越來越模糊,跨界整合將會越來越多。這就意味著,“人”將在未來的科技創新和產業變革中佔據更加重要的位置。對於人工智慧產業投資,既要戰略入股有可塑性的企業,又要投資相關的技術人才,為未來的人工智慧產業的全面爆發儲備力量。
參考資料:
《人工智慧導論》 李德毅院士主編 中國人工智慧學會組編
《阿里人工智慧這五年:天才的野心與自證》THU資料派
《2019產業網際網路基礎邏輯研究報告》艾瑞諮詢
《上市加速度|揭祕資本視角下,投資人眼中那些AI獨角獸們》普華永道中國