文 | 李夜
上個月,印奇在曠視科技的招股書中,將人工智慧創新比喻為一場“無限遊戲”。在他看來,有限遊戲通常受時間限制,有輸贏雙方及明確的規則,而無限遊戲則會一直持續,規則和參與者也會不斷改變。
如果一個領域沒有什麼效益,沒有什麼Value(注:價值),那就沒什麼人進來,你在那裡守一座孤城。如果這個領域有效益、有價值,你會有上游和下游。上游企業有資源,下游企業有客戶。他們往往比你更有優勢。如果他們想替代你,沒那麼困難,甚至比你更有優勢。所以,人工智慧不太適合創業。”
李笛說,從某種角度來看,AI創業浪費了有限的AI人才。本就不多的AI人才,平攤到大量的創業公司裡,每個創業公司平均分到幾個人,很難形成合力。“行業人才如果不集中的話,想做通用,想做垂直,想做得比較深入就更難了。”
“做通用的,通吃市場”
今年8月的微軟小冰年度釋出會上,微軟現場演示了一條可互動的、有聲繪本的生產線。該生產線,融合了自然語言處理(特別是自然語言的多模態理解)、計算機語音、計算機視覺以及搜尋技術等技術。
現場,微軟工作人員告訴聽眾,使用者上傳一個簡單的文字,首先,自然語言處理,把文字處理成劇本;其次,計算機語音根據劇本配音。配音包括人的語音、背景音樂等。第三,計算機視覺把有聲繪本上的實體,比如火爐、車、天氣的變化,繪製出來,繪製成一個動態序列。第四,搜尋引擎將火或天上的雲分揀出來,再去做互動。
“就這麼一個事情,看起來小,但都用到了全身,用到了各方面的技能。從這個角度上講,人工智慧也是如此。”李笛說。
“對於微軟來講,我們已經突破了垂直的、單一的人工智慧技術。我們更多地關注的是,通用框架是不是能夠形成一個有機的整體。”李笛說,“比如說你做計算機語音做得非常強,但即便再強,一旦想把它產業化,或者把它產品化,稍微做一做,你就會發現缺一門或者兩門。其實,絕大部分的情況下,你缺了三門,這就有問題了。”
缺一門、兩門、三門指的是計算機語音的創業者,在自然語言處理、計算機視覺、搜尋技術等方面欠缺。而專一做自然語言處理、計算機視覺、搜尋技術的,也會面臨這一情況。
未來的競爭格局,李笛判斷,做垂直AI的,可能成為無名英雄,成為藏在產業鏈的某一個環節的幕後英雄。它被替代的可能性是比較大的。“做通用的通吃,而不是做垂直的通吃。”
比如知識圖譜,它是垂直技術,不是通用框架。它,能夠成為某一個產品或者解決方案的組成部分,併發揮價值。“不很少聽到,知識圖譜成功推動一個大的時代,一個大的專案,或者一個大的產品。但你可以在很多成功的產品上找到它的影子。”
李笛又說,以上只是他的一家之言,不代表就是正確答案。
通用框架:IQ、EQ分開迭代
微軟(亞洲)網際網路工程院,能夠搭建通用框架,是因為微軟有足夠多的人力、物力和財力,在人工智慧領域積累近20年的技術,能夠在一個尚未形成的產業鏈的初期,便假設該產業鏈已經形成,具備完整的上下游,能夠有選擇權,可以不用選擇在某一個垂直領域垂直突破,而是追求未來人工智慧時代的、大的通用框架。“畢竟,微軟市值第一,這應該是我們的最大方法,我們可以綜合佈局。”
這是微軟AI技術路徑選擇的前提。
為什麼做Cortana時候,小冰團隊會想到做EQ?
觸發事件是小冰團隊找真人助理聊需求時,發現並不是第一時間滿足老闆需求就是好的。真人助理會出於某種理由拒絕老闆的要求,而這個處理結果是EQ層面的結果。比如真人助理會拒絕體重超標的老闆買薯條、漢堡等垃圾食品的要求。
自從確定了這個通用框架,李笛說讓他自豪的是,微軟小冰一直沒有變過。“如果換方向,而框架不動,沒問題。換方向,框架也動了。基本上,之前各種各樣的研究幾乎都沒有用了。每年都另起爐灶,7年之後原地踏步,所以框架不能改。”據了解,三代小冰釋出會釋出的框架,跟七代小冰又提到框架,基本上沒有任何變化。小冰團隊幾年間只是不停地去完善該框架。
通用框架類似於頂層設計,依賴於獨立設計,不能從產品中找出來,跟做一個爆款APP不一樣。“框架一定是先有框架再有演算法,必須得先預測,然後才能去做。”據了解,微軟內部做了很多的、不同方向的框架,只是失敗的框架沒有被拿出來。“我們在一個專案上有多個力量、多支團隊去做同樣方向的追求,任何一個創新的需求都是這樣的,它不是計劃經濟,今天安排這個團隊做,明天安排那個團隊做,不是這樣的。”
李笛補充說,這種方式不是賽馬機制,“因為賽馬有一個比拼,誰能夠率先跑到哪裡就能夠率先獲得資源,這是賽馬。我們倒沒有說,跑慢了就沒有資源了。”
小冰團隊需要為通用框架找到一個融合IQ和EQ的方法。一如前面提到的例子,拒絕一個任務或者完成一個任務,都能夠得滿分。這給人工智慧的迭代造成不小的困擾。“好的人工智慧助理會把任務變成她的手段,而不僅僅是把任務變成她存在的目的。”這也是小冰在早期很長一段時間,對於使用者諮詢技能、知識、任務甚至是天氣等問題時,反應遲鈍的原因。無法被滿足的使用者,選擇離開。但情感計算框架不需要劣質資料。
“迭代還是要分開迭代的。合在一起是指技術成果合起來,技術成果合起來很容易。每次合起來以後的具體產品就像是她原本的能力一樣,她可以在完成任務的同時,保持敏銳。
但要分開迭代。小冰有很多產品形態,有的產品形態到現在為止很笨。其實,我們故意讓她很笨那樣的話有助於她學習,有助於她提高。”
融合IQ和EQ的通用框架用什麼樣的標準迭代?指標很重要。指標選錯了,三軍都能夠被累死。李笛說,指標是用來評估系統迭代的很重要的部分,是某種程度上的機密。迄今,只有CPS(人工智慧和單個使用者的平均對話輪次)這一個指標被公佈。
在今年小冰的年度釋出會上,微軟全球執行副Quattroporte,微軟人工智慧事業部及微軟全球研究院負責人沈向洋如是解析小冰和通用框架之間的關係。“小冰走的這條道路,更加像森林和樹木。人工智慧向前走,有一個框架是非常重要的。大家可以把通用框架想象成一片廣闊的森林,小冰只是其中的一棵大樹。但我們必須要做一個小冰,栽這樣一顆大樹。因為我們需要有這樣一個機會去學習、去驗證這個框架是不是可行。”
目前,微軟小冰團隊也正通過Dual AI,以半開放的方式,去解決不同行業特殊性需求的問題。在解決問題的同時,也逐步搭建通用框架下的“森林”。截至今年8月,在沒有一分錢硬體補貼的前提下,小冰出現在4.5億臺智慧裝置上。
李笛說,小冰不會以全開放的方式給到合作伙伴去用。“全開放的話,別人拿到全開放的東西別人很蒙,拿來怎麼做,拿來做什麼。你今天說好我給你一個手機,這個手機完全是由客戶來弄,客戶說我要設計一個什麼樣的APP啊,他沒有形成一個Know-How,會很蒙。”據悉,2018年,小冰團隊開發了一些工具包,工具包是一座橋,第三方合作伙伴甚至是普通的C端使用者能夠通過工具包操作小冰的框架。
從另一角度來看,選擇半開放是微軟在中國的優劣勢所導致的。“實際上,我們非常清楚微軟在中國的優勢和劣勢。當然,我們有技術優勢、產品優勢,甚至於我們今天不用去靠刷頂會證明。實際上,光小冰團隊頂會的文章就有四五十篇。
但微軟的劣勢也很明顯。我們幾乎沒有國內的資源,比如內容資源、O2O,我們要是想做外賣APP,我們都沒辦法刷街、掃街。廣告主的資源也沒有。沒有本地很多產業鏈的上下游資源。我們只有技術和產品,當然要半開放。”
微軟小冰發展至今,李笛用“幸運”二字總結一步步的選擇。一路走來,步步驚心,“你要讓我們回頭看,事後我們都覺得好險。”
“我們追求商業模式,而不是收入模型”
“人工智慧是很容易浪費時間的。一不小心,5年就過去了。10年都過去了。頭髮都白了。我們擔心這個(浪費時間),所以必須得看清時代的需求是什麼,你再去做,再去迭代它。”
現階段,讓小冰團隊糾結的,除了技術,還有商業落地。
但小冰背靠大樹,不急於賺錢,一如李笛說的,“我們追求的是商業模式,而不是收入模型。我們追求的是未來5到10年、20年,一個可以確定的商業模式,而不是追求今年小冰有幾個客戶,付給我多少錢。我們不追求財務回報。”
目前,從金融這個場景開始,微軟小冰逐漸活躍在金融、零售、汽車、地產、紡織等十個領域。之所以從金融開始,是因為在文字生成領域,金融的文字生成要求最高,難度最大,不能出錯。“某種程度上來講,從這種嚴苛性要求上,我們都能夠落地這個領域,就沒有什麼領域是不能突破的。”
不過,從這個例子上無法得出如下結論:小冰落地從最難的地方開始。沒有一成不變之法。比如,之前提到的Cortana便是從簡單的、容易做的聊天機器人開始,搭出通用框架,源源不斷的使用者資料迭代框架。
在這10個領域,小冰團隊希望和萬科、萬得資訊、萬事利、中國聯通等KA客戶一起,幫助行業建立規則。以零售為例,小冰團隊嘗試了定價方法、成功的驗證方法(轉化率)等,“產品的技術解決方案,實現了什麼價值?比方說實現了推薦價值,那推薦完了以後,要不要實現購買價值?購買之後,要不要有售後價值?
要不要實現,不是由客戶或者我們說了算,而是我們在這個領域能夠為客戶,和合作夥伴一起制定的。這樣的話,它才有可能成為未來。如果這麼做,它必然不是單點的,而是針對整個行業,是可拓展的。”
李笛說,他們承認微軟錯過了移動網際網路的時代,但微軟沒有錯過對移動網際網路的佈局。比如微軟很早便佈局了移動網際網路的作業系統、平板電腦,甚至是扁平化的視覺設計這種小細節。“微軟在發現未來,發現正確答案的眼光上,沒有太大的問題。”
他舉了三年前落地的全雙工語音互動的例子,微軟很早佈局了該領域的相關專利。而正在帶火這個技術的是Google。在2018谷歌I/O開發者大會上,在大會上,谷歌現場展示了人類與人工智慧的Full Duplex電話。一些媒體稱之為人類歷史上第一次與人工智慧的Full Duplex。
微軟不得不做了一個宣告。宣告稱,“其實,人類歷史上第一次與人工智慧進行全雙工語音電話,並不是發生在美國,而是發生在中國。我們很榮幸能將這一桂冠奉獻給祖國。自2016年8月起,微軟(亞洲)網際網路工程院通過人類使用者主動發起的方式,已讓小冰與人類使用者累計完成了超過60萬通電話。”
李笛還提到,一些產品、框架有視窗期。比如說情感計算框架。他個人認為情感計算框架的視窗期已經過去了。
而微軟在對話式人工智慧的EQ方面有先發優勢,“除非我們出太大的問題,比方說我們連續做了許多錯誤決定,或者同行業突然研發出一種極其跨時代的新技術,否則的話,我們的領先優勢不太可能會被追上。
因為全球範圍內對話式人工智慧的流量資料90%都流到微軟小冰,已經持續很多年了。同行業者沒有資料,沒有辦法去訓練。”