曠視CTO 唐文斌
10月20日晚,一年一度的“世界網際網路領先科技成果”頒獎,其中,曠視自主研發的人工智慧演算法平臺Brain++榮獲該獎項。
人工智慧演算法從研發到部署是一套龐大的系統工程,目前業界普遍把深度學習框架作為演算法開發工具。當前,第二代框架為主流的PyTorch在研究領域大展身手,我們熟知的谷歌研發的TensorFlow則依然是被國內外最為廣泛應用的框架。
中國企業擁有自主研發、自主可用的深度學習框架並不多見。此前,百度“飛槳”(PaddlePaddle)是唯一開源的中文深度學習平臺。
唐文斌介紹,曠視早在2014年開始自研Brain++,比TensorFlow還要早半年。相比TensorFlow,已經進化到第八代的Brain++更專注計算機視覺領域。曠視也藉助Brain++多次斬獲各類影象識別比賽榜首。
唐文斌將Brain++形容成一隻雞,“其實客戶真正要的東西是番茄炒蛋,Brain++就是那隻‘雞’,讓‘雞’變得快速產蛋,我內部有一個笑話,曠視這個公司就是在正確地‘做雞’”。
今年8月底,曠視在港交所遞交IPO招股書。招股書中披露,2019年上半年,曠視研發佔比高達總開支近50%。不過,唐文斌並不認同曠視是一家技術公司的定位,在他看來,曠視本質上是一家以人工智慧演算法為核心的產品公司。
“我們是搞技術中最懂場景的,搞場景裡最懂技術的。”唐文斌表示。
目前曠視主要面向四大場景:個人物聯網SaaS層面主要面向金融貸款和網約車客戶,個人裝置方面曠視向OV小米等廠商提供FaceID手機人臉解鎖解決方案,to B的安防領域是目前曠視最大的收入來源,未來加大布局更看好的領域則是物流機器人。
以下為採訪實錄精選:
問:能否介紹一下Brain++,它和目前的主流深度學習框架有哪些區別和優勢?
唐:Brain++是為研發人員提供的一站式 AI 工程解決方案,端到端覆蓋演算法研發全流程:從資料的生成、清洗、預處理、標註和儲存開始,到研究人員設計演算法架構、設計實驗環節、搭建訓練環境、訓練、加速、調參、模型效果評估和產生模型,到最終的模型分發和部署應用,最後再到不同的端,如雲端、邊緣端,移動端上的部署。
我們在TensorFlow之前就開始做這樣一個產品了,而TensorFlow出來之後,我們發現它和我們Brain++的核心框架MegEngine其實非常像。Brain++目前已經迭代到8.0版本,這個過程中我們也會去吸取業界其他框架的優勢。
在表現層面,它有兩大優勢:
第一,它是最適合影象處理的,整個Engine不完全是為了通用目的設計的,曠視的核心是以視覺、影象處理為核心,所以我們整個優化是圍繞著稠密型的資料、圍繞著影象來做優化的,所以它特別適合影象。
第二,我們做很多場景應用,在訓練端,它在影象上有一定的優勢,但最強的是在最後的推理端,當它應用到手機和伺服器上,推理能力速度能夠比TensorFlow和其他的一些框架快很多倍。
問:Brain++的一大特點是自主研發、完全可控。您身處行業中,從您的角度看,完全擺脫西方依賴可行嗎?
唐:首先,整個科技圈還是要加強協作和交流,其實這是大家共同進步的一種方式。在整個科技領域裡,大家還是有非常多的交流,把一些新的想法很快推到公共交流網站上去,大家不斷交流各種新想法,把知識共享出來,國外用這樣的方式把技術開源出來,促進整個生態的戰略發展。
在科技方向上,大家互相交流、互相的促進還是存在的,這個東西不會斷掉,因為每個科學家都希望跟同樣優秀的人,跟這個世界上最優秀的其他人去溝通,去自我促進和成長。第二,我們自己做確實有一個好處,不會受制於人,這是從商業角度能夠帶來的一個價值。
問:曠視自研Brain++有什麼價值?
唐:如果把做演算法比作APP開發,Brain++就像是個作業系統。它的核心潛能是讓開發APP和釋出APP整個流程都能變得更加高效,這是它最大的價值。
曠視本質上是一家以人工智慧演算法為核心的技術型產品公司。演算法能不能做得好,這是這家公司能否存在的根基,怎樣能夠在演算法上保持持續領先,這件事情是必須要解決的問題。
問:您剛說曠視本質上是一家以人工智慧演算法為核心的技術型產品公司,是您認為純做技術的公司沒有辦法做持久嗎?
唐:我不想下任何斷言,我認為做技術的公司也是可以生存的,只是不同公司的選擇。以曠視為例,曠視是技術信仰+價值務實,只有價值務實才能更好的去完成整個商業的閉環,能夠支撐這家公司走得更長遠。
我認為有些公司選擇只做技術是欠考慮的,如果你把技術賣給其他人,那麼你的技術怎麼定價?未來商業化模式是什麼?最後的出路是被一家公司收購還是什麼樣?這是技術公司值得思考的問題。
問:可是Brain++讓你們變成一個平臺提供者,你們以後是平臺公司還是產品公司?
唐:我們是產品公司。今天我出來的時候,遇到了以前我們的副校長龔克老師,他說你們現在做的這個產品就是“一隻雞”,我覺得這很對。
打個比方,假設演算法是雞蛋,其實客戶真正要的東西是番茄炒蛋,所以它需要變成產品、變成解決方案。番茄炒蛋需要雞蛋來做原料。Brain++是那隻“雞”,這隻“雞”變得快速產蛋,所以目前我們在做一隻“雞”。
我們內部有一個笑話,而且還抄了KFC的那句話,“我們正確地做雞”。
問:曠視會不會軟硬結合推出自己的晶片?
唐:軟硬結合是一個非常好的、很重要的方式。光有演算法不行,怎樣有一個很好的載體,不管是自研晶片還是和晶片公司走得更近去做合作,這有很多種方式,是能夠使得整合度更高的產品形態。
問:那我們除了英偉達晶片之外和哪些中國產晶片廠商走得很近?
唐:現在我們和華為、寒武紀、平頭哥等中國產廠商都有非常好的合作。
問:現在做計算機視覺的國內明星創業公司有很多,包括巨頭也在佈局這塊。曠視在這方面的“護城河”是什麼?
唐:護城河是兩塊:一塊是技術端,一塊是產品端。
演算法領先和技術領先,是一家以技術為核心公司的立身之本。不僅僅是今天的演算法領先,明天演算法能夠持續的領先,這就是我們要做Brain++,所以我們最核心的“護城河”就是演算法要好,這是第一點,沒有這一點所有都是扯淡。
二是場景,技術和場景怎樣以一種最好的結合方式,形成最好的產品。曠視有這方面的能力,我們團隊是非常優秀的,我們是搞技術中最懂場景的,搞場景裡最懂技術的。
事實上計算機視覺領域沒有絕對的壁壘,因為這個產業其實非常大,我們只要做好自己,做足夠好的技術,把技術結合場景變成足夠好的產品,能夠真正交付價值,這就是曠視存在的意義。
問:相對來說,我們是AI公司裡比較成功的一家,您覺得AI公司間下一步拼的是什麼?
唐:不要講我們是成功的一家,我們只是起步相對早,發展相對比別人更靠前的一家公司而已。
人生有三大問題,你是誰,你從哪裡來,到哪裡去,對於公司而言也一樣,大家都要回到最本源的幾個問題:你到底在給社會、給客戶創造什麼樣的價值,為什麼是你?為什麼是現在?這是每個公司需要去回答的一些問題。剛才問我們的壁壘是什麼?護城河是什麼?我認為這其實是需要我們回答的問題。
對於行業內每一家公司而言,我們都需要想清楚,我們真正的核心價值是什麼?我們的核心技術是什麼?我們怎樣給不同的場景、給客戶帶來的價值是什麼?我們通過這樣的一些方式,是否能夠通過給客戶創造價值,從而能夠分享它的利益,形成我們自身完整的商業模式,能夠讓這家公司持續往前走。其實還是一些最基本的問題。你的意義到底是什麼?
回過頭來,曠視作為相對走得比較早的公司,商業化上可能比別人走得更快一些,規模上也更大一些,但這僅僅都是起步。我們想做的事情還有很多,我們有太多的事情先想了,但沒有做到,有些是沒有做到,有些還沒有做,我們有太多這樣的事情。
這是一個非常大的市場,這是一個非常有前景的市場,有記者問我說,在經濟下行期,人工智慧的公司到底是利好還是不利好?某種程度上,我認為是利好,只有在這樣的場景裡,才更加註重降本增效帶來的價值。大家都在講,所謂風來的時候,大家關注點都不在這個地方,而那正是真正需要精細運營,需要把每個地方環節、效率和成本看得更仔細的時候,我認為這是AI的價值,因為AI的核心價值就是重構整個效率和成本的結構。
問:你現在有焦慮的事情嗎?最焦慮的是什麼?
唐:最大的焦慮是現在做事情不夠快。我們現在想做的事情有很多,而且很多問題其實都想得挺清楚,但想到和做到還有一個鴻溝在那裡,需要有很強的執行力,需要有更多優秀的同學加入我們,我們一起把這件事情實現出來。
我最大的焦慮就是每天只有24個小時。