陳哲乾
文字|張向芳
圖片|王 毅
電影《鋼鐵俠》中小羅伯特・唐尼和AI助理賈維斯的交流畫面,經常在陳哲乾的腦海中縈繞。
——不管是起初測試鋼鐵俠套裝的資料,還是高空飛行時需要幫助,小羅伯特隨時隨地可以喚出賈維斯。隨時待命的虛擬助手根據對話內容,完美解決面前的一個個問題。
陳哲乾覺得,科幻電影中的鏡頭,其實離人類並不遙遠。
要在現實生活中擁有AI助理,自然語言處理(NLP)是一個出發點。作為人工智慧中最為困難的問題之一,NLP能夠縮減人與機器之間的交流差距,而這正是陳哲乾團隊的一個技術優勢。
作為一知智慧的創始人、執行總裁,陳哲乾帶著公司走在人工智慧充滿魅力和挑戰的道路上——專注於人機互動領域,給機器裝上中樞大腦。
短短三年多時間裡,年輕的公司交出令業界矚目的成績單——
團隊和微軟聯合推出的FastSpeech語音合成系統,使機器的語音合成速度提高270倍,為目前業界合成速度最快的領先演算法。
成立兩年即融資1.3億元,在國內NLP領域創業公司中名列前茅。
作為一家技術驅動型公司,一知智慧獲得多家權威機構的認可。2019年度杭州市領軍型創新團隊榜單裡,一知智慧榜上有名。獲批的9家團隊中,還有阿里巴巴、海康威視等知名企業。
2019年最具成長性to B企業、2019年最可能改變未來世界企業、機器之心中國十大最具潛力早期AI公司等多項榮譽,也被他們默默收入囊中。
今年7月份剛剛博士畢業的陳哲乾說,“一知”的意思是“一問便知”,他們要做出最聰明的語音互動機器人,為企業提高效率,用科技給人們送去便利。
選擇這個方向創業,讓陳哲乾“每一天都充滿希望,每一天都滿懷激情”。
1
能“讀懂”人的機器人
“虛擬人”小知,跟真人主播沒啥差別
一知智慧引起過很多業界專家、政府領導的關注,最近一次吸引的,是中國工程院院士潘雲鶴的目光。
在10月中旬舉行的第二屆中國(杭州)國際智慧產品博覽會暨2020全球人工智慧大會上,潘雲鶴院士在一知智慧的展位前駐足良久。
這位浙江大學的老校長、中國人工智慧領域的開拓者之一,如此看待一知智慧的人機互動研究方向:“有很大的應用前景和想象空間”。
在營銷和客服場景,機器人被使用的頻率越來越高,很多人可能都不陌生。但要遇到一個能說會道,能“讀懂”人,具有“人的溫度”的機器人,卻並不那麼容易。
在蕭山區的杭州灣資訊港,一知智慧的虛擬客服“小知”,令人驚喜地看到機器模擬人的程度可以何種逼真。
陳哲乾在電腦上噼裡啪啦輸入一行字,具有高顏值的“虛擬人”小知馬上用設定好的或柔美或嚴肅的語氣講出這句話,講話過程中唇音同步,從神態到唇形都呈動態變化,跟真人主播無異。
以電話為載體的第一代產品“語音客服”,同樣表現出色。現場實驗了一個售後服務的多輪對話,從“你好”到“祝您生活愉快”,氣氛融洽的8輪對話一共進行了1分50秒。
在人機互動中,多輪對話是一個核心技術。市面上相對智慧的機器人,通常對話時間不超過一分鐘。但在一知智慧切入的電商場景下,機器跟人的對話時長可以達到平均73秒。
不只是多輪對話,機器還能識別情感。比如說使用者是開心還是不耐煩,機器都能識別出來,並會根據不同的情緒配置不同的話術。
“幾百萬通電話下來,平均通話時間越長,代表人越樂意跟機器去交流。”聰明的機器人,是陳哲乾追求的產品效果。
創業之初,陳哲乾曾去企業的客服中心體驗過一週,一天電話打下來,到了晚上人都是懵逼狀態。人工一天打200個電話已是極限。對企業來說,管理成本高,人員流動性大,是亟待解決的痛點。
如何幫員工減負、幫企業降本增效?利用人工智慧來代替高重複性的人員工作,無疑是最好的選擇。
目前,一知智慧合作客戶近3萬家,其中不乏華為、騰訊、阿里巴巴、國家電網、中國銀行等這樣的大客戶,客戶覆蓋了電商、教育、金融、政企等領域。
疫情期間,一知智慧的智慧語音機器人被大量用於通知、回訪電話,提醒打卡電話。在國家電網的營業廳、電商“雙11”“雙12”訂單尾款催付中,一知機器人也都發揮出重要作用。
以國家電網為例,一知智慧每月為其撥打80萬交費提醒電話,使用者覆蓋浙江省11個地市,截至目前累計催收電費金額7.2億元。電費回收時長平均縮短兩天, “機器代人”減少人工催費工作量近40%,預計一年可減少近2億元的人工成本。
而一知智慧的第二代產品“虛擬形象數字員工”,最近也應用於無人營業廳,實現的是“跨媒體多模態人機互動”。陳哲乾解釋說,就是將語音、視覺、觸控等多種感測器模態組合起來,實現機器跟人的智慧互動。
傳統的自動終端機,可能旁邊還需要一個大堂經理幫忙指導使用者如何操作,透過“虛擬員工”的多模態互動,不僅可以聽懂問題,還能根據使用者需要調出畫面,“手把手”教使用者操作,更加靈敏和智慧。
潘雲鶴評價說,“這種跨媒體多模態人機互動產品,是支撐未來機器與人多維度、跨媒體互動,建設‘數字中國’的大勢所趨。”
2
含著金湯匙出生的一知智慧
曾經的比賽牛人,透過創業挖掘人機互動的魅力
從2011年來杭州讀大學,陳哲乾已經做了9年“浙大人”。
大二那年,他看到微軟釋出的一個關於未來的概念影片,對影片中描述的泛屏時代印象極深。刷一下卡,桌子、車窗都可以成為電腦螢幕。人工智慧引起了陳哲乾的興趣。
大四快畢業時,他在保研和直博中選擇了後者,進入浙江大學國家重點實驗室——計算機學院CAD&CG實驗室,從事人工智慧人機語音互動相關研究工作。他希望自己能成為人工智慧方面的專家。
讀博期間,陳哲乾很拼,前兩年就滿足了博士畢業的要求,還經常去國外參加各種比賽和演講。
各種比賽中最牛的一次,當屬2017年獲得SQuAD機器閱讀理解比賽全球單模型組第二名,排名僅次於微軟。
SQuAD 是由斯坦福大學於2016年推出的資料集,被譽為自然語言處理領域金字塔尖的比賽。自發布以來,吸引著谷歌、微軟亞洲研究院、IBM研究院、阿里巴巴達摩院等眾多國內外知名研究機構和高校的目光。
當時陳哲乾還在讀博士,團隊經過調研,發現市場需求巨大,而且當時市面上並沒有像樣的人機互動產品。
而人機互動是浙大的一個看家本領,一群技術男覺得有責任發揮其價值。
“幹吧。”
2017年8月,一知智慧成立。
蕭山區政府的大力招引,可以說是把一群技術男變成創業者的另一個“神助攻”。
陳哲乾記得,當時只有一個PPT,蕭山區領導聽了他們的介紹,20多分鐘就決定引進專案,並且給了辦公場地和資金支援。
用陳哲乾的話說,“ 我們那時候也算是含著金湯匙出生的。”
現在的一知智慧,從10幾人的公司,發展成了擁有近150號人的大公司。快速發展離不開技術與商業並重的創始人團隊。
創始團隊中,同學李一夫是首席技術官。同樣是90後的聯合創始人顧澤良,被他們從金沙江聯合資本的投資崗位上“拉下水”,成了公司CMO(首席營銷官)。
3
錄入10句話,你就能成為“歌手”“故事大王”
在他的想象裡,《鋼鐵俠》裡的AI助理有可能實現
陳哲乾身上有種沉穩和自信,凡是見過他的人,很容易保持一致看法。
這個24歲開始創業的人說,創業是一個正確的選擇。
“用我最熟悉的技術做最喜歡的事情,而且還能做得比別人好一點,這種感覺很奇妙。”他如此形容他的創業。
年輕的一知智慧已經走上了正軌,深受客戶好評,而且實現了盈利,賬面資金充足,對陳哲乾來說,“我現在每天想的是如何讓他更好,每天看到的是希望。”
他深知自主研發能力對科技型公司的重要,所以一邊抓產業化落地,一邊搞演算法攻關,研究底層技術。
因為重視人工智慧前沿演算法的基礎研究工作,公司成立之初便設立了浙大·一知人工智慧聯合研究院。目前一知團隊碩士、博士有40多人,員工中80%的科研人員來自浙江大學、英國帝國理工大學、英國巴斯學院、香港科技大學等知名院校。
浙大·一知人工智慧聯合研究院揭牌儀式
陳哲乾說,研發人員是公司的寶貝。浙大·一知人工智慧聯合研究院的學弟們,跟曾經的他一樣,研究起黑科技來可以通宵達旦。
比如今年陳哲乾給他們定了一個課題,“如何用盡可能少的樣本,訓練出最擬人的效果?”
他們交出的黑科技,好玩有趣。
陳哲乾給我們聽了一首《隱形的翅膀》,甜美的聲音聽起來跟唱片沒區別,但實際上卻是用機器合成的。問其原理,用到的是音色克隆技術。
一個人在安靜的環境裡錄幾句話,一知大腦就能捕捉到其音色特徵,把聲音、樂譜合成後,你就成了擁有動聽歌喉的“歌手”。
同樣的,透過音色克隆,機器會模仿家長的聲音給孩子講格林童話,也可以模仿子女的聲音陪伴老人。
令人叫絕的是,一知大腦錄入的樣本足夠小——10句話就夠了。而導航上聽到的林志玲的聲音,據說至少要錄一天,可能要讀上3000個句子。
因為公司強大的科研基因,黑科技被源源不斷地創造出來。一知智慧研發的語音合成演算法二代,速度比谷歌的演算法快了400倍。
在自然語言處理中,一知機器人也更聰明。不按常規順序地反問句、倒裝句,粵語、四川話等方言,機器人都能“聽得懂”“聽得清”。語音識別和語義理解比普通智慧機器人更勝一籌。
“機器會越來越聰明,讓機器去適應人,這是我們的憧憬。”
透過自主研發的語音語義演算法引擎,一知大腦在電話、自助終端機兩個載體上開出了一連串鮮豔的花,智慧語音、智慧呼入、智慧線上客服、智慧質檢、坐席輔助、虛擬數字人等產品功能和服務,深度賦能客戶企業,幫助企業在數字經濟時代建立核心競爭力。
圍繞人機互動,一知智慧還在不停尋找新的載體。比如說眼鏡、桌子、窗玻璃未來說不準都會成為載體,人類“喚醒”一下,全息投影的虛擬人從空中冒出來,跟人進行對話。
在陳哲乾的想象裡,《鋼鐵俠》裡的AI助理,微軟概念片裡看到的場景,都有可能實現。
“我是一個對科技充滿幻想的人,我覺得這一切都可以期待。我希望有一天是我們公司,把《鋼鐵俠》裡的AI助理親自做出來。”
4
曾經的苦行僧在“open”生活中快速成長
他在“靜”中修煉,在“動”中成長。
如果分別用一個字來形容創業前後陳哲乾的不同,專心讀博時他偏“靜”,創業後卻不得不處於各種“動”中。
他在“靜”中修煉,在“動”中成長。
讀博時寫程式碼,看滿是公式的全英文論文,都需要心非常靜。讀博時過著苦行僧一樣的生活,心無旁騖,不要想任何事情,“如果一個博士比較open的話,這個博士一般會讀不好。”
現在的他,幾乎全天候處於“open”狀態。
為了讓自己儘快成長,他看書,交流,網上看影片,積極參加浙大校友會等組織,虛心向人請教。因為經常出去交流請教“混圈子”,去年瘦了十斤的他,今年又重了十斤。
在浙大一個創業社團,上市公司每日互動創始人方毅成了他的企業導師。從方毅那裡,他說學到書本上學不到的知識。
實際上,剛讀大學時陳哲乾就知道了鼎鼎大名的學長方毅,並且加入後者組建的創業精英會。大三時他曾創過一次業,跟同學一起做了個校園社交APP,多的時候2000多號人同時線上。
創業過程中,走過彎路踩過坑。陳哲乾印象深刻的是,2018年7月份,團隊沒日沒夜開發產品,眼一睜就幹活,困了就睡公司。搞了一個月,結果發現這個版本bug太多。毅然全部推翻,從頭再來。
“技術男比較理想化,一來就想建世界頂尖的摩天大樓,實際上連小土房都沒建過。那個版本地基打得有點歪。”
陳哲乾從中領悟到,不論做什麼產品,一定要用迭代的思想一步一步去做。
陳哲乾也糾結過,學術和創業能否二者兼得。公司的第一代產品,是他親自畫的原型圖。前期語音識別、語音合成的人機對話演算法,也是他帶著團隊做了工程化。他捨不得技術,還想自己寫程式碼。後面發現根本不允許,趕緊往自己不擅長的管理方向努力學習。
他過著跟以前截然不同的生活。但相同的是,一切都是為了自己最喜愛的人工智慧,而且他樂在其中。
他脾氣很好,說話慢條斯理,沒有波瀾。但同時又極有原則,他希望公司小夥伴都是一種正面積極的形象。
三年前總是論文、程式碼不離手的陳哲乾,在德魯克的書中學管理,在《菜根譚》《孫子兵法》和心理學書籍中,學著讀懂人心。在商業模式的尋找中,他逐漸把握了航向的精準度數。他更看到眼下人工智慧時代,一知智慧的潛力和優勢。
“在人機互動領域,聰明不聰明,反應快不快是最本質的東西,就像汽車的發動機,業界沒幾家能生產出來。領先的自研技術,讓一知智慧有絕對的優勢和信心。”
在陳哲乾的想象中,人機互動智慧化服務的未來前景非常廣闊,而一知智慧,將為此不懈努力。
“未來將是一個萬物智聯的數字社會,人工智慧將不斷深度融入到生產生活。一知智慧很榮幸能參與到這一偉大的歷史程序,貢獻我們的青春和力量。人機互動智慧化服務的未來前景非常廣闊,比如基於人機互動的雙邊關係,終端客戶單向度向全生命週期管理演變,真正實現大資料‘精耕細作’的巨大價值;比如由可聽可看可用向互動賦能迭代,啟用體驗場景價值,帶來更多的自由、更多的選擇。未來一知智慧將為社會提供百萬名數字員工幫助政府、企業實現智慧化重塑轉變,解放簡單重複勞動力,讓越來越多服務實現‘不見面’,使我們生活變得更智慧、更聰明。”
在人工智慧的三個重要賽道里,人臉識別有商湯科技,語音識別有科大訊飛,人機互動領域,一知智慧能否成為最耀眼的星?
未來可期。
對話
Q
你有欣賞的人嗎?
陳哲乾:方毅是一個。我剛進浙大的時候,他是創業精英會的會長,這個社團是他辦的,這麼多年一直聽大家講他。那時他不認識我,但給了我創業的火苗。他是我創業方面的一個引領者。
我的導師趙洲,我也很欣賞。他不計名利的性格與嚴謹細緻的做事風格一直影響著我。他曾說,希望自己輔導過的學生走向社會,有志成為對社會有貢獻的人,能迅速超過他成就一番事業。
Q
你覺得自己適合創業嗎?
陳哲乾:適合。因為我是福建莆田的,我們莆田跟溫州有點像,那種氛圍裡比較偏向於出去闖。創業一定是我很想做的一件事情。
Q
創業過程中會焦慮嗎?怎麼排解?
陳哲乾:會焦慮。擔心自己能力跟不上,或者說眼界跟不上。每天醒來,有100多號人跟著你在跑。
創業沒有人能夠說一帆風順,一定會踩很多坑。我們是做To B的公司,一定是需要慢慢紮根的,不像To C的感覺爽快,有時候也會覺得累。
以前讀博士的時候也累,現在感覺是充實。這些焦慮和壓力自己就會沒了,不用排解。問題總會慢慢解決的,然後不停地再有新的問題出來,就是一個正常的狀態。