首頁>科技>

摘要:通過研究發現,隨著智慧家居、智慧客服、智慧教育等人工智慧應用層的發展,語音識別技術得到了廣泛應用,眾多企業湧入分享智慧語音行業初期紅利,中國智慧語音行業已經呈現出馬太效應。目前中國智慧語音技術智慧化程度並不算高,語義識別、口音、語調、噪音克服等魯棒性問題將是下一階段智慧語音技術攻克著力點。

智慧語音是語言學、數學、計算機學、以及心理學等多學科交叉應用的結果,研究通過語音實現人機互動,主要包括語音識別、自然語言處理以及語音合成(由於目前研究領域關於語音識別與自然語言處理範疇的界定並不清晰,本文根據技術發展現狀按照並行關係界定)。智慧語音廣泛地應用於通訊、汽車電子、家庭服務、醫療等領域,是人工智慧發展的關鍵技術組成。

中國在智慧語音領域進展迅猛,商業化應用落地是主要驅動力

中國智慧語音市場年平均複合增長率高於全球水平,行業存在大規模增長紅利。如圖1所示,2011年中國智慧語音市場規模僅有6.3億元,之後隨著中國智慧語音產業化發展,市場規模呈現出高速增長的態勢,截至2018年底中國智慧語音市場規模已達到了159.7億元,期間年平均複合增長率(CAGR)高達58.7%,遠超全球30%的年平均增長水平,意味著中國智慧語音擁有巨大的市場需求,行業存在大規模增長紅利,預測2019年中國智慧語音市場規模將超過250億元。

圖1 2011-2018年中國智慧語音市場規模以及2019年預測

智慧語音在不同領域的商業化應用是中國智慧語音行業發展的主要驅動力。全球關於語音識別的研究起始於20世紀50年代,中國同時期於1958年開始涉足語音識別領域,標誌性事件是中國科學院聲學所利用電子管電路識別10個母音。之後由於國內計算機技術普及率較低以及數字訊號等技術發展較為落後,中國語音識別技術發展受到了嚴重製約,逐漸被國外拉開差距。但是近些年隨著中國電子資訊科技的飛躍式進步,中國在語音識別領域具備了比肩發達國家的發展條件,同時伴隨著人工智慧以及物聯網的發展,語音識別技術與智慧家居、智慧教育、智慧客服、機器人、無人駕駛等行業不斷探索融合,並在部分領域已經實現了商業化落地,有力推動了中國智慧語音行業的發展進步,目前中國相關企業的語音識別準確度普遍達到了97%。

國內語音識別行業出現馬太效應,本土企業國際競爭力較弱

中國智慧語音市場形成了以科大訊飛為首的一超多強的競爭格局,行業馬太效應顯現。如圖2所示,科大訊飛市場佔比最高,達到了44%,其次是百度市場佔比為28%,二者合計佔據了國內語音識別72%的市場份額,屬於第一梯隊;其次是蘋果、Nuance等外資企業;最後是國內中小型語音識別企業。由此可見,中國語音識別行業馬太效應已經顯現,科大訊飛、百度等龍頭企業依託自身品牌優勢以及客戶優勢將不斷穩固自身市場地位,並佔據更多市場份額,使得中小型企業以及新近企業生存難度加大。

圖2 中國智慧語音市場份額佔比

國內智慧語音企業本土競爭力強,但國際競爭力較弱。如圖3所示,觀察全球智慧語音市場競爭格局可以發現,儘管科大訊飛依靠本土優勢佔據了國內將近一半的市場份額,但是國際競爭力較弱,僅佔據全球5%的市場份額;而Nuance以及蘋果雖然只佔據國內10%的市場份額,但是從全球範圍內來看,二者卻佔據了全球智慧語音47%的市場份額。

圖3 全球智慧語音市場份額佔比

智慧語音魯棒性問題是目前阻礙智慧語音發展的關鍵因素

中國智慧語音尚處於識別階段,魯棒性問題將是下一階段智慧語音技術攻關著力點。目前基於實驗室環境,中國智慧語音識別準確率普遍達到了97%以上,但是當處於嘈雜環境中時,疊加語速、語調以及口音等因素,語音識別的準確率會急劇下降,嚴重影響智慧語音技術的魯棒性。另一方面,語義識別是智慧語音智慧化程度的主要體現,但是受限於演算法優化進展緩慢,目前機器在語義識別方面還比較薄弱,智慧語音整體上智慧化程度並不算高。綜合來看,當前智慧語音面臨的魯棒性問題主要包括非期待行為與互動任務、地方口音、非母語發聲、語速、語調、聲電轉換與通道傳輸、資料蒐集等,只有不斷攻克智慧語音魯棒性問題,才能有效擴大當前智慧語音技術的內涵與外延,真正實現智慧化的人機互動。

結語

中國智慧語音行業在經歷了初期發展之後,語音識別技術已經演進的較為成熟,但是在更深層次的語義識別、噪音過濾、語調識別等智慧化方面尚未取得長足進步,嚴重阻礙了智慧語音與其他行業的深度結合。下一步中國智慧語音將真正進入到智慧化發展階段,從而通過語音實現真正意義上的人機智慧互動。

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 網事沸點:阿里巴巴暫停向美國銷售電子煙......