首頁>科技>

智慧手機的語音助手對於很多人來說是一個又愛又恨的功能,很多時候不方便拿手機的時候,智慧語音助手真的可以幫我們做很多事,但是有的時候人工智慧長篇大論停不下來,就變成了人工智障。不過最近升級了EMUI 10後的華為語音助手小藝,開始變的越發的聰明和包容,甚至允許你插嘴打斷她。

其實想要做到和人工智慧“像人一樣自然交流”談何容易?人會吵架,對方反駁自己、打斷自己都能聽懂,語音助手這種按程式執行的功能,最怕的就是不按套路出牌。在嘈雜環境下,怎麼不被噪聲干擾?長按電源鍵喚醒小藝:

驚不驚喜,意不意外!這麼智慧的語音助手是怎麼做到的呢?

過濾掉噪聲,掃除基礎障礙

實現插嘴打斷的第一步,是讓小藝在嘈雜環境下,清楚地識別出人聲。聲音本質是攜帶資訊的能量波,為了把你的聲音從茫茫的噪聲海中pick出來,小藝通過音訊降噪和語音識別降噪,共同抑制噪聲能量、增強人聲能量。

如果說在嘈雜的背景聲中選出人聲屬於眾裡尋他千百度,那旁邊有人在大聲說話、能量波強度也相似的干擾場景就屬於真假美猴王了。對於這個問題,小藝使用華為特有的VAD和ASR識別機制來解決。

普通的VAD技術可以識別出噪聲和人聲。而華為特有的VAD結合ASR識別機制,可以區分出噪聲、無效人聲、有效人聲。做到噪音和無效人聲不識別,有效人聲才能識別。

消除播報的迴音,清掃第二隻攔路華

既然能在嘈雜環境下識別出你的聲音,那隨時打斷小藝,也就是小意思了。

插嘴打斷是在播報時候進行的,那就不可避免的會把手機語音播報的內容給收進去。理想的方案是回聲消除法:即用原始音消除播報回聲的能量。

現實中,因為器件和聲音外放的原因,聲音的波形會發生變化,實際的回聲聲波和原始聲波不能成線性,說人話就是不能消除。

這就輪到華為獨特的AI消噪技術上場了。它引入深度神經網路來訓練智慧的語音識別聲學模型,消除變形的能量。

不是對小藝說的話,小藝絕不會誤解

過濾掉這兩種干擾後,當你在小藝播報過程中打斷它時,它都能準確識別出你的聲音、理解你的意圖,並做出迴應。

或許你還有一個疑問:小藝播報時我跟旁人的對話,豈不是也會打斷小藝?

不會的。小藝引入了強大的意圖分類模型,通過把文字識別成意圖,可以分辨出你是否在對它講話,從而避免被減少干擾。

經歷了九九八十一難,你的語音在各種干擾的情況下,經歷了語音轉換和語義識別,實現了嘈雜環境、人聲干擾、播報回聲干擾中的識別,最終成功插嘴打斷。成人的世界沒有一件事是容易的。不過再難,小藝也會與你一路同行,共同成長。這麼黑的技術在哪裡呢,在裝有EMUI10的全新Mate30系列手機上,快快體驗一下吧!

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 蘋果AppStore中國香港地區App下載排行(20191113)