-
1 # qingfenga
-
2 # 深度視野
首先上結論:兩個概念對內行來說是一致的。外行瞎分管不了。哈哈!
作為曾經為小米小愛同學、喜馬拉雅小雅智慧音箱、美的小美、易視騰小加提供智慧語音解決方案的科技公司AI部門的核心演算法,我們內部都將音箱稱為智慧音箱。加人工這兩字顯得有些畫蛇添足。
現在的智慧基本上都透過深度學習技術+傳統機器學習技術實現。
為了加深您對智慧音箱的整體認識,現在將智慧影響用到的一些核心技術做一些解答,希望你能更加深入的認識到人工智慧如何影響到我們的生活。
語音訊號處理語音訊號處理技術有很多的用途,比如語音增強,背景去噪等。總的來說就是需要讓訊號語音訊號更加“清楚”,清楚的訊號對於後面要講到的喚醒和識別來說非常重要,也能降低後續處理的難度。
語音喚醒技術智慧音箱平時出於加電待機狀態,需要透過喚醒啟動語音識別的相應功能。使用者透過設定或者系統預設的喚醒詞啟動互動,比如你會叫“天貓精靈”,"小度小度",“小雅小雅”,“小愛同學”,“小豹小豹”這樣的詞彙,喚醒詞可以是暱稱,也可以是一些其他指令詞“開啟點燈”,“提高音量”,“開啟空調”等。
喚醒其實是一個小的分類深度神經網路,所謂神經網路本質上是一堆矩陣的運算,上過大學高等數學和線性程式碼的人都能夠很快入門。
語音識別技術語音識別簡單來說就是把你的聲音訊號(聲音其實是一種特別的波)變為文字資訊。他的實現目前也是基於神經網路來做的,比喚醒複雜一些罷了。
語音理解當聲波變為文字後顯然機器還無法理解說話內容,這是就需要另外一種人工智慧技術NLP-自然語言處理。自然語言處理透過圖中所示方法獲得對文字涉及語義的理解,從而讀懂使用者的意圖。
語音合成當機器理解完語音的語義之後往往會和使用者進行對話。但機器內部僅僅儲存文字,比如“今天早上下雨了,記得出門帶傘哈”,這些句子很多都是我們可愛的產品同學加入的,一些可愛的語氣詞,也可以透過智慧技術自動生成(另外一種技術:文字自動生成)。將文字轉換為語音回答就涉及到了語音合成技術。語音合成目前也是用的深度神經網路。
回覆列表
多個兩字,意義明顯不同,因為她更像個人了。之前智慧還需要手動操作之類的,人工智慧,她會有更豐富的功能,更人性化,比如識別,傾聽等,科技含量更高階了!