回覆列表
-
1 # 紫金財經
-
2 # 千家智客
智慧音箱的智慧化操作完全依靠它本身的程式設計,而這些程式設計註定了智慧音箱只能根據程式設計進行一些簡單的操作,不能進行一些相對複雜的命令,更別說實現多輪對話了,如果你提出的對話是智慧音箱本身沒有進行設定的,有時它無法回答你的問題。而且它們的對話不夾雜著任何的感情。更多智慧家居生活的資訊可以關注【千家網】—傳播智慧化生活理念,推動智慧化產品與技術在城市、建築、家庭與生活中的應用
當下的人工智慧遠沒有科幻電影中成熟,普遍認為還只有五六歲小孩的智商,可你和五六歲小孩溝通時也會這麼費勁嗎?就如高亮所言“每一個技術問題都會面臨一個技術解決的方法”,或許普通使用者只能吐槽抱怨一下,但百度的一群工程師們卻默默定了個小目標,不是先掙一個億,而是:
1、一次喚醒可以連續互動;只需要喚醒一次,就可以進行連續對話,不管智慧音箱處於什麼樣的工作狀態,哪怕正在播放音樂。就像人與人之間的對話那樣有問有答,不再是每次對話都要說出喚醒詞,真正的語音互動不應該是刻板的。
2、說話停頓不會打斷;當你說“給我放一首周杰倫的…呃…菊花臺”,智慧音箱不是著急隨便放了一首周杰倫的歌,而是播放菊花臺。智慧音箱要明白你什麼時候說完了,什麼時候沒說完,不會把你沒說完的話切斷,畢竟誰還沒有猶豫的時候呢。
3、知道說話人是誰;一個典型的三口之家,有爸爸、媽媽、孩子,每個人的需求是不一樣的。智慧音箱要精準識別出每一個人的聲音,知道問題是誰問的,然後給出準確的答案。
5、聽清聽懂不傻冒泡;你在客廳和朋友聊天時,可能有些話是說給朋友聽的,有些是給智慧音箱的指令,這時候智慧音箱就要進行精準判斷,準確識別出你是不是在和音箱對話,而不是在不該出現的時候“插兩句嘴”。
現在語音互動用到的技術主要是麥克風陣列、語音識別、語義理解、語音轉文字、文字轉語音等等,都是人工智慧技術最基本的應用,幾乎一個十幾人的創業團隊就能完成。但百度工程師們的小目標,卻需要一連串的技術攻堅。