如果是想要直接可落地的技術方案,恐怕難以滿足需求。但如果是想要理解基本的業務邏輯,可簡單講解。
當用戶接聽電話後,雲端的語音識別引擎會將對話者的聲音轉換成文字。當語音被轉化成文字後,會在雲端進行語義解析,並請求雲端已經設定好的答案,這個時候另外一個技術就派上用場了,即TTS技術,將文字結果轉化成聲音,並透過運營商網路播放給對話者,這樣就完成了一輪和電話機器人的交流。
簡單梳理一下就是,
1,透過運營商網路獲取使用者通話語音,
2,藉助語音識別技術將使用者聲音轉成文字,
3,藉助自然語言理解引擎理解文字意圖並取得答案,
4,將獲取的文字答案透過TTS技術合成聲音,
5,將合成的聲音推送給使用者。
當前自然語言處理技術和之前相比已有長足進步,但在開放域多輪對話領域依然面臨較大的技術挑戰。所以當前的電話機器人多為提前設定好的固定會話指令碼,當用戶回覆脫離了預設指令碼的時候,會引導使用者返回到設定好的會話指令碼中來。
下次收到電話機器人,可以調戲一下哦~
如果是想要直接可落地的技術方案,恐怕難以滿足需求。但如果是想要理解基本的業務邏輯,可簡單講解。
當用戶接聽電話後,雲端的語音識別引擎會將對話者的聲音轉換成文字。當語音被轉化成文字後,會在雲端進行語義解析,並請求雲端已經設定好的答案,這個時候另外一個技術就派上用場了,即TTS技術,將文字結果轉化成聲音,並透過運營商網路播放給對話者,這樣就完成了一輪和電話機器人的交流。
簡單梳理一下就是,
1,透過運營商網路獲取使用者通話語音,
2,藉助語音識別技術將使用者聲音轉成文字,
3,藉助自然語言理解引擎理解文字意圖並取得答案,
4,將獲取的文字答案透過TTS技術合成聲音,
5,將合成的聲音推送給使用者。
當前自然語言處理技術和之前相比已有長足進步,但在開放域多輪對話領域依然面臨較大的技術挑戰。所以當前的電話機器人多為提前設定好的固定會話指令碼,當用戶回覆脫離了預設指令碼的時候,會引導使用者返回到設定好的會話指令碼中來。
下次收到電話機器人,可以調戲一下哦~