回覆列表
  • 1 # WhaleTooth

    如果是想要直接可落地的技術方案,恐怕難以滿足需求。但如果是想要理解基本的業務邏輯,可簡單講解。

    當用戶接聽電話後,雲端的語音識別引擎會將對話者的聲音轉換成文字。當語音被轉化成文字後,會在雲端進行語義解析,並請求雲端已經設定好的答案,這個時候另外一個技術就派上用場了,即TTS技術,將文字結果轉化成聲音,並透過運營商網路播放給對話者,這樣就完成了一輪和電話機器人的交流。

    簡單梳理一下就是,

    1,透過運營商網路獲取使用者通話語音,

    2,藉助語音識別技術將使用者聲音轉成文字,

    3,藉助自然語言理解引擎理解文字意圖並取得答案,

    4,將獲取的文字答案透過TTS技術合成聲音,

    5,將合成的聲音推送給使用者。

    當前自然語言處理技術和之前相比已有長足進步,但在開放域多輪對話領域依然面臨較大的技術挑戰。所以當前的電話機器人多為提前設定好的固定會話指令碼,當用戶回覆脫離了預設指令碼的時候,會引導使用者返回到設定好的會話指令碼中來。

    下次收到電話機器人,可以調戲一下哦~

  • 中秋節和大豐收的關聯?
  • 2018俄羅斯世界盃快開始了,球王貝利還沒有預言嗎?