首頁>科技>

開放領域的聊天機器人

本文由 【FMI飛馬網】原創,原文連結:開放領域的聊天機器人

鑑於人工智慧現在火的一塌糊塗,飛馬網邀請了北京大學博士陳晨,線上為大家研究關於“開放領域的聊天機器人”。

陳晨

陳晨,博士,北京大學助理研究員。曾參與Google、百度、騰訊等網際網路公司研發專案並負責落地實踐,主要研究領域為自然語言處理、機器學習、深度學習,已發表多篇論文。

聊天機器人的發展

一開始,陳老師就為我們先介紹了聊天機器人的發展歷程。源於圖靈在1950年發表的文章,文章提出了圖靈測試,是指將測試者與被測試者分分開,測試者通過一些裝置對被測試者進行提問,如果最後有30%的測試者無法分辨出對面的人還是機器,那麼這臺機器就可以通過測試,可以被認為具有人類智慧。其中30%是圖靈對2000年的機器思考能力的預測,但到目前為止,許多技術還是落後的。同時,也有人認為圖靈測試是人工智慧的終極目標。

近年來,隨著深度學習技術的發展,圍繞著聊天機器人的商業應用也是層出不窮,比如蘋果的Siri、微軟的Cnrtana和小冰、Google Now、百度的度祕、亞馬遜的藍芽音箱等,不管是大企業還是小公司,都將聊天機器人看成是下一代人機互動的服務渠道。

陳老師表示,聊天機器人不單單是提供了一種服務渠道,它還改變了服務本身,能夠通過歷史資料訓練語言模型來取代人的作用。總得來說,聊天機器人技術是對資訊的組織和處理能力在搜尋引擎的基礎上又往前邁了一大步。

對聊天機器人的系統進行總結可以看出他們的系統框架中分為語音識別和文字識別兩大模組。

語音識別負責接收使用者的語音輸入,然後將語音轉換成文字形式,交給自然語言理解模組。自然語言理解模組在理解了使用者輸入的語義之後,將計算出來的語義表示式輸入到對話管理模組中。對話管理模組負責協調各個模組的呼叫和維護,並選擇合適是回覆方式,然後交給自認語言生成模組進行處理。自然語言生成模組生成回覆的文字,並將語音輸出給語音合成模組,最後將語音輸出給使用者。

陳老師為我們總結出了聊天機器人的發展有三代:

基於規則→基於檢索→基於生成模型

聊天機器人的分類

其中聊天機器人的分類也是多種的:

按領域分類

從話題層面進行區分,在開放領域下,使用者可以和機器人聊任何話題,在專業領域下,只能聊機器人設定的主題。

按場景分類

俺場景分為多輪對話和單輪對話。多輪對話是使用者帶著特定目的而來,希望得到滿足特定限制條件的資訊或服務。而單輪對話當前大量研究都是面向短對話的,如微軟的小冰。

按技術路線分類

可以分為檢索式對話聊天系統、生成式對話聊天系統、檢索和生成相結合的方法。

檢索式對話聊天系統:在已有的對話語料庫中通過排序學習和匹配技術找到適合當前輸入的最佳回覆。

生成式對話聊天系統:通過一種類似機器翻譯中常用的編碼—解碼的過程去逐字逐句地生成一個回覆。

按形式分類

可以分為主動和被動。主動的對話,在人機對話的時候,機器人能引入新內容以打破對話僵滯的狀態。被動的對話,一般認為,人類應該主導人機對話,所以傳統方法中,機器人是被動的,只需迴應就夠了。

迴圈神經網路典型技術原理

在傳統的神經網路模型中,從輸入層到輸出層,層與層之間的節點是互相連線的,對於序列數來說,前後句子並非是獨立的,但傳統神經模型是無法處理他們之間的關係的。而在迴圈神經網路模型是有記憶並將記憶內容輸出,而他們之間節點也是有連線的。

但是RNN模型雖然有記憶功能,但是記憶非常短,不能學到長期的依賴關係。這種RNN叫做長短時記憶網路,在實踐中記憶很好,相比基本的RNN模型,它可以學習長期的依賴資訊,緩解梯度消失的問題。

生成式對話經典模型

開放領域聊天機器人的評價指標

評價指標:人工平均

BLEU(機器翻譯)

ROUGE(機器翻譯)

METEOR(文字摘要)

Perplexity(語言模型的評價指標)

在演講最後,陳老師用一句話結束了本次演講:

目前聊天機器人能夠像人一樣對話依然有很長的路要走......

最後,在回答線上網友們的問題時,陳老師告訴我們,要想了解關於人工智慧方面的知識,可以到開源社群,學習一些深度學習框架,比如用深度學習框架tensorflow一步步實現下。

分享一些關於人工智慧的乾貨:小白| Python+Matlab+機器學習+深度神經網路+理論+實踐+視訊+課件+原始碼,附下載!

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 歷代 Flyme 盤點,你用過哪一款呢