陳根：人工智慧可以理解“他她它”嗎？

首頁>科技>陳根2020-12-28 10:26

具有代替和指示作用的代詞，作為實詞在句法和文字中具有重要作用。代詞令語言簡潔且更富有變化性。

對於人類來說，識別代詞指代物件並不算困難，憑藉對上下文和對句子的理解就可以找出代詞的指代物件。然而，對於人工智慧來說，卻並不容易——機器對文字的理解通常需要核心性解析。換言之，能否準確搜尋、追蹤、分析代詞與實體之間的關聯，對於人工智慧能否準確理解文字內容至關重要。

這種能力被稱為共指消解（Conference Resolution），是自然語言處理（NLP）領域的重要研究方向，即透過追蹤長句、段落、文章中的代詞，找到其對應的指代物件或內容。

儘管目前有很多體量龐大的眾包資料集，但它們主要考察模型理解區域性語義以及謂詞引數結構，涉及共指消解的問題很少見。

針對這一問題，艾倫人工智慧研究所的研究團隊最近公佈了一個新的眾包資料集，被稱為為QUOREF，裡面包含超過 2400 個廣度選擇問題，旨在專門考察模型的共指消解能力。這些問題需要在維基百科的 4.7K 多個英文段落中分析並找到各個實體的指代物件。

作為專門測試共指消解能力的資料集，QUOREF 足以證明目前常見的機器閱讀理解模型仍有很大的進步空間。透過分析錯誤答案背後的原因，NLP 研究者才能更好地改進模型，實現在複雜、多元、大跨度的文字內容中準確對應實體與代詞，做到真正意義上的的語義理解。

最新評論

∧ 整治雙十一購物亂象，國家再次出手！該跟這些套路說再見了

熱門排行