舉個例子,如果我們要做圖書領域的知識庫或者知識圖譜,首先要對圖書進行分類,這個分類就是本體,比如說,圖書分為計算機類和電子類,計算機類有分為網路、人工智慧;有了這個分類後,我們就可以把圖書都分到每個類別,比如說《Zero to One》是一本進口原版書,然後這本書有各種屬性-屬性值,比如說書的作者是Peter Thiel,這些資料就構成了一個圖書知識圖譜(前面講的分類可以認為不是這個知識圖譜的一部分),而這裡分類和知識圖譜一起可以看成是一個圖書知識庫。也就是說,本體是強調概念關係,知識圖譜強調實體關係和實體屬性值,知識庫則是所有知識的集合。但是知識庫不侷限於分類和圖譜,知識庫可以包括規則,包括過程性知識等。而本體也可以定義得很抽象,任何概念的內涵和外延可以定義本體。
本體:領域術語集合。
知識庫:知識集合。
知識圖譜:圖狀具有關聯性的知識集合。
知識圖譜本質上是語義網路,是一種基於圖的資料結構,由節點(Point)和邊(Edge)組成,就是把所有不同種類的資訊連線在一起而得到的一個關係網路。知識圖譜提供了從“關係”的角度去分析問題的能力。
構建知識圖譜的重點在於語義理解、知識表示、QA、智慧對話和使用者建模。
1.從抽象層面看,本體最抽象,其次是知識庫,最後才是知識圖譜。舉個例子,如果我們要做圖書領域的知識庫或者知識圖譜,首先要對圖書進行分類,這個分類就是本體,比如說,圖書分為計算機類和電子類,計算機類有分為網路、人工智慧;有了這個分類後,我們就可以把圖書都分到每個類別,比如說《Zero to One》是一本進口原版書,然後這本書有各種屬性-屬性值,比如說書的作者是Peter Thiel,這些資料就構成了一個圖書知識圖譜(前面講的分類可以認為不是這個知識圖譜的一部分),而這裡分類和知識圖譜一起可以看成是一個圖書知識庫。也就是說,本體是強調概念關係,知識圖譜強調實體關係和實體屬性值,知識庫則是所有知識的集合。但是知識庫不侷限於分類和圖譜,知識庫可以包括規則,包括過程性知識等。而本體也可以定義得很抽象,任何概念的內涵和外延可以定義本體。