如何實現大規模知識圖譜的構建、推理及應用？

首頁>Club>使用者516305726372021-01-28 13:39

如何實現大規模知識圖譜的構建、推理及應用？

回覆列表

1 # 北航秦曾昌

一 Konwledge Graph概念

Konwledge Graph是谷歌於2012年提出的用於增強其搜尋引擎功能的知識庫。本質上來說，知識圖譜是一種揭示實體之間關係的語義網路，可以對現實世界的事物及其相互關係進行形式化地描述。現在的知識圖譜已被用來泛指各種大規模的知識庫。

具體表現：在谷歌中搜索北京景點，能夠得到結構化的知識，而不是簡單的網頁結果。
知識圖譜是一種結構化的語義知識庫，其基本組成單位是“實體-關係-實體”的三元組，以及實體及其相關屬性-值對，透過實體間的關係構成網狀的知識結構，如：

上圖構成一個特定領域（明星）的知識網路，每一個節點（如：謝霆鋒）均為實體，實體具有屬性-值（key-value）對（如：明星名字：謝霆鋒），同時實體與實體之間透過關係（如：王菲-舊愛-謝霆鋒）相互連線。

也就是說：

實體-對應現實世界的語義本體；

屬性-描述一類實體的common特性，實體被屬性所標註；

關係-對應本體間的關係，連線了不同型別的實體。

二 Konwledge Graph架構

從邏輯架構上分，可將Konwledge Graph分為兩層：資料層與模式層。
資料層主要由一系列的事實組成，而知識將以事實為單位進行儲存，如：實體-關係-實體，實體-屬性-值這樣的三元組，對應到實際的資料；模式層則建立在資料層之上，主要是透過本體庫來規範資料層的一系列事實表達，對應到實際的資料規範，術語描述等。

從體系架構上分，可將Konwledge Graph分為兩種模式，自頂向下與自底向上。

1）自頂向下

自頂向下，首先定義好本體，確定領域的層次結構及各個概念屬性及概念與概念間的關係，之後再將實體加入到知識庫中，類似一種填充的模式，代表工作是Freebase，從維基百科中提取結構化資料。

2）自底向上

自底向上指的是從開放的資料來源中，抽取實體、屬性及關係，往上構建概念，最終形成本體。目前，這個模式被大多數工作採用，代表工作有谷歌的Knowledge Vault。
下面是一般自底向上構建本體庫的流程：

三 Konwledge Graph應用

1）最佳化搜尋

對比谷歌和百度對“黃山多大”的搜尋結果，可以看到對同名實體進行屬性搜尋，百度和google給出了不一樣的排序結果。

2）金融領域的智慧投顧、反欺詐等

3）社交領域中的興趣推薦、使用者聚類等

∧ 中秋節和大豐收的關聯？

∨ 2018年過年是幾九？

熱門排行

劇多

如何實現大規模知識圖譜的構建、推理及應用？