COG (clusters of orthologous groups)主要是原核生物和單細胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)資料庫包含了7個完整基因組的真核生物的直系同源家族蛋白, 構成每個 KOG 的蛋白集是被假定為來自於一個祖先蛋白,根據系統發生進行分類,一般COG指原核生物,KOG指真核生物,KOG與COG提供了相似的基因同源物的分類資訊。
KEGG (Kyoto Encyclopedia of Genes and Genomes) 是處理基因組、生物通路、疾病、藥物和化學物質之間聯絡的整合資料庫。 KEGG用於生物資訊研究等,包括基因組,代謝組學等其他組學的資料分析,涵蓋了Drug Development(藥物開發)、 Cellular Processes(細胞過程)、 Environmental Information Processing(環境資訊處理)、Genetic Information Processing(遺傳資訊處理)、 Human Diseases(人類疾病), Metabolism(代謝)、 Organismal Systems(有機系統)等方面。
SwissProt資料庫是檢查過的、手工註釋的蛋白資料庫,我們將Unigene註釋到SwissProt資料庫,以得到更加高質量的註釋結果。
COG (clusters of orthologous groups)主要是原核生物和單細胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)資料庫包含了7個完整基因組的真核生物的直系同源家族蛋白, 構成每個 KOG 的蛋白集是被假定為來自於一個祖先蛋白,根據系統發生進行分類,一般COG指原核生物,KOG指真核生物,KOG與COG提供了相似的基因同源物的分類資訊。
KEGG (Kyoto Encyclopedia of Genes and Genomes) 是處理基因組、生物通路、疾病、藥物和化學物質之間聯絡的整合資料庫。 KEGG用於生物資訊研究等,包括基因組,代謝組學等其他組學的資料分析,涵蓋了Drug Development(藥物開發)、 Cellular Processes(細胞過程)、 Environmental Information Processing(環境資訊處理)、Genetic Information Processing(遺傳資訊處理)、 Human Diseases(人類疾病), Metabolism(代謝)、 Organismal Systems(有機系統)等方面。
GO( Gene Ontology ): 基因本體。生物技術的發展迅速,資料越來越多,不同資料庫命名標準不統一,為了解決不同的生物學資料庫可能會使用不同的術語的問題,從而基因本體聯合會(Gene Onotology Consortium)開發GO來描述基因在分子、細胞和組織水平的功能體現。GO的基本描述單元是GO terms。GO主要包括三個分支: 生物過程(biological processes)、分子功能(molecular function)和細胞組成(cellular components),用於描述基因產物的功能。GO中使用了is_a、part_of和regulates三種互作關係。