回覆列表
  • 1 # 使用者2133695486863

    NR庫屬於非冗餘蛋白序列資料庫,是NCBI官方的蛋白序列資料庫,資料來源於GenPept、SwissProt、PIR、PDF、PDB以及NCBI RefSeq,是預設的蛋白比對資料庫。 NT資料庫是美國國家生物技術資訊中心NCBI官方的核酸序列資料庫,NT庫屬於非冗餘核酸序列資料庫,資料來源於GenBank、EMBL 以及 DDBJ,是NCBI預設的核酸blast比對資料庫。 SwissProt資料庫是檢查過的、手工註釋的蛋白資料庫,我們將Unigene註釋到SwissProt資料庫,以得到更加高質量的註釋結果。 COG (clusters of orthologous groups)主要是原核生物和單細胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)資料庫包含了7個完整基因組的真核生物的直系同源家族蛋白, 構成每個 KOG 的蛋白集是被假定為來自於一個祖先蛋白,根據系統發生進行分類,一般COG指原核生物,KOG指真核生物,KOG與COG提供了相似的基因同源物的分類資訊。 KEGG (Kyoto Encyclopedia of Genes and Genomes) 是處理基因組、生物通路、疾病、藥物和化學物質之間聯絡的整合資料庫。 KEGG用於生物資訊研究等,包括基因組,代謝組學等其他組學的資料分析,涵蓋了Drug Development(藥物開發)、 Cellular Processes(細胞過程)、 Environmental Information Processing(環境資訊處理)、Genetic Information Processing(遺傳資訊處理)、 Human Diseases(人類疾病), Metabolism(代謝)、 Organismal Systems(有機系統)等方面。 GO( Gene Ontology ): 基因本體。生物技術的發展迅速,資料越來越多,不同資料庫命名標準不統一,為了解決不同的生物學資料庫可能會使用不同的術語的問題,從而基因本體聯合會(Gene Onotology Consortium)開發GO來描述基因在分子、細胞和組織水平的功能體現。GO的基本描述單元是GO terms。GO主要包括三個分支: 生物過程(biological processes)、分子功能(molecular function)和細胞組成(cellular components),用於描述基因產物的功能。GO中使用了is_a、part_of和regulates三種互作關係。

  • 2 # 使用者4532147702961

    基因組註釋 是利用生物資訊學方法和工具,對基因組所有基因的生物學功能進行高通量註釋。

    基因組註釋的研究內容包括基因識別和基因功能註釋兩個方面。基因識別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預測新基因,現階段主要是3 種方法的結合:

    (1)分析mRNA 和EST資料以直接得到結果;

    (2)透過相似性比對從已知基因和蛋白質序列得到間接證據;

    (3)基於各種統計模型和演算法從頭預測。

    對預測出的基因進行高通量功能註釋可以藉助於以下方法,利用已知功能基因的註釋資訊為新基因註釋:

    (1)序列資料庫相似性搜尋;

    (2)序列模體搜尋;

    (3)直系同源序列聚類分析。

    擴充套件資料:

    基因註釋重大突破:

    1、中國科學院水生生物研究所葛峰研究員學科組利用蛋白基因組學的研究策略和方法,成功對單細胞光合真核生物三角褐指藻的基因組進行了深度註釋,完成了三角褐指藻的蛋白質組精細圖譜,並建立了完整的真核生物基因組深度註釋實驗技術和分析流程。

    該研究成果的取得,有望進一步推動蛋白基因組學在生命和健康領域特別是精準醫學方面的應用。

    2、美國加州大學舊金山分校研究人員發現,GABP蛋白的一種特定成分GABP-β1L,是與端粒酶逆轉錄酶(TERT)啟動子突變相關的膠質母細胞瘤細胞不受控制地分裂、繁殖的關鍵。

    他們10日在《腫瘤細胞》雜誌上發表論文稱,新發現提供了一個很有前途的用藥靶點,對未來膠質母細胞瘤及其他多種與TERT啟動子突變相關癌症的治療具有重要意義。

  • 中秋節和大豐收的關聯?
  • 小虎迴應“退役節奏”,夏季賽結束考慮加入GNR,坦言被感動了,怎麼評價?