我們都知道生信發SCI能畢業,能評職稱,更能申請基金,而且生信SCI不是meta分析和review綜述類,它更是原始資料的加工,你的原始資料可以自己拿去測序的晶片,也可以利用公開資料庫的晶片,簡單概括就是“拿別人的資料,發自己的SCI!”
所以生信資料探勘套路成了繼meta之後又一火熱的SCI套路,但是生信龐大的資料庫中有意義的資料總是有限的,如何在龐大的資料庫資源裡獲取有意義的資料成了生信挖掘的最初一步,也是最難一步!
而當下的大部分資料庫,操作不統一,程式碼不能複用,甚至有的連網頁也打不開,更大的麻煩是我們連每個資料庫是做啥的都不知道。為此,小編特意為大家整理了4個腫瘤方向資料庫,手把手教你如何進行生信資料探勘。(文末檢視資源領取方式)
01丨CancerSEA
CancerSEA(癌症單細胞狀態圖譜)是第一個專門的單細胞測序資料庫,旨在全面探索單細胞水平上癌細胞的不同功能狀態。
網址:http://biocc.hrbmu.edu.cn/CancerSEA/
透過對這些單細胞進行功能狀態註釋,作者構建了CancerSEA資料庫。利用該資料庫,我們可以進行“gene search”,“State Search”,“Browse state atlas”,“Browse dataset information”和“Download”。
在瞭解資料庫之後,我們就需要著手於資料庫操作了,而我們的研究思路大致如下圖,具體見影片課程。
02丨COSMIC
COSMIC是癌症相關體細胞突變位點的最大的資料庫之一。
網址如下:https://cancer.sanger.ac.uk/cosmic/
在搜尋框中輸入一個具體的基因名稱或者蛋白名稱,可以檢視具體的記錄。
課程為大家介紹了癌症單細胞狀態研究套路,從COSMIC資料庫出發,根據癌症單細胞狀態圖譜,透過資料庫得到單基因的功能、根據功能狀態找基因,最後探究其直接機制。
03丨MEXPRESS
TCGA資料庫是一個包括33種腫瘤的各個組學的資料庫。我們透過TCGA資料庫可以觀察每個人的基因表達的變化;甲基化的變化;複製數的變化;以及他們的臨床資訊。
MEXPRESS(https://mexpress.be/)是一個視覺化TCGA資料庫當中患者的臨床資訊—甲基化—表達之間之間關係的資料庫。
網址:https://mexpress.be/
工具的使用只需輸入基因名+選擇要研究的腫瘤即可,就這麼簡單粗暴!
雖然已經有 cBioPortal, Xena, TSVdb這些工具,但是他們都沒有能讓你可以查詢DNA甲基化的資料的同時看到基因組位置以及臨床資訊,而且它顯示了相關性和矯正的p值。
04丨miRWalk3.0
miRWalk是一個綜合性的miRNA靶基因資料庫,收錄了人,小鼠等多個物種的miRNA靶基因資訊,和mirDIP類似,也是一個整合型資料庫,整合了來自miRDB, TargetScan, miRTarBase等資料庫中的資訊。網址如下:http://mirwalk.umm.uni-heidelberg.de/
涵蓋了多個知名miRNA database的結果,包括預測的和實驗驗證過的。並且它使用了流行的TarPmiR預測miRNA的結合位點。
支援miRNA、mRNA單個或者多個搜尋,有圖有表有富集,結果下載簡單,資料可以全部下載。適合研究感興趣的miRNA的靶基因或者mRNA的結合的miRNA。
05丨資源領取方式
資源領取方式