-
1 # 老地方83
-
2 # 我可愛的自然朋友們
非常多,幾個印象非常深刻的,
1,hmm來學習基因組,
2,迴歸、分類器來學習mirna、crisper的靶點和效率,
3,貝葉斯方法和生物物理模型(rna 雜交)學習mirna的chipseq資料,預測mirna靶點
4,利用機率圖模型來學習具體的基因調控過程,給出非常好的針對實驗的預測結果
5,rna-seq中基因表達水平預測是一個generative statisitical model
6,各種clustering
%%%%%%%%%%%%%%%%%
1,隱馬太有名了,自己google一下吧!
2,miRNA的靶點和效率的學習是targetscan,這個應該是svm,TargetScanHuman 7.0
cripser的學習,Xu H, Xiao T, Chen CH, Meyer CA, Wu Q, Wu D, Cong L, Zhang F, Liu JS, Brown M, Liu XS. Sequence determinants of improved CRISPR sgRNA design. Genome Res.2015;25:(8)1147-57
3,貝葉斯方法和生物物理模型(rna 雜交)學習mirna的chipseq資料,預測mirna靶點
http://www.nature.com/nmeth/journal/v10/n3/full/nmeth.2341.html
4,利用機率圖模型來學習具體的基因調控過程,給出非常好的針對實驗的預測結果,(應該還有好多MRF,貝葉斯網路的文獻,大家自力更生吧)
Iterative experiment design guides the characterization of a light-inducible gene expression circuit
5,rna-seq中基因表達水平預測是一個generative statisitical model
cufflinks http://www.nature.com/nbt/journal/v28/n5/pdf/nbt.1621.pdf
6,各種clustering
這個太多了,舉個偏統計的例子,sparse SVD, sparse SVD regression, T-SVD ,PCA
還有這個經典的SVD分解
http://www.pnas.org/content/97/18/10101.full.pdf
補充一點,這些文章,關鍵都在附件裡面。。
%%%%%%%%%%%%%%%
最近又看了一篇,關於deep learning的,
Predicting the sequence specificities of DnA- and RnA-binding proteins by deep learning
但不得不說,這個CNN真的好淺。。。。
最近一個deep learning預測基因關係的工作:
Deep learning for inferring gene relationships from single-cell expression data
回覆列表
生物學和醫學領域的資料形式和問題各不相同:
- 生物學裡的基因序列分析,可以用deep learning裡面專門處理sequential data的模型來分析,比如recurrent net (LSTM)。我對這個領域不太瞭解,以後補充。
- 醫學裡面的資料,可能是時間序列,例如病人的心跳,血壓等身體特徵。也可能是影像資料,比如磁共振,或者CT,還可能是二者的結合。只要涉及醫學成像分析,都可以用機器學習和模式識別的方法。檢測面板癌,乳腺癌,腦腫瘤,這都屬於detection和分類問題。分割器官,屬於影象分割的問題。
還有一類,neuroimaging裡面,透過functional MRI 分析正常人和病人的大腦活動模式的不同。這種情況,醫生已經知道那些人是病人,對分類不感興趣。真正感興趣的是病人到底哪裡和正常人不同,以此對此類精神方面疾病有更多瞭解。 資料在空間,時間方向上都有依賴關係,經常有人用independent component analysis, 以及 markov random field等方法來分析此類問題。 另外, 醫療資料經常來自不同醫院,不同裝置,不同醫生。如果想對這些系統誤差建立模型,似乎貝葉斯方法最合適。 這也屬於機器學習的範疇。
“成功應用”,其實比較模糊。大部分都停留在實驗室階段。醫療生物方向,涉及到人的生命,健康,不像網際網路行業那麼容易把技術轉化為產品。