gwas原理:規範點講就是看某個SNP在case和control兩個population間是否有allel frequency的顯著差異。
流程:
1. Filter SNP Call Rate less than 90 % (max missing rate is 0.1)
剔除缺失率在10%以上的位點,一般情況下可以選擇80%,在一些特殊情況下可以設定50%;
2. Filter mult-allelic sites (include only bi-allelic sites)
選擇二等位基因,因為在後面的分析中某些軟體只能使用二等位基因位點;
3. Filter SNP heterozygosity rate more than 0.2
去除具有較高或者較低雜合率的個體
4. Hardy-Weinberg Equilibrium using an exact test pvalue less than 0.0001
分析人類GWAS的時候一般正常群體中將不符合哈迪溫伯格平衡的位點過濾掉,動植物一般不建議使用,但也有一些文章使用此引數進行過濾,所以可以針對不同的物種進行不同的設定,只要結果合理即可。
曼哈頓圖本質上是一個散點圖,用於顯示大量非零大範圍波動數值,最早應用於全基因組關聯分析(GWAS)研究展示高度相關位點。
gwas原理:規範點講就是看某個SNP在case和control兩個population間是否有allel frequency的顯著差異。
流程:
1. Filter SNP Call Rate less than 90 % (max missing rate is 0.1)
剔除缺失率在10%以上的位點,一般情況下可以選擇80%,在一些特殊情況下可以設定50%;
2. Filter mult-allelic sites (include only bi-allelic sites)
選擇二等位基因,因為在後面的分析中某些軟體只能使用二等位基因位點;
3. Filter SNP heterozygosity rate more than 0.2
去除具有較高或者較低雜合率的個體
4. Hardy-Weinberg Equilibrium using an exact test pvalue less than 0.0001
分析人類GWAS的時候一般正常群體中將不符合哈迪溫伯格平衡的位點過濾掉,動植物一般不建議使用,但也有一些文章使用此引數進行過濾,所以可以針對不同的物種進行不同的設定,只要結果合理即可。