樓主打錯字了,應該是(從事計算機生物資訊學需要學哪些程式設計?)才對。
生物資訊學,日常的工作環境是基於Unix的計算機叢集,因此最常用的就是shell指令碼。它可以簡單的處理資料,再加上迷你語言sed和awk,也能滿足日常需求了。
如果你滿足於此,將會發現自己的程式碼維護不易,難以閱讀和分享,這時候我們需要學習更專業的語言。R和python都是資料科學領域紅火的程式語言,R本來就是由統計學家建立的,天生驕傲。python則是易上手的膠水語言,加上其擴充套件包pandas和scikit-learn等的加持,各行各業都有它的身影。建議都試試看,選擇一個用得順手的。
R的ggplot2和python的matplotlib各自賦予了兩者強大的畫圖能力,繪製科研插圖必不可少。有時候我們希望給圖片加上互動的功能,這時候javascript就該出場了,掌握javascript語法及其常用庫(如JQuery,boostrap和d3),能夠建立各類互動式應用。
有時候我們收集了大量的結果,想分享給整個領域,可以選擇建立一個數據庫,一個可行的技術棧就是前端使用javascript(包括boostrap,JQuery),後端搭配python的django或者flask。不少發表的科研資料庫文章都使用這種組合。
生物資料處理的經典軟體,需要密集計算的或視覺化互動的一般都由C++和Java開發,組學資料處理的包大部分都在bioconductor裡,少數是python的模組。為了更好的互動體驗,基於javascript的軟體包也在不斷推出,比如bio.js社群的成立,再比如HiGlass (http://higlass.io/) 可以流暢的在瀏覽器端視覺化染色質互動矩陣 (使用d3.js)。
當然對大部分生信分析人員來說,程式語言只是工具和解決問題的手段之一,更重要的還是對生物學問題的理解。
樓主打錯字了,應該是(從事計算機生物資訊學需要學哪些程式設計?)才對。
生物資訊學,日常的工作環境是基於Unix的計算機叢集,因此最常用的就是shell指令碼。它可以簡單的處理資料,再加上迷你語言sed和awk,也能滿足日常需求了。
如果你滿足於此,將會發現自己的程式碼維護不易,難以閱讀和分享,這時候我們需要學習更專業的語言。R和python都是資料科學領域紅火的程式語言,R本來就是由統計學家建立的,天生驕傲。python則是易上手的膠水語言,加上其擴充套件包pandas和scikit-learn等的加持,各行各業都有它的身影。建議都試試看,選擇一個用得順手的。
R的ggplot2和python的matplotlib各自賦予了兩者強大的畫圖能力,繪製科研插圖必不可少。有時候我們希望給圖片加上互動的功能,這時候javascript就該出場了,掌握javascript語法及其常用庫(如JQuery,boostrap和d3),能夠建立各類互動式應用。
有時候我們收集了大量的結果,想分享給整個領域,可以選擇建立一個數據庫,一個可行的技術棧就是前端使用javascript(包括boostrap,JQuery),後端搭配python的django或者flask。不少發表的科研資料庫文章都使用這種組合。
生物資料處理的經典軟體,需要密集計算的或視覺化互動的一般都由C++和Java開發,組學資料處理的包大部分都在bioconductor裡,少數是python的模組。為了更好的互動體驗,基於javascript的軟體包也在不斷推出,比如bio.js社群的成立,再比如HiGlass (http://higlass.io/) 可以流暢的在瀏覽器端視覺化染色質互動矩陣 (使用d3.js)。
當然對大部分生信分析人員來說,程式語言只是工具和解決問題的手段之一,更重要的還是對生物學問題的理解。