回覆列表
  • 1 # 有個蘋果

    樓主打錯字了,應該是(從事計算機生物資訊學需要學哪些程式設計?)才對。

    生物資訊學,日常的工作環境是基於Unix的計算機叢集,因此最常用的就是shell指令碼。它可以簡單的處理資料,再加上迷你語言sed和awk,也能滿足日常需求了。

    如果你滿足於此,將會發現自己的程式碼維護不易,難以閱讀和分享,這時候我們需要學習更專業的語言。R和python都是資料科學領域紅火的程式語言,R本來就是由統計學家建立的,天生驕傲。python則是易上手的膠水語言,加上其擴充套件包pandas和scikit-learn等的加持,各行各業都有它的身影。建議都試試看,選擇一個用得順手的。

    R的ggplot2和python的matplotlib各自賦予了兩者強大的畫圖能力,繪製科研插圖必不可少。有時候我們希望給圖片加上互動的功能,這時候javascript就該出場了,掌握javascript語法及其常用庫(如JQuery,boostrap和d3),能夠建立各類互動式應用。

    有時候我們收集了大量的結果,想分享給整個領域,可以選擇建立一個數據庫,一個可行的技術棧就是前端使用javascript(包括boostrap,JQuery),後端搭配python的django或者flask。不少發表的科研資料庫文章都使用這種組合。

    生物資料處理的經典軟體,需要密集計算的或視覺化互動的一般都由C++和Java開發,組學資料處理的包大部分都在bioconductor裡,少數是python的模組。為了更好的互動體驗,基於javascript的軟體包也在不斷推出,比如bio.js社群的成立,再比如HiGlass (http://higlass.io/) 可以流暢的在瀏覽器端視覺化染色質互動矩陣 (使用d3.js)。

    當然對大部分生信分析人員來說,程式語言只是工具和解決問題的手段之一,更重要的還是對生物學問題的理解。

  • 中秋節和大豐收的關聯?
  • 有兩年賭齡,中間戒了又復賭,以後該何去何從?