首頁>Club>
2020年的CASP競賽中,Deepmind團隊的AlphaFold 2得到了接近90分的成績。《自然》、《麻省理工技術評論》等媒體稱其為“巨大進步”、“解決了五十年來生物學的大挑戰”,並且得分已經接近於實驗取得結構的水平。這是否意味著在現在或者不遠的未來將無需再透過實驗確定蛋白結構?‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structuresDeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology
10
回覆列表
  • 1 # AI研究所

    證實了萬物皆可AI,條條大路通AI!

    幾乎所有學科都有定量即資料分析的需求,只要有大資料,就有人工智慧、深度學習或強化學習的用武之地。並且一旦有了大量的有標註的資料,人工智慧的滲入是碾壓式的,堪稱降維打擊!

    這就是大資料和人工智慧的可怕之處,也是未來各行各業都要面臨的挑戰,同時也是各行各業新的機遇!

    人工智慧最擅長的兩件事:分類和預測。

    就拿人工智慧最熱門的領域計算機視覺來說,深度學習席捲這個領域,正是因為大規模資料集ImageNet的誕生。

    [1]ImageNet專案是一個大型視覺資料庫,用於視覺目標識別軟體研究。 該專案已手動註釋了1400多萬張影象,以指出圖片中的物件,並在至少100萬張影象中提供了邊框。ImageNet包含2萬多個典型類別,例如“氣球”或“草莓”,每一類包含數百張影象。(https://devopedia.org/imagenet)

    AI在用大資料“訓練”以後,預測的誤差隨即超過了人類的5.1%。

    而這次AlphaFold2的任務,是預測蛋白質的3D結構。

    [2]研究人員使用蛋白質資料庫中接近17萬個不同的蛋白質結構,以及包含未知結構的蛋白序列資料庫對AlphaFold進行訓練。透過不斷地迭代,AlphaFold系統學習到了基於氨基酸序列,精確預測蛋白結構的能力。

    因此同樣的,只要你給我足夠多(更多)的標註好的資料,理論上預測的準確率可以不斷地提升!

    生物資訊這個專業也將變得火爆,預計再過兩年,生物專業的不學點Python資料分析都不好意思和同行打招呼了。

    都說21世紀是生物的世紀,導致21世紀生物專業|行業如此之卷。

    如今又半路殺出一個“程咬金”降維打擊,卷、卷、卷!

    這個的意義絕不止於可以幫生物民工減輕工作量,真正厲害之處在於它建立了氨基酸序列到蛋白結構的對應,結構決定功能,從而我們可以根據基因序列預測蛋白質的功能。

    預測,說明我們不止可以根據現有序列得到現有蛋白質的結構和功能,還可以透過設計序列得到我們想要的具有某種特定功能的蛋白質。

    比如說自然界中某些同源的酶催化效率有高有低,最適溫度,pH有高有低,通常是氨基酸中某個或者某幾個殘基的變化引起,如果我們完全能在計算機中模擬出這些,比如敲掉或改變某個鹼基(對應氨基酸)對催化效率的影響,透過對比計算,那麼我們就有可能知道這類酶它的“邊界”在哪。也就是知道這種催化效率最大可以達到多少,能忍受的最低最高溫度和pH是多少。一個熱穩定的Taq酶的發現就帶動了pcr技術的發展,還存在多少極端條件下有活性的理論上存在可能的酶等著我們去發現(或者說是設計)?

    再比如蛛絲的強度是鋼的五倍,但它依然是氨基酸組成的,為什麼可以有這樣的強度?可不可以有強度更高的蛋白材料?這些問題是不可能透過生物合成去一一實驗的,只可能在計算機的模擬計算演化中找到答案。

    要知道自然界存在的蛋白質只是進化的產物,進化只保證能用,但不保證最優。有些情況下它演化出的蛋白可能觸到了物理化學規律限制下的功能極限,但更多的功能邊界還是未知的。甚至有可能某種具有極限功能的蛋白質在自然演化中需要突破某個勢壘,自然條件下是幾乎不可能演化出來的,但在計算機中我們卻可以得到它。

    目前我們的研究主要是發現,即發現dna序列,發現氨基酸序列,發現蛋白結構,發現這些結構對應什麼功能,發現各種蛋白的功能組合起來實現各種生命活動。

    未來我們做的研究很可能是設計。即我們需要什麼樣的生命活動,再反推完成各種功能的蛋白,再推出它的結構,然後推出氨基酸序列和基因序列,這些都是透過計算機模擬完成。再在實驗室人工合成,再匯入目標待設計生物,然後我們幾乎可以根據我們的想法在物理化學規律的約束下完成任意的生物設計。

    到那時,人類就可以真正的掌握命運。

  • 中秋節和大豐收的關聯?
  • 如何購買智慧家居裝置?