從上面提到的那個邏輯(序列越保守的基因,其產物對生物的重要性越大)出發,人們考慮的影響基因進化速率的主要因素就是基因的功能重要性。這個觀點最早可以追溯到Kimura and Ohta的一篇經典論文[1]。文中的原話是“functionally less important molecules or parts of a molecule evolve faster than more important ones”,即功能上較不重要的分子或分子片段,比起功能上較重要的那些,進化得更快。但是,此文作者並沒有仔細區分功能重要性(Functional Importance)和功能約束(Functional Constraint)。
Wilson et al.[2] 第一次明確區分了兩者,他的文章指出,基因功能的重要性應該定義為一個基因被敲除之後,生物生存能力(Fitness)下降的程度。換句話說,缺了這個基因,生物生存能力下降越多,這個基因就越重要(因此也被稱為Protein Dispensibility)。另一方面,基因受到的功能約束應該定義為,基因序列上所有可能發生的突變中,會導致生物生存能力下降的那些突變所佔的比例,即有害突變的比例。一個基因上面有害突變的比例越高,其受到的功能約束越大。Wilson的文章認為,Kimura和Ohta文章中的表述,應該更精確地描述為:如果兩個基因受到的功能約束一樣,則它們中功能重要性高的那個,進化會較慢。
很長一段時間裡,上面的理論都沒有合適的資料用於驗證。直到基因敲除實驗慢慢變得普遍起來。Hurst and Smith[3]首先以此為基礎檢驗了進化速率與基因功能重要性是否相關。他們根據基因敲除的結果把175個小鼠基因分為必需基因(Essential Gene)和非必需基因(Non-essential Gene)兩類。必需基因是指敲除之後會引起小鼠死亡或不育的那些基因,餘下的基因都是非必需的。他們還用dN/dS.估算了基因進化速率。根據上述理論,必須基因的進化應該更慢。但他們發現,資料並不支援上述理論。
1.為什麼要研究這個問題:
自有測序技術以來,人們就發現,同一個物種裡的不同基因的進化速率差異很大。進化最快和進化最慢的基因,其進化速率可以有上千倍的差異。換句話說,進化最快的基因裡面發生了1000次氨基酸的替換,最慢的基因才發生了一次替換。人們在嘗試解釋這個現象的時候,一般都會先入為主地認為,越"重要"(Functional Importance),或者說功能上受到“約束”(Functional Constraint)越大的基因,進化應該越慢。但究竟基因的"重要性"/"功能約束"實際上是什麼,如何定義,如何測量,都沒有人知道。結果人們都是反過來運用這個觀點,即:序列越保守的基因,其產物對生物的重要性越大。儘管這種做法有一定實用價值,但是卻無益於人們更深入地瞭解什麼是基因的“重要性”/"功能約束"。要理解基因功能的"重要性"/"功能約束"的本質是什麼,其中一個途徑就是透過研究這個問題來提供相關的線索。這裡需要提一句,功能重要性"Functional Importance"和功能約束"Functional Constraint"實際上是不一樣的,下面會講到它們之間的區別。
另一方面,對蛋白質進化速率的研究至少還有兩個重要價值。首先,它催生了分子鐘理論(Molecular Clock),為確定沒有化石證據的生物存在的地質年代,提供了重要的技術手段。其次,它是分子進化的中性理論(Neutral Theory)的基礎,而中性理論是達爾文進化論提出以後最重要的改進。
2.早期研究-基因的功能重要性(Functional Importance):
從上面提到的那個邏輯(序列越保守的基因,其產物對生物的重要性越大)出發,人們考慮的影響基因進化速率的主要因素就是基因的功能重要性。這個觀點最早可以追溯到Kimura and Ohta的一篇經典論文[1]。文中的原話是“functionally less important molecules or parts of a molecule evolve faster than more important ones”,即功能上較不重要的分子或分子片段,比起功能上較重要的那些,進化得更快。但是,此文作者並沒有仔細區分功能重要性(Functional Importance)和功能約束(Functional Constraint)。
Wilson et al.[2] 第一次明確區分了兩者,他的文章指出,基因功能的重要性應該定義為一個基因被敲除之後,生物生存能力(Fitness)下降的程度。換句話說,缺了這個基因,生物生存能力下降越多,這個基因就越重要(因此也被稱為Protein Dispensibility)。另一方面,基因受到的功能約束應該定義為,基因序列上所有可能發生的突變中,會導致生物生存能力下降的那些突變所佔的比例,即有害突變的比例。一個基因上面有害突變的比例越高,其受到的功能約束越大。Wilson的文章認為,Kimura和Ohta文章中的表述,應該更精確地描述為:如果兩個基因受到的功能約束一樣,則它們中功能重要性高的那個,進化會較慢。
很長一段時間裡,上面的理論都沒有合適的資料用於驗證。直到基因敲除實驗慢慢變得普遍起來。Hurst and Smith[3]首先以此為基礎檢驗了進化速率與基因功能重要性是否相關。他們根據基因敲除的結果把175個小鼠基因分為必需基因(Essential Gene)和非必需基因(Non-essential Gene)兩類。必需基因是指敲除之後會引起小鼠死亡或不育的那些基因,餘下的基因都是非必需的。他們還用dN/dS.估算了基因進化速率。根據上述理論,必須基因的進化應該更慢。但他們發現,資料並不支援上述理論。
後來,有人把酵母基因組裡面每個基因都單獨敲除了一遍,因此得到了每個基因的功能重要性,人們把它跟基因的進化速率比較,發現確實功能重要性越大的基因,進化越慢,但兩者的相關性並不強[4]。另一方面,隨著基因晶片技術的發展,在比較偶然的情況下,人們發現基因的表達量居然跟其進化速率有很強的相關性[5],更重要的是,如果只考慮基因表達量類似的基因,功能重要性與進化速率的相關性就消失了[6]。總結這一階段的研究,人們發現,基因功能的重要性對進化速率的影響並不大。
3. 基因表達量越高,進化越慢
上一部分已經提到,基因表達量與蛋白質進化速率的相關性很高,而且這個相關性在各種生物裡面都能觀察到:(下圖侵刪)圖中x軸是基因表達量,y軸是蛋白質進化速率,每個小圖上沿標示了物種的種名。