線粒體單倍群性別構成比例的差異性研究

首頁>科學>基因祖源2021-02-04 16:43

線粒體單倍群性別構成比例的差異性研究

時值歲尾，正逢新春，作為庚子年內的最後一次例行推文，咱們一不寫尋親，二不寫民族，三不寫尋宗，四不寫家族，筆者準備專心致志地寫一篇關於線粒體單倍群的專（y-o-n-g）業（s-u）性研究。

這一切源自於筆者的一個偶發靈感，筆者在整理家族樹的時候，偶然發現有這樣一些「超級外婆」或「超級祖母」現象的存在。就是有一些女性，如果她在整個生育期內所生育的女兒數量遠遠大於兒子數量的時候；或者她在整個生育期內所生育的兒子數量遠遠大於女兒數量的時候，那麼這個現象在她的女兒身上也往往也會重現。

這個現象是個例還是普遍存在？若存在的話能夠佔到所有女性多大的比例？能不能用有效的手段去揭示這些問題？

筆者也曾經在社群做過一輪家系調查，如果只是進行家系例舉彙集的話，這個方法顯然不夠高效，也無法獲得這個群體的整體輪廓。

這種「超級外婆」或「超級祖母」代際傳遞的特徵只侷限於傳遞給其女兒，這似乎和線粒體的母系遺傳特徵相吻合。這樣筆者就順利地把「超級外婆」或「超級祖母」的社會現象，轉化成了一個「線粒體單倍群性別構成比例差異性問題」的研究。於是筆者設計瞭如下的統計方案進行研究。

統計口徑：23魔方祖源資料庫內填寫了「性別」及「籍貫」資訊的所有樣本。

資料清洗和基線均衡化方法：

第一步，排除掉資料庫中有晚近親緣關係的樣本：統計資料庫中所有樣本的基因關係，如果出現 2-3 級基因關係對的，隨機儲存其中的 1 個樣本作為代表。

第二步，性別基線均衡化：以地級市為統計單位，統計經過第一步清洗以後的各地區的男女數量，並以該地區性別最少的人數為基準，對該地區的「異性樣本集」進行相同樣本數量的隨機化抽樣，由此而組建該地區的「異性樣本集」。

「性別基線均衡化方法」的舉例說明：假設經過第一步排除晚近親緣樣本後，成都市還有300 個樣本，其中女性 165 人，男性 135 人。我們以性別最少的男性 135 人為基準，對 165 名成都女性樣本進行隨機化抽樣，由此而獲得了成都市經過性別基線均衡化後的 270 人的資料集。由此遍歷全國各個地區，最終彙集成全國的資料集。

第三步，統計全國資料集中各線粒體單倍群的男女人數及比例。為了防止小樣本量造成的干擾，最後去掉總樣本數小於 200 人的線粒體單倍群的統計結果。

經過上述方法統計後，共有 368 個線粒體單倍群型別的 316185 名樣本進入了統計，結果發現：

有 70.65% 的線粒體單倍群女男性別比（女性數量除以男性數量）在 0.9~1.1 之間，男女相對均衡的佔據了大多數；

有 14.13% 的線粒體單倍群女男性別比在 1.1~1.2 之間；

有 8.42% 的線粒體單倍群女男性別比在 0.8~0.9 之間；

有 2.45% 的線粒體單倍群女男性別比小於 0.8；

有 4.35% 的線粒體單倍群女男性別比大於 1.2；

其中女男性別比小於 0.8 的線粒體單倍群可能對應到我所觀察到的「超級祖母」的型別；女男性別比大於 1.2 的線粒體單倍群則可能對應了「超級外婆」型別。

其中有意思的是「超級外婆」型別無論是單倍群數量還是人數都是遠大於「超級祖母」型別的，背後的原因可能與這兩類線粒體單倍群各自不同的繁衍路線相關。「超級祖母」的型別因為繁衍路線的高度非利己特徵（即生育的女兒數量越少，越不利於該單倍群的繁衍），勢必會導致自身的逐步萎縮。「超級外婆」雖然走的是優先利己的繁衍路線，人群理應會越來越大，但是也可能存在一些非生物性的迴歸因素。比如歷史上長期存在的撫育性別篩選、性別歧視等因素都可能造成這些「超級外婆」型別的保育存活的女兒數量與生育性別均衡的女性相比並無太大優勢。

當然進入到了新時代新時期，隨著女性整體社會地位的提升、生育少子化等新的社會特徵出現，上述現象將逐漸消失。

下面我們逐一介紹這些「超級外婆」型別和「超級祖母」型別的分佈特徵：

1.「超級外婆 1 號」——D4h1d 型別，該型別約佔中國人口的 0.06%，主要分佈在北方，在海南有一個蛙跳式的高頻分佈地（小樣本）。

「超級外婆 2 號」——M9b 型別，該型別約佔中國人口的 0.08%，主要分佈在廣西、湖南、江西、川渝等中西南地域，在甘肅也有較高分佈。「超級外婆 3 號」——D4j11 型別，該型別約佔中國人口的 0.06%，主要分佈在東北、華北及西北等地。「超級外婆 4 號」——M7c1c3 型別，該型別約佔中國人口的 0.01%，主要分佈在華南等地，在廣泛的北方也有零星的分佈。「超級外婆 5 號」——M10 型別，該型別約佔中國人口的 0.09%，全國廣泛分佈。「超級外婆6號」——B4c1a2 型別，該型別約佔中國人口的 0.06%，主要分佈在長江以北等地。「超級外婆 7 號」——D4h1 型別，該型別約佔中國人口的 0.09%，全國廣泛分佈。「超級外婆 8 號」——D5a2a 型別，該型別約佔中國人口的 0.06%，全國廣泛分佈。「超級外婆 9 號」——G3b 型別，該型別約佔中國人口的 0.07%，全國廣泛分佈，在西藏有較高比例。「超級外婆 10 號」——D4b1a2a 型別，該型別約佔中國人口的 0.07%，全國廣泛分佈，在北方相對聚集。「超級外婆 11 號」——F2e 型別，該型別約佔中國人口的 0.10%，全國廣泛分佈，在海南有較高比例。「超級外婆 12 號」——D5c1 型別，該型別約佔中國人口的 0.09%，全國廣泛分佈。「超級外婆 13 號」——D4n2 型別，該型別約佔中國人口的 0.06%，全國廣泛分佈，華北、西北相對高頻。「超級外婆 14 號」——M71 型別，該型別約佔中國人口的 0.08%，全國廣泛分佈，西南相對高頻。「超級外婆 15 號」——M12a1a 型別，該型別約佔中國人口的 0.07%，主要西南、中南等地。「超級外婆 16 號」——D4g2b 型別，該型別約佔中國人口的 0.05%，全國廣泛分佈，在甘肅有較高比例。「超級祖母 1 號」——C4a2c 型別，該型別約佔中國人口的 0.07%，相對高頻的分佈於胡煥庸線以西的廣大區域內。「超級祖母 2 號」——B5b5 型別，該型別約佔中國人口的 0.05%，全國廣泛分佈，在福建有較高比例。「超級祖母 3 號」——N9a1a 型別，該型別約佔中國人口的 0.08%，全國廣泛分佈，在西北和東南地區較高比例。「超級祖母 4 號」——F1d1 型別，該型別約佔中國人口的 0.08%，全國廣泛分佈，在西部及西藏有相對較高比例。「超級祖母 5 號」——C4a2a1 型別，該型別約佔中國人口的 0.10%，全國廣泛分佈，在內蒙古和新疆有較高比例。「超級祖母 6 號」——N9a1'3 型別，該型別約佔中國人口的 0.07%，全國廣泛分佈，在內蒙古、黑龍江和華東地區有較高比例。「超級祖母 7 號」——B4i 型別，該型別約佔中國人口的 0.05%，全國廣泛分佈，在南方有較高比例。「超級祖母 8 號」——D4m2 型別，該型別約佔中國人口的 0.07%，全國廣泛分佈，在新疆和內蒙古有較高比例。「超級祖母 9 號」——C7b 型別，該型別約佔中國人口的 0.09%，全國廣泛分佈，在西藏有較高比例。

附：線粒體單倍群性別構成比例總表

最新評論

∧ mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶

∨ 關於孟德爾，不為人知的16條冷知識

熱門排行

劇多

線粒體單倍群性別構成比例的差異性研究