首頁>科學>

由於T細胞受體庫的多樣性反映了T細胞種群中克隆擴充套件的程度,是一個有價值的生物學以及疾病的潛在生物標誌物。因此,T細胞受體庫多樣性評估十分重要,所以今天小編要和大家分享的就是今年一月發表在Cancer Immunology Research(IF:8.728 )雜誌上關於評估T細胞受體多樣性及研究其與生存和抗PD-1治療應答關係的文章。

Improved T cell receptor diversity estimates associate with survival and response to anti-PD-1 therapy

提高T細胞受體多樣性評估與生存和抗PD-1治療應答相關

一、研究背景

T細胞受體(TCRs)是alpha和beta或gamma和delta細胞表面蛋白的異二聚體,它們賦予了T細胞極高的敏感性和特異性。在癌症免疫和免疫治療中,T細胞受體庫的譜系分析對生物學發現和生物標誌物發展至關重要,而這一分析的統計學關鍵是能概括混合群體中TCR的分佈頻率的多樣性。此外,儘管在腫瘤學的臨床試驗研究中越來越多地使用TCR多樣性指標,但其準確性尚未在已發表的一些真值資料集中驗證。因此,今天小編分享一篇介紹RNA-seq資料TCR譜分析方法效能特點的文章,文章揭示了取樣不足是多樣性評估偏差的主要來源,文章也透過統計學習匯出了一個模型,該模型可以衰減偏差產生校正的多樣性評估。

二、研究的資料及方法

1.TCR庫的產生:作者使用合成TCR資訊生成器(STIG)產生一千個TCR庫,用STIG從5000個多樣的克隆型別中產生1億個體(即虛擬細胞)。這些群體中的讀數與TCGA匹配。同時對STIG提供基礎質量分數,以匹配與TCGA資料相同的質量分數和錯誤率。中位插入長度和標準偏差也從TCGA樣本亞抽樣常見的範圍中選擇。TCR克隆型的分佈採用自由度為2的STIG卡方分佈設定。模型的多樣性範圍在99% TCGA樣本的範圍內。接著進行多樣性和豐度分佈匹配且需要幾輪的庫生成、庫讀取比對、模型生成和多樣性計算。此外,Read的丰度也與TCGA資料分佈相匹配,其中大約10%的STIG讀取與CDR3區域對齊,其餘未對齊的讀取代表TCR的其他區域。

2.TCGA分析:研究分析TCGA中的原發腫瘤,並根據樣本註釋及重複對樣本進行處理。最終使用的TCGA資料是批次矯正的RNA-seq表達資料和從MiXCR輸出計算的TCR多樣性指標。

3.亞抽樣群體的多樣性:最初的亞抽樣是根據STIG在讀數產生之前生成的真值計數進行的。接著作者使用R包vegan評估了Chao1和Shannon熵兩個引數,接著用Shannon熵比上對數豐富度計算均勻度,均勻度產生了一個與“生產性克隆性”類似的結果,而克隆性是1減均勻度。此外,作者根據GitHub中VDJTools的描述計算d25, d50和 d75 (dXX) 指數。

4.MiXCR和TRUST的比較:MiXCR, TRUST和TRUST 3.0 Dockerfiles和示例命令能夠在https://github.com/Benjamin-Vincent-Lab中找到。由於TRUST不能對齊序列,所以在對這些分析使用TRUST之前,作者使用Bowtie2對讀取進行對齊。Morisita-Horn使用vegan R包裝中的vegdist函式進行計算,並用相似指數表示。錯配指數用對映到錯配庫的中位數除以正確庫的對映數計算。這個指數大於1表示在錯配文庫中匹配CDR3比正確文庫更常見。接著使用BLAST進行基本區域性比對搜尋,每個樣本使用STIG真值庫序列作為資料庫。

5.模型的產生:作者採用蒙特卡羅交叉驗證方法生成彈性網路模型。這1000個模擬TCR庫被分成發現集和驗證集。發現集被反覆分割成三層,兩層用於訓練,一層用於測試。採用庫特徵(丰度、Chao1、d25指數、均勻度、inverse Simpson、豐富度、Shannon熵)作為預測變數,以真值Shannon熵作為應答變數,擬合彈性網路迴歸模型,最後使用交叉驗證進行評估。

三、研究的主要結果及內容

1.多樣性指標的保真度

在文章的第一部分作者首先對多樣性指標的保真度進行了分析。TCR受體的多樣性通常是透過組裝和計數編碼CDR3受體的序列來計算的(圖1)。如今使用組織RNA-seq資料來評估這種多樣性變得越來越普遍(圖1B)。然而,RNA-seq資料集通常具有遠低於TCR 擴增子資料集的CDR3計數,因此有更多的亞抽樣。所以作者首先試圖瞭解這種亞抽樣對多樣性指數的影響程度。作者從假設50個個體的種群開始,觀察了使用Shannon熵和均勻度的多樣性估計中的方差。兩種方法顯示亞抽樣越嚴重,方差越大(圖2A)。接著作者為了評估亞抽樣是否只在較小的種群規模下影響多樣性指數,作者從2 到1億個體中模擬了1000個庫並利用共同的多樣性指標評估多樣性估計的變化然後繪製了真值多樣性指標值與各指數下亞抽樣值的比值(圖2B)。作者發現多樣性的誤差不侷限於Shannon熵和均勻度,也不侷限於取樣不足的樣本。也發現隨著丰度的增加,計算的多樣性指數最終收斂於對真實多樣性的準確估計。此外,儘管先前研究發現在低丰度時均勻度往往會高估多樣性,但作者發現,這種高估在初始多樣性較低的樣本中更為明顯(圖2C)。

圖1 T細胞受體序列的生成和推斷

圖2 亞抽樣對TCR多樣性指標的影響

2.低丰度樣本的熵建模

作者在對多樣性指標的保真度進行分析之後,在文章的第二部分作者針對Shannon熵作為多樣性指數的穩定性試圖推匯出一個模型預測當丰度較低時真正的TCR庫的熵,為此作者使用彈性網路迴歸來建模真值Shannon熵,可以觀察到直接計算Shannon熵展示出與真值適度的相關性但是方差較大(圖3A)。此外,彈性網路模型的相關性更強方差更小(圖3B), 圖3C展示出在不同型別鏈中訓練和檢驗的結果,而圖3D展示在同一型別鏈中訓練和測試的結果。作者也發現當丰度足夠高時,透過直接計算能夠準確估計熵值不需要基於模型修正。接著作者分析了亞抽樣庫對直接計算的根據測量值進行的熵計算的熵的準確性(圖3E),發現確定丰度時需要測量的Shannon熵在真值Shannon熵的5%以內。

圖3 在MiXCR輸出的1000個STIG生成的RNA-seq樣本中應用多樣性指標

3.多樣性指標的一致性

接著在文章的第三部分作者分析了多樣性指標的一致性。在生物樣本上驗證基於模型的修正多樣性測量值是一項艱鉅的任務,因為在這一背景下沒有真值參照。此外,有多個特徵被認為與多樣性相關可以測試與多樣性估計的關聯。先前研究發現TCR的多樣性與年齡成反比,因為可供選擇的TCR庫隨著時間的推移而逐漸喪失。同樣多樣性可能與腫瘤突變成反比,因為突變的數量與新抗原的數量相關,新抗原可以被T細胞靶向。因此,作者假設一個更準確的多樣性指標會與年齡、SNV新抗原和InDel新抗原呈更強的負相關。所以接下來作者對TCGA資料進行分析,發現校正後的TCR鏈的多樣性係數隨年齡和新抗原的變化更接近於-1,且方差較低,顯著性高於其他多樣性指標(圖4A)。相反的由於胸腺是T細胞產生的來源,作者認為胸腺的多樣性比其他任何組織型別都要高,因此胸腺瘤觀察到矯正後的多樣性指標優於其他多樣性指標方差低,係數接近1,顯著性高於任何其他指標(圖4A)。此外,對多樣性的可靠估計也應該傾向內部一致,提供對一系列TCR丰度的相似預測。所以作者為了檢驗多樣性指標的內部一致性,根據樣本丰度將所有TCGA組織隨機分為3個分位數,並使用Cox比例風險迴歸檢驗總生存率和TCR多樣性指標之間的關聯。作者也在3個丰度範圍內進行平均抽樣作為第四組。預測精度估計為每個組織的危險比的上置信區間和下置信區間之間的差值(圖4B,C)。可以觀察到一個內部一致的度量標準應該提供一個跨丰度範圍一致的窄寬度,在均勻度和模型熵的丰度範圍內,置信區間寬度沒有顯著差異,而Shannon熵預測在丰度組之間有顯著差異。綜上所述,這些結果表明基於模型的多樣性估計與真實生物多樣性的相關性提高且內部一致性增強。

圖4 在TCGA腫瘤樣本的每個TCR鏈上計算多樣性指標並與建模的熵測度比較

4.使用TCR模型熵預測患者預後

由於上一部分作者發現基於模型的矯正的多樣性比其他指標提供了更好的生物多樣性相關性,所以在這一部分作者接著提出了這樣一個問題:這種改進的多樣性指標是否能夠提高癌症患者的生存預測?作者發現即使是一個完美的多樣性測度可能也不能預測癌症的生存率。也就是說,假設多樣性的減少應該預示著更好的生存,因為它表明免疫系統正在增強對腫瘤的有效應答。但在TCGA資料中作者發現更高的校正多樣性與更好的存活率相關。此外,作者測試了治療前接受抑制PD-1的單克隆抗體治療的黑色素瘤患者的腫瘤相關T細胞受體多樣性與生存的關係。作者也在另一套與免疫檢查點抑制試驗相關的使用福爾馬林固定石蠟包埋(FFPE)衍生的RNA生成的RNA-seq資料集上觀察到TCR庫多樣性的增加與單抗治療的黑色素瘤患者生存期的改善相關(圖5A)。同樣在TCGA樣本和免疫檢查點抑制試驗相關資料集中觀察到了類似的結果(圖5B,C)。作者也觀察到當α鏈和β鏈的模型熵都很高時,這種效應是最大的。當作者根據患者應答比較TCR多樣性指標時,作者從模型熵來看觀察到應答者表現出顯著更高的多樣性(圖5D)。也可以觀察到非進展組與有應答組表現出相似的差異,但不顯著,非進展組顯示出比進展組更高的TCR模型熵(圖5E)。接下來作者分析TCGA及免疫檢查點抑制試驗相關資料集樣本並量化表明高熵模型預測TCR預測生存的抽樣百分比,結果如圖5F所示。此外,作者計算了這些樣本的中位危險比(圖5G)。這兩個結果都表明,較少的免疫檢查點抑制劑處理的樣本與未治療的樣本獲得相同的預測能力。綜上所述,這些結果表明文中的模型多樣性測度改善了癌症基因組圖譜資料集和PD-1抑制治療的黑色素瘤患者的應答區別。

圖5 使用TCR模型熵預測患者預後

到這裡這篇文章的主要內容就介紹完了,文章作者將研究目光聚焦於T細胞受體庫的多樣性。作者利用模擬資料及TCGA資料對多樣性的指標進行了多角度評估,並透過統計學習得到一個校正的多樣性評估的模型,作者也分析了評估T細胞受體多樣性與生存和抗PD-1治療應答的關係。透過這篇文章我們可以學習到比起泛泛分析針對一個有價值的點進行細緻深入的研究可能更會做出不錯的工作。

13
最新評論
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 普通金屬變黃金,藉助特種細菌技術,真的可以實現一夜暴富嗎?