首頁>科學>

一、什麼是引力波?

愛因斯坦最迷人的理論,莫過於時空結構與萬有引力之間的關係。他認為,三維空間與一維時間其實是四維時空中的一個截面,而我們所說的萬有引力正展現了四維時空的幾何特性。把這個理論簡化成二維的面,就很好理解了。一張平面的紙和一個球的外表面都是二維表面。紙面的內蘊幾何是平坦的,而球面是彎曲的。那麼,對於生活在面上的螞蟻,如何才能得知自己生活在紙面還是球面上呢?你可以畫出兩條長長的直線,它們的起點彼此接近,並向平行的方向延伸。在紙面上,這樣的兩條直線會永遠保持平行,而在一個球面上,兩條直線會逐漸匯聚,並在經過πR/2的距離後相交(R是球面的半徑)。紙面和球面上的直線都是自由落體在時空中的軌跡。與牛頓定律不同,愛因斯坦認為,四維時空中的直線正是不受外力的物體靜止或勻速運動時(也就是「自由下落(free fall)」)的軌跡。在三維空間中沿著拋物線下落的炮彈軌跡,在四維時空中是一條直線;圍著太陽旋轉的地球軌跡,在時空中也是一條直線。

二、如何探測引力波?

在人類探測引力波的半個世紀歷程中,科學家們開發出了各種不同的探測技術。對引力波的直接探測,主要有三種不同的方法,分別針對三個不同的波段。

1、10Hz~1kHz:鐳射干涉測量這是目前探測的最高頻波段。這個波段主要來源於旋轉的中子星或雙黑洞系統合併前以及合併過程中產生的引力波。對這個波段主要採用的方法是鐳射干涉測量(Laser Interferometry),包括前短時間震驚世界的LIGO(the Laser Interferometer Gravitational- Wave Observatory),還有歐洲的處女座干涉儀(Virgo Project)。LIGO探測儀位於兩個地方——美國華盛頓州的漢福德和路易斯安那州的利文斯頓,處女座的探測儀則位於義大利的卡希納。鐳射干涉的工作原理是什麼呢?如下圖所示,一束超穩定鐳射射向一個分光鏡(beamsplitter),平均分為兩束垂直的光線,經過3~4公里之後,光線再被反射回分光鏡。反射回來的兩束光線重新混合在一起,並進行觀測。這束重新混合的光的強度與兩束光返回的時間差的餘弦成一定的比例。路程中的引力波擾動會影響光線返回的時間,從而影響重新混合的光強。

2、0.01mHz~1Hz:航天器多普勒追蹤(Spacecraft Doppler Tracking)這個波段的目標非常豐富。數以千萬計的白矮星雙星系統都位於這個波段,它們輻射出的引力波可以被將來的鐳射干涉空間天線(LISA)專案探測到——這個專案仍在設計階段,計劃於2034年投入執行。白矮星在電磁波中非常黯淡,所以目前很難觀測。預計,將來用引力波觀測到的白矮星數量將大大超過電磁波觀測到的數量。但由於地面鐳射干涉儀難以達到該波段的精度,因此只能將探測任務放在太空中,這就是LISA專案。LISA將由三個相同的航天器組成一個邊長為500萬千米的等邊三角形,位於與地球相同的日心軌道。它的原理與鐳射干涉類似,你可以把每個航天器想象成一個分光鏡,而另外兩個是反射鏡。

3、1nHz~1μHz:脈衝星計時陣(Pulsar Timing Arrays)

引力波的探測需要極高的精度。在前兩個波段,人們依靠的都是鐳射相位,而在1nHz~1μHz波段,人們使用的是大自然創造的精密時鐘——脈衝星計時陣(PTA),也就是毫秒脈衝星(MSP)組成的網路,它們的脈衝可以長時間保持穩定,適用於探測時間特徵以天或年計的引力波。目前正在進行的專案有歐洲PTA,北美Nanohertz引力波天文臺和帕克斯天文臺。

三、機器學習在引力波天文學中的應用

1、識別噪聲1)非平穩噪聲:卡爾曼濾波機器學習最早應用在引力波資料分析中,是為了追蹤鐳射干涉儀資料中的某些譜線特徵。干涉儀中的鏡子懸掛在極細的電線上,而電線總是因為熱力等因素而不停地振動。這種「小提琴模式」的振動也會讓鏡子發生振動,從而在資料中產生噪聲。針對這種噪聲,一般使用的是卡爾曼濾波(Kalman filter)的方法,來跟蹤和預測這種「小提琴模式」噪聲的強度和相位,從而將其從資料流中去除出去。卡爾曼濾波是一種高效率的遞迴濾波器(自迴歸濾波器),它能夠從一系列的不完全及包含噪聲的測量中,估計動態系統的狀態。卡爾曼濾波的一個典型例項是從一組有限的、包含噪聲的、透過對物體位置的觀察序列(可能有偏差)預測出物體的位置座標及速度。在很多工程應用(如雷達、計算機視覺)中都可以找到它的身影。同時,卡爾曼濾波也是控制理論以及控制系統工程中的一個重要課題。例如,對於雷達來說,人們感興趣的是其能夠跟蹤目標。但目標的位置、速度、加速度的測量值往往在任何時候都有噪聲。卡爾曼濾波利用目標的動態資訊,設法去掉噪聲的影響,得到一個關於目標位置的好的估計。這個估計可以是對當前目標位置的估計(濾波),也可以是對於將來位置的估計(預測),也可以是對過去位置的估計(插值或平滑)。

2)短時脈衝波干擾:神經網路,支援向量機,隨機森林……位於地面的鐳射干涉儀不僅受到上述有色高斯噪聲的干擾,還會遭受非高斯的短時脈衝波干擾(glitch),這種干擾與物理環境有關,例如火車造成的震測雜波、飛機的聲波、磁場干擾、電源瞬變、散射光、穿越光束的灰塵等,還有可能來自於裝置故障。為了探測這種短時干擾,每個探測器都會記錄下幾百個輔助頻道的時序資料。這些輔助頻道負責追蹤干涉儀中那些重要的非引力波自由度以及周邊環境的訊號。LIGO探測器的主要目的是探測雙黑洞合併或超新星核心坍縮等事件產生的瞬時引力波訊號,這種訊號很容易與短時脈衝波干擾混淆。所以,必須開發出有效的方法來去除短時脈衝波干擾。近年來,研究者嘗試了許多方法來解決這個問題,例如多維度分析法(multidimensional classification analysis),透過小波分解(wavelet decomposition)來解決短時脈衝波干擾,採用為多元時間序列設計的分析方法進行分類。有的研究者將最長公共子序列(LCS,Longest Common Subsequence)用在非監督式分類上,用於對短時脈衝波的波形進行分類。LIGO還曾使用一種叫做命令否決列表(OVL,Ordered Veto List)的演算法來檢測短時脈衝波,這種演算法旨在測算引力波候選訊號與某一個輔助頻道中的瞬時裝置擾動之間的相關程度。具體而言,就是用輔助頻道中的事件構建一個時間序列的表單,然後根據特定的否決方法,在引力波頻道探測到的引力波候選訊號中去除掉上述表單。LIGO科學合作組織(LSC)在中國大陸唯一的成員——清華大學LIGO工作組負責人曹軍威教授向機器之心分享了他於2013年參與的一項用機器學習來否決引力波噪聲的研究《Application of machine learning algorithms to the study of noise artifacts in gravitational-wave data》,該項研究的目的正是探討機器學習方法是否能夠成功地將引力波訊號從LIGO探測到的其他噪聲中區分開來。在這項研究中,研究者測試了三種機器學習的方法來識別和分類LIGO探測器中的短時脈衝波干擾。這三種方法分別是人工神經網路(ANN)、支援向量機(Support Vector Machines)和隨機森林(Random Forests),發現三種方法都能得到相同的最優解,其中以隨機森林最有效。這項研究使用的資料是LIGO漢福德2005年2月至3月(LIGO第4次執行,即S4)以及LIGO利文斯頓2010年5月至6月(LIGO第6次執行,即S6)的資料。之所以採用兩次時間和地點都不同的測試,是因為這有助於檢驗分析演算法的適應性和魯棒性。分類是機器學習演算法的主要用處,這項研究的目的正是用機器學習對資料進行分類,將探測到的資料分為兩類,分別是第一類(短時脈衝波干擾,Class 1)和第二類(也就是「乾淨」的資料,Class 0)。研究者首先用KleineWelle分析演算法將各頻道記錄下的時序資料簡化為一組非高斯的瞬時事件——KleineWelle是一個單天文臺探測器頻道事件提取軟體,基於二進小波變換(Dyadic Wavelet Transform),將經過白化的頻道時間序列投射到時移的多尺度基底上,然後根據小波係數再對時頻平面上若干區域性化的訊號能量進行閾值選擇和聚類,最終聚類出的每一個類被稱為一個事件。它具有良好的時頻區域性化特性,因此能有效地從任意探測器頻道的資料流中捕獲各種事件訊號。然後,再將這些事件按照統計顯著性ρ進行排序。除ρ之外,每個頻道還貢獻4個數據。以下就是他們採用的三種機器學習方法:

人工神經網路:人工神經網路(ANN)是一種機器學習的技術,模仿人腦神經網路進行資料處理。人腦中包含大量的神經元,每一個神經元都只能進行簡單的計算,但它們組成的網路卻可以完成極其複雜的任務,包括語音識別和決策等。每個神經元由樹突、細胞體和軸突三部分組成。樹突接收其他神經元傳來的外部刺激,細胞體計算該訊號。當刺激的強度超過突觸的閾值時,神經元就會放電,用軸突向其他神經元傳遞資訊。這個過程可以用一個簡單的數學模型來模擬,模型包括節點、網路拓撲結構和適應特定資料處理任務的學習規則。每個節點的特徵包括相連的節點數量以及每個輸入和輸出的權重。網路拓撲結構則是由神經元(即節點)之間的連線來定義的。學習規則則描述了權重的產生和演化方式。ANN有許多模型和結構。在這項研究中,研究者選擇的是被廣泛使用的多層感知機(multilayered perceptron,MLP)模型。MLP擁有輸入層、輸出層和二者之間的隱藏層。他們還使用了一種反向傳播演算法的改進版本。除此之外,他們還發現,輸入變數的絕對值更高時,會對輸出值產生更大的影響,因此他們預先對特徵向量的所有組成部分都進行了歸一化處理,將其範圍限定在0和1之間。這樣的處理提高了ANN識別短時脈衝波干擾的能力。

支援向量機:支援向量機(Support vector machines,SVM)主要用於向量空間內的二元分類,它能夠根據訓練資料找出一個最優的高維分類曲面。這個高維曲面再被用在特徵空間中作為一個決策面,根據事件處於它的哪一邊來對事件進行分類。在這項研究中,研究者採用徑向基函式作為核函式,並使用了開源的LIBSVM(由臺灣大學林智仁教授等開發的SVM模式識別與迴歸的軟體包)。

隨機森林:隨機森林(Random Forest technology, RF)來源於經典的決策樹。分類決策樹在特徵向量的每個維度上都會分裂成兩個分支。在機器學習中,可以用一組已知資料來訓練決策樹。在訓練過程中,每次分裂都會對維度和閾值進行選擇,以便實現某種標準下的最大化。當分裂不能再改進最佳化判據,或到達某個分支上所允許的限值時,分裂就停止了,此點上的分支就成為一片葉子(leaf)。當決策樹形成後,就可以把分類未知的事件輸入決策樹,根據事件的特徵向量,它會被標記為Class 0或者Class 1。但是,單個決策樹有可能會遇到過度訓練等問題。為此,研究者採用了一個決策樹組成的森林(包括100棵樹,64個隨機選擇的特徵,每片葉子上至少8個樣本)來平均化它們的結果。這樣,排序的結果就會位於Class 0和 Class 1之間的一個連續統,而不僅是一個二元化的簡單分類。

結果顯示,在實際應用中,這三種機器學習分類方法在誤警(false alarm)的機率上都具有很高的有效性。其中,隨機森林的有效性最高。在真實的應用中,需要檢驗的頻道數量極其龐大,即使在資料簡化之後,特徵空間的維度都還高達1250,使得分類工作極其艱難。但這些機器學習的分類方法能處理龐大的特徵數,並且具有很高的魯棒性,能夠檢測大量的輔助頻道(即便它們並不 相關或者是冗餘的)。因此,研究者證明了機器學習的方法可以用來開發高效實時的引力波檢測工具。

3)未來的方向

LIGO和Virgo探測器記錄著成千上百的資料頻道,這些資料為我們提供了理解短時脈衝波干擾及其成因的好機會。由於資料過於龐大,無法用人力進行檢驗。因此,開發自動檢驗和監督式/非監督式學習技術(尤其是主成分分析或獨立成分分析)非常重要,不僅可以對資料流中的短時脈衝波干擾進行成因分析,還能揭示出隱藏的探測器故障,並識別出那些值得用人力進行監測的資料頻道。

2、響應函式評估

LISA的引力波響應涉及到一個與時間有關的多普勒資料流組合。這個資料流組合與航天器之間的相對速度和加速度有關,而這又是由多普勒資料決定的。相對速度和加速度還受到航天器天線週期性重指向(repointing)的微妙影響——每隔一段時間,天線就需要重新指向,因為它們需要和地球保持聯絡。然而,每次天線重指向之後,我們就失去了關於LISA響應的知識,需要重新計算。

隨著資料量越來越多,天線重定向之後對LISA響應的重新評估就可以用機器學習的方法來解決。實際上,LISA在重指向之後的敏感性並不依賴於時間——只不過我們對LISA響應的知識是依賴於時間的,就會造成延遲。如果我們可以接受這種延遲,那麼每一組重指向後的資料集都可以被用在後驗分析中。但是,要接受這種延遲通常需要犧牲LISA的科學潛力,比如說會推延引力波暴的識別,這將使我們錯失讓傳統望遠鏡及時轉向和搜尋相應電磁現象的好機會。如果採用機器學習,將省去這個惱人的延遲,實現響應函式的自動評估。

1)超大質量雙黑洞系統

正如本次LIGO的成果一樣,LISA也將探測質量在45~75倍太陽質量之間的雙黑洞系統。LISA能在它們合併前的數月甚至數年探測到它們。這些黑洞的能量將以引力波的形式釋放出來,最終合併成一個更大的黑洞。在它們合併之前,LISA將累積龐大的探測資料。有了這些資料,黑洞系統的質量、距離、位置、預計合併時間等性質,都將隨著資料的增加而逐漸清晰,讓我們有時間將電磁波望遠鏡指向那個天區,觀測這場罕見的星際大撞車帶來的電磁波事件。對這些資料進行合理的分析,也是LISA專案成功的關鍵之所在。在這種分析中,機器學習大有可為。

正如之前所提到的,LISA正式上線之後,將觀測白矮星雙星系統發出的引力波訊號。在幾千萬個雙星系統中,我們將辨認出幾萬個系統的訊號,剩下的幾千萬個系統的訊號將被看做是瀰漫性的引力波背景,該背景的強度將被用來繪製這些雙星系統的空間及演化圖譜。隨著時間的推移,分辨出來的單個系統和未分辨出 單個系統的瀰漫性背景的資料都將持續增加。例如,引力波背景最初可能被看成是空間各向同性且光滑的,隨著資料的累積,它會逐漸展示出與銀道面相關的特徵。而那些可分辨的單個引力波來源,也會隨著資料的累積而向世人顯露出它們的週期和位置等資訊,描繪出銀河系的三維圖景。在這個過程中,機器學習也將非常適合解決這種不斷累積的資料分析工作。

我們相信,機器學習作為一種先進的資料處理工具,不僅能給我們帶來更好的日常工具(如語音和影象識別),讓我們的生活更加便利,也能在理解宇宙的宏大篇章中立有一席之地,幫助我們從紛繁糾結的資料中過濾出那珍寶一般的資訊,揭開宇宙的終極秘密。

12
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 《時間簡史》| 一個人的處境不可能比他人更優越的物理學解釋