2014年7月17日上午,德國一位鮮為人知的退休統計學家托馬斯·羅伊恩(Thomas Royen)在刷牙時,突然發現了一個關於幾何、機率論和統計學交叉領域的著名猜想的證明,幾十年來,頂尖專家一直在研究這個猜想。
這個猜想被稱為高斯相關不等式(GCI),起源於20世紀50年代,在1972年以最優雅的形式提出,並一直使數學家們為之著迷。賓夕法尼亞州立大學(Pennsylvania State University)的統計學家唐納德·理查茲(Donald Richards)說,“我知道有人在這方面工作了40年。”“我自己在這上面工作了30年。”
在如何證明高斯相關不等式的“原始想法”出現在他的腦海之前,羅伊恩並沒有對它進行太多思考。他以前是一家制藥公司的僱員,1985年,為了有更多的時間改進他和其他行業統計學家用來解釋藥物試驗資料的統計公式,他去了德國賓根的一所小型技術大學。2014年7月,作為一名67歲的退休人員,羅伊恩仍在研究他的公式,他發現GCI可以拓展到他很擅長的一個統計分佈中去。17日上午,他看到了如何計算這個擴充套件的GCI的關鍵導數,從而解開了這個證明。“今天晚上,我的初稿就寫好了,”他說。
由於不知道數學中的文字處理軟體LaTeX,他在微軟word中輸入了他的計算結果,然後在接下來的一個月裡,他把他的論文發表在了學術預印本網站arxiv.org上。他還把它寄給了理查茲,而理查茲在一年半前曾短暫的將自己失敗的證明過程發給圈內人傳閱。理查茲說:“這篇文章是他透過電子郵件發給我的。”“當我看到它的時候,我立刻知道它解決了。”
理查茲說,看到這個證明,“我真的很自責。”幾十年來,他和其他專家一直在用越來越複雜的數學方法攻克GCI,並肯定需要在凸幾何、機率論或分析方面大膽的新想法來證明這一點。一些數學家經過多年徒勞的努力,開始懷疑這個不等式實際上是錯誤的。然而最終,羅伊恩的證明是簡短而簡單的,只填了幾頁紙,使用了經典的數學技巧。理查茲很震驚,他和其他人都沒想到。“但另一方面,我也必須告訴你,當我看到它時,我鬆了一口氣,”他說。“我記得我心裡想,我很高興能在死前看到它。”他笑了。“真的,我很高興我看到了它。”
理查茲通知了幾位同事,甚至幫助羅伊恩用軟體重新列印,使論文顯得更專業。但理查茲和羅伊恩聯絡的其他專家似乎對他的戲劇性宣告不屑一顧。幾十年來,關於GCI的虛假證據反覆出現,包括2010年以來出現在arxiv.org網站上的兩個。
名不見的作者一開始會被忽視,但通常不會持續太久:專家們說,像羅伊恩這樣的重要論文通常會被提交,然後在《統計年鑑》(Annals of Statistics)之類的地方發表,然後所有人都會聽說它。但是,羅延選擇了跳過要求很嚴格的頂級期刊,頂級期刊稽核緩慢且往往要求很高的同行評議過程。他選擇了在印度阿拉哈巴德的《遠東理論統計雜誌》(Far East Journal of Theoretical Statistics)上迅速發表文章,這是一份專家們基本不知道的期刊。
最後,在2015年12月,波蘭數學家Rafał Latała和他的學生Dariusz Matlak發表了一篇論文來宣傳羅伊恩的證明,並以一種一些人認為更容易理解的方式對其進行了調整。現在訊息傳開了。海德堡理論研究所(Heidelberg Institute for Theoretical Studies)的統計學家蒂爾曼·格內廷(Tilmann Gneiting)表示,2016年7月,也就是GCI被證明的兩年後,他很震驚。
沒有人確切知道,在21世紀,羅伊恩的證明為什麼傳播得如此緩慢。克拉塔格說:“在一個資訊交流非常容易的時代,這顯然是缺乏交流。”
“但無論如何,至少我們找到了它,”他補充道,“它很美。”
GCI最著名的形式是在1972年提出的,它將機率論和幾何學聯絡到了一起:它在擲飛鏢遊戲中,包括更高維度的假想飛鏢遊戲中,給飛鏢的位置機率確立了一個下限。
想象兩個凸多邊形,如一個矩形和一個圓,現在將兩者重合的中心點作為中心目標。擲向目標的飛鏢將以鐘形曲線或“高斯分佈”的形式圍繞中心點降落。高斯相關不等式表示飛鏢同時落在矩形和圓形內的機率總是等於或大於它落在矩形內的機率乘以它落在圓形內的機率。簡單地說,因為兩個形狀重疊,所以,投中其中一個時,投中另一個的機率也會提高。而且,只要中心點重合,任意維度的任意兩個對稱凸多邊形,都適用於這一原則。
GCI的一些特例已經被證明——例如,在1977年,弗吉尼亞大學的羅蘭·皮特(Loren Pitt)證明了它適用於二維凸形——但所有試圖證明它的數學家都無法證明一般情況。1973年,皮特在新墨西哥州阿爾伯克基的一次會議上與同事共進午餐時,第一次從同事口中得知了這個不等式。自此他就一直在嘗試。他說:“作為一名傲慢的年輕數學家……我很震驚,那些把自己視為受人尊敬的數學和科學人士的成年男性竟然不知道這個答案。”他把自己鎖在汽車旅館的房間裡,確信自己會在出來之前證明或反駁這個猜想。“大約50年後,我仍然不知道答案,”他說。
儘管數百頁的計算毫無結果,皮特和其他數學家還是確信——並將他的二維證明作為證據——GCI的凸幾何框架將導致一般性的證明。皮特說:“我已經形成了一種思考這個問題的概念性方式,或許我過於執著於此了。”“而Royen所做的與我的想法完全相反。”
Royen的證明可以追溯到他在醫藥產業的從業經歷,以及高斯相關不等式本身鮮為人知的起源。在以“對稱凸多邊形”這種表述出現以前,GCI於1959年就誕生了,美國統計學家奧利弗·多恩(Olive Dunn)提出這一不等式,用來計算“同步置信區間”,即多個變數會同時落入的估計區間。
假設您要根據測量樣本估算給定人口中95%的體重和身高範圍。如果在x – y圖上繪製人們的體重和身高,則體重將沿x軸形成高斯鐘形曲線分佈,而高度將沿y軸形成鐘形曲線。重量和高度一起遵循二維鐘形曲線。然後您可以問,體重和身高範圍是多少-稱它們為– w < x < w和– h < y < h –使得95%的人口將落入由這些範圍形成的矩形內?
如果重量和身高是獨立的,則只需計算給定重量落入– w < x < w以及給定身高落入– h < y < h的各個機率,然後將它們相乘即可得出兩個條件都滿足的機率。但是體重和身高是相關的。與飛鏢和重疊形狀一樣,如果某人的體重落在正常範圍內,則該人更可能具有正常的身高。Dunn概括了三年前提出的不等式,推測如下:兩個高斯隨機變數同時落在矩形區域內的機率始終大於或等於每個變數落入其指定範圍內的各個機率的乘積。(這可以概括為任意數量的變數。)如果變數是獨立的,則聯合機率等於各個機率的乘積。但是變數之間的任何相關性都會導致聯合機率增加。
羅伊恩(Royen)發現,他可以將GCI泛化為不僅適用於隨機變數的高斯分佈,而且還適用於與高斯分佈的平方相關的更一般的統計分佈,稱為伽馬分佈,在某些統計檢驗中使用該分佈。他說:“在數學中,似乎經常可以透過回答一個更普遍的問題來解決一個看似困難的特殊問題。”
他對伽瑪分佈的熟悉激發了他在刷牙時的靈感。他知道他可以運用經典的技巧將其功能轉換為更簡單的功能。突然,他意識到此變換函式的導數等效於原始函式的導數的變換。他可以很容易地證明,後者的導數始終是正的,證明了GCI。皮特說:“他的公式使他能夠發揮自己的魔力。” “而且我沒有公式。
專家們說,統計學專業的研究生都能看懂證明過程。羅伊恩(Royen)表示,這個“出奇簡單的證明方法……也許能鼓勵年輕學子發揮創造力,發現新的數學定理,”因為“有時候,你並不需要非常高的理論水平”。
不過,一些研究人員仍然希望從幾何學角度來證明GCI。羅恩的分析證明實際上使凸幾何學中出現了一些令人匪夷所思的新現象,而通過幾何學的證明途徑,這些現象或許才可以得到解釋。皮特還指出,GCI定義了重疊凸多邊形表面向量之間的有趣關係,這有望發展成凸幾何學中一個新興的子領域。“至少現在我們知道,(這種向量之間的關係)是成立的。”不過,“如果能從幾何學角度理解GCI,我們就能解開現存的一類難題。”
理查茲說,除了GCI的幾何含義外,不等式的變化可以幫助統計學家更好地預測股價等變數隨時間波動的範圍。在機率論中,GCI證明現在允許精確計算“小球”機率中出現的速率,這與粒子在流體中運動的隨機路徑有關。理查茲說,他推測了一些擴充套件GCI的不等式猜想,他現在可能會嘗試用羅伊恩(Royen)的方法來證明。
Royen的主要興趣在於改進許多統計測試中使用的公式的實際計算——例如,根據對幾個變數的測量來確定一種藥物是否會導致疲勞,比如病人的反應時間和身體的擺動。他說,拓展後的GCI確實能改進醫藥領域的統計工具,最近,他的另一些GCI相關研究也帶來了現實中的改進。GCI猜想得到證明後,並沒有引起轟動,羅伊恩也並沒有特別失望或驚訝。“我習慣了經常被德國(頂級)大學的科學家忽視,”他在一封電子郵件中寫道。“我沒有‘社交’的天賦,也沒有很多聯絡人。我不需要這些東西來提高我的生活質量。”
能夠證明一個重要猜想,這件事本身就讓羅恩產生了“深刻的喜悅和感激之情”,他覺得這就已經足夠。
“它就好像某種恩賜。”他說,“我們可能在一個問題上費了很長時間,突然有一天,神經元的神秘運作就像天使一般,帶來一個絕妙的點子。”