菲爾茲獎得主、比利時數學家讓·布林甘(Jean Bourgain)被認為是這個時代最具獨創性、最敏銳、最多才多藝的分析學大師之一。
數學家陶哲軒早期受其影響頗多,他曾經這樣概括自己的早期工作:「讀他的論文,學會他的技巧,嘗試做些改進。」
但是,20世紀80年代中期,布林甘提出了一個高維圖形的問題,這個看似簡單的問題竟然伴隨了他的餘生,一直懸而未決。
布林甘提出的問題可以簡單總結為:假設一個凸形的體積為1,單位不重要。如果你嘗試用低一維的平面切開凸形,嘗試所有方法後得到的切片是否都有極小的面積,或者至少有一個面積必須是相當大的?
布林甘猜測,其中一些低維切片一定有相當大的面積,尤其是存在一個與維度無關的「通用常數」,這樣每個形狀都至少包含一個面積大於這個常數的切片。
乍一看,布林甘的猜想顯然是正確的。畢竟,如果這個形狀在各個方向上都非常細小,它怎麼可能有足夠的物質形成一個體積單位呢?
「得了吧,這能有多難?」魏茨曼科學研究所的高維幾何學家Ronen Eldan第一次聽說這個問題時這樣想。「然後,你越想它,你就越明白它有多微妙。」
難點就在於,高維圖形的行為常常違揹我們人類的低維直覺。例如,在尺寸為10及以上的情況下,可以建立一個立方體和一個球,使得立方體的體積大於球,但是每一個穿過立方體中心的切片的面積小於穿過球中心的相應切片的面積。
布林甘的切片猜想是對解決高維問題的一種想法——高維形狀至少在某些方面符合我們的直覺。
90後華人統計學博後跨界解決難題現在,布林甘的猜測得到了證實: 去年11月發表在網上的一篇論文提供了一個非常接近的版本,雖然並沒有證明布林甘的全部猜想,但從所有實際目的來看,它嚴格限制了高維奇異性。
這篇論文作者是Yuansi Chen,瑞士蘇黎世聯邦理工學院的博士後研究生,今年年初,他開始在杜克大學統計科學系擔任助理教授的職位。
主要研究方向是統計機器學習、最佳化以及在神經科學中的應用,尤其對其中域適應性、穩定性、MCMC取樣演算法、卷積神經網路和計算神經科學中出現的統計問題感興趣。
2019年,他在加州大學伯克利分校統計係獲得博士學位。
其博士生導師是著名華裔統計學家、UC伯克利統計系和電子工程與計算機科學系終身教授鬱彬。
在攻讀博士之前,他還在法國Ecole Polytechnique獲得了應用數學專業的工程師文憑。
隨後,前往在蘇黎世聯邦理工學院ETH Foundations of Data Science(ETH-FDS)做博士後研究。
這個有25年曆史的猜想,要求將一個形狀切成兩等分的最佳方法,暗示了布林甘猜想。
更重要的是,KLS猜想是許多統計學和計算機科學問題的核心,例如熱量需要多長時間才能透過凸形擴散,或者一個隨機行走者必須從一個起點走多少步才能到達一個真正隨機的位置。
高維幾何學家Ronen Eldan表示,隨機漫步是對隨機點進行抽樣的唯一有效方法。對於各種各樣的計算機科學問題,「演算法中最重要的子程式是,你要對一個隨機點進行取樣。」
Chen的論文結果對已知的任務演算法執行時間提供了及時的改進,這些任務包括計算凸形體的體積或者從一組機器學習模型中抽取樣本。他的工作並不能完全證明 KLS 猜想。
但是當涉及到計算機科學的應用時,微軟研究院的Sébastien Bubeck說,「你不需要完整的猜想來得到完整的影響。」
Chen並不是幾何學專家,而是一個統計學家,他只是對KLS猜想產生了興趣,因為他想掌握隨機抽樣的方法。
高維幾何領域甚至都沒有人認識他,但他卻解決了困擾很多人數年的難題。
如何把蘋果平均一分為二,還要儘可能保持新鮮?1995年Kannan、Lovász和Simonovits三人提出的KLS猜想關心的問題:用來平分的最小曲面面積是多少?
假設你想把一個凸形體,也許是一個兩頭沒有凹陷的蘋果——切成一樣大小的兩部分,你打算把切開的一半先放在一邊之後再切,但是裸露的表面會氧化變色,讓人倒胃口,所以你要儘可能地讓先切掉的這一塊麵積小一些。那麼,在所有可能的切割方式中,哪種方式暴露的表面最小?
如果只能直線切割,這個問題並不難。但是如果曲線切割,所有情況都會打折扣。在二維空間中,數學家們知道最好的切法永遠是一條直線或一個圓弧。但是在三維空間中,最好的切法只能理解為幾個簡單的形狀,而對於更高維度的形狀,數學家們通常找不到任何最佳切法。
既然最佳切法這麼難確定,Kannan, Lovász和Simonovits就換了一個角度思考,如果只允許直線切割,情況會糟糕到什麼程度。
1995年,他們推測這種限制不會使事情變得更糟,也就是說存在一個通用常數,即最好的平面切割的表面積最多是最好的整體切割表面積的常數倍。
儘管Kannan, Lovász和Simonovits無法證明他們的猜想。他們能做的最好的事情不是建立一個普遍常數,而是建立一個因子,大致計算出形狀存在的維度的平方根。
所以對於一個100維的凸面形狀,他們知道最好的直線切割得到的面積最多是最佳切割的表面積的10倍。
露出10倍的表面積可能聽起來不是很大。但是,由於高維形狀的許多屬性隨著維度的增長呈指數增長,相比之下,一個平方根的增長並不算太多。
但是研究人員急於改進這個結果,而不僅僅是出於學術興趣: 他們知道 KLS 因子包含了很多關於隨機過程在凸形狀中表現如何的資訊。這是因為最好的切口越小,隨機過程就越難以迅速在形狀周圍擴散。
就像啞鈴,兩個巨大的球被一個狹窄的部分連線。你可以用一個很小的切口把它分成兩個相等的部分,這個切口就是一個瓶頸。兩個球中任意一個球的漫步者或者熱源通常需要很長時間才能到達另一個球,因為它必須找到透過瓶頸的路。
當然,啞鈴不是凸的。一個凸起的形狀不可能有一個不成比例的小而平的切口,就像啞鈴上的那個,但是也許它可以有一個不成比例的小的彎曲切口。KLS 猜想實質上是要問一個高維的凸形是否可以包含一個隱藏的、扭曲的啞鈴,它可以減緩隨機混合。
Kannan, Lovász和Simonovits的平方根限制了這些隱藏的啞鈴的極限。在2012年,Eldan 透過引入一種叫做隨機定位的技術降低了他們對維度的立方根的限制,粗略地說,這種技術設想傾斜凸面形狀,使其點向一個方向滑動,直到它們堆積在一個特定的區域。
對於一個高密度的物體,很容易證明 KLS 猜想,這個質量和啞鈴差不多。透過表明傾斜過程並沒有改變太多東西,Eldan能夠計算出一個 KLS 的界限為原始形狀。
幾年後,華盛頓大學的Yin-Tat Lee和Vempala改進了Eldan的隨機區域性化,進一步降低KLS因子,到維度的四次方根。
他們一度認為自己解決了更大的問題。如果維度稱為d,那麼平方根是d1/2,立方根是d1/3,四次方根是d1/4. 透過引入一種叫做 bootstrapping 的新技術,Lee(下圖左)和 Vempala(下圖右)認為他們可以將 KLS 的邊界降低到d,升高到0的冪加上一點容差係數。
由於d0總是等於1,Lee和Vempala似乎證明了KLS因子是一個與維度無關的常數。
他們在arXiv上釋出了他們的論文。但是幾天後,這篇文章就被人發現了一個缺陷,他們關於d0的證明是錯的。
之後,二人修改了文章,把界限重新調整到d1/4. 幾年來,研究人員認為KLS猜想的探索已經到此終結了。
邊界切片Lee和Vempala的論文引起了Chen的注意,當時他還是UC伯克利的統計學研究生,正在研究隨機抽樣方法的混合率。隨機抽樣在許多型別的推論統計學中都是一個關鍵因素,比如基於新證據更新信念的框架——貝葉斯統計。
「如果你想做貝葉斯統計的話,你每天都要處理這樣的隨機抽樣。」
Lee 和 Vempala 的論文將Chen引入了隨機區域性化的概念。他表示:「這是我一段時間以來見過的最漂亮的驗證技術之一。」
Chen研究了很多文獻,花了幾個星期的時間試圖填補Lee和Vempala的證據空白,但是沒有用。在接下來的幾年裡,每隔一段時間,他就會想到一些如何修正隨機定位的想法。
最後,他想到了一種方法,不是去證明 Lee和Vempala的證明中缺失的陳述,而是繞過需要這樣一個強有力的陳述。
基於Lee和Vempala的bootstrapping方法,Chen提出使用遞迴方法來降低 KLS 邊界。他的想法是:如果你可以讓邊界非常小,那麼就有方法讓邊界更小。
在反覆的應用中,他所使用的bootstrapping方法實現了 KLS 猜想與布林甘截面問題的近似恆定邊界。
當Chen把他的研究結果發表在網上後,很多研究員看到後都持謹慎態度,因為之前錯誤的證明也出現過,而且Chen根本不是幾何學家,數學界的研究人員聽都沒聽過他。
但是,在魏茨曼科學研究學院的數學家Bo’az Klartag看過Chen的論文後,說:我基本上立即停止了我正在做的一切事情,並檢查了這篇論文。這篇論文是100%正確的!
Chen的研究結果顯示,凸形的最佳對半切口並沒有比最佳的平切口要小很多;也就是說,高維凸形不包含帶有非常窄的橋樑的隱藏啞鈴。
從實際的角度來看,這意味著:隨機遊走混合凸形的速度一定比研究人員之前證明的速度要快得多。
Chen的研究成果明顯減少了已知演算法在執行任務方面的執行時間,這些任務包括計算凸形體積,或從各種機器學習模型中取樣等。
這將有助於計算機科學家在不同的隨機取樣技術之間進行優先順序排序:找出最基礎的隨機遊走在何時表現最佳,以及更復雜但計算成本更高的演算法在何時會表現更好。
Chen的工作並不能完全證明 KLS猜想,但在計算機科學應用領域,即使沒有完全證明該猜想,Chen的研究也有潛力產生巨大的影響力。
布林甘曾經告訴特拉維夫大學數學教授Vitali Milman,他在這個問題上花費的時間和精力遠超過其他任何問題。
甚至在他去世的前幾個月,還曾經詢問Milman,這一猜想是否有進展,他想在離開之前知道答案。
但是直到2018年年底布林甘去世,他都沒能等到一個解決方案。
不過,Chen的成果出來後,大家都覺得,如果布林甘還在世,他一定會為Chen的成果激動不已,甚至可能會想「我怎麼會沒注意到呢?」
參考資料:
https://www.quantamagazine.org/statistics-postdoc-tames-decades-old-geometry-problem-20210301/