楊-米爾斯(Yang-Mills)理論,是現代規範場理論的基礎,20世紀下半葉重要的物理突破,旨在使用非阿貝爾李群描述基本粒子的行為,是由物理學家楊振寧和米爾斯在1954年首先提出來的。這個當時沒有被物理學界看重的理論,通過後來許多學者於1960到1970年代引入的對稱性自發破缺與漸進自由的觀念,發展成今天的標準模型。這一理論中出現的楊-米爾斯方程是一組數學上未曾考慮到的極有意義的非線性偏微分方程。
它起源於對電磁相互作用的分析,利用它所建立的弱相互作用和電磁相互作用的統一理論,已經為實驗所證實,特別是這理論所預言的傳播弱相互作用的中間玻色子,已經在實驗中發現。楊-米爾斯理論又為研究強子(參與強相互作用的基本粒子)的結構提供了有力的工具。在某種意義上說,引力場也是一種規範場。所以這一理論在物理中的作用非常重要。
簡單的說,楊-米爾斯理論把外爾發現的可交換群(阿貝爾群)的規範理論(應用於電磁理論)拓展到了不可交換群(非阿貝爾群),因此它又叫非阿貝爾規範場論。拓展後的非阿貝爾規範場論最後成功的描述了電弱相互作用和強相互作用,是粒子物理標準模型的基礎。
大家也知道楊振寧和李政道先生因此斬獲了全球華人的第一個諾貝爾獎,然而,對楊振寧關注多一點的人就會經常聽到這樣一個說法,說宇稱不守恆雖然為楊振寧贏得了物理學界至高無上的諾貝爾獎,但這並不是他的最高成就,楊先生最大的貢獻是楊-米爾斯理論。
這下子很多人就懵圈了。楊-米爾斯理論是啥?上學的時候老師肯定沒講過,去百度上搜,搜出來結果更是一頭霧水,那都是隻有懂的人才能看得懂的東西。隱隱約約能感覺到楊振寧先生好像做了什麼非常了不起的工作,但是要具體說他做了啥,在科學上有啥意義,就迷糊了。
那楊-米爾斯理論到底重不重要?重要,當然重要,絕對的重要,這是現代規範場論和粒子物理標準模型的基礎。在講宇稱不守恆的時候我就說過,楊-米爾斯理論是一個背景更加宏大的故事。宇稱不守恆雖然也影響了物理學的方方面面,但是我們把它單獨拎出來還是馬馬虎虎能講清楚的,而楊-米爾斯理論就不一樣了,想要把它搞清楚,我們得把視角上升到整個物理學發展的高度上來,因為這是一個跟物理學主線密切相關的故事。
物理學家到底在研究什麼?
大自然中有各種各樣的現象,有跟物體運動相關的,有跟聲音、光、熱相關的,有跟閃電、磁鐵相關的,也有跟放射性相關的等等。物理學家們就去研究各種現象背後的規律,然後他們得到了一堆關於運動啊,聲學、光學、熱學之類的定律,然後物理學家們就滿意了麼?
當然不滿意,為啥?定律太多了!
你想想,如果每一種自然現象都用一種專門的定律來描述它,那得有多少“各自為政”的定律啊。於是物理學家們就想:我能不能用更少的定律來描述更多的現象呢?有沒有可能有兩種現象表面上看起來毫不相關,但是在更深層次上卻可以用同一種理論去描述?有沒有可能最終用一套理論來描述所有的已知的事情?
這個事情,本質上就跟秦始皇要統一六國一樣,我決不允許還有其他六個各自為政的國家存在,必須讓所有人遵守同樣的法律,服從同一個政令,用同樣的語言和文字,這樣才和諧。物理學家的統一之路,也是這樣浩浩蕩蕩地開始的。
牛頓統一了天上和地上的力,麥克斯韋統一了電、磁、光。到了19世紀,隨著人們對微觀世界研究的深入,許多在宏觀上風牛馬不相及的東西,在微觀層面上卻很好的統一了起來。比如我們熟悉的支援力、彈力、摩擦力之類的東西,在宏觀上它們確實是不同的東西,但是到了微觀一看:這些雜七雜八的力全都是分子間作用力造成的,而分子間作用力本質上就是電磁力。並且,這些分子、原子運動的快慢,在宏觀層面上居然體現為溫度,然後熱現象就變成了一種力學現象。
於是,到了19世紀末,人類所有已知現象背後的力就都歸結為引力和電磁力,其中引力由牛頓的萬有引力定律描述,電磁力由麥克斯韋方程組描述。但尷尬的是,麥克斯韋方程組和牛頓力學這套框架居然是矛盾的,那麼到底是麥克斯韋方程組有問題還是牛頓力學的這套框架有問題呢?
愛因斯坦說麥克斯韋方程組沒毛病,牛頓的框架有問題。於是愛因斯坦升級了一下牛頓的這套框架,在新框架下繼續跟麥克斯韋方程組愉快的玩耍,這套升級後的新框架就叫狹義相對論。
在狹義相對論這個新框架裡,麥克斯韋方程組不用做任何修改就能直接入駐,這是一等公民。另外,牛頓力學裡有些東西無法直接搬過來,但是稍微修改一下就可以很愉快的搬到這個新框架裡來,比如動量守恆定律(直接用牛頓力學裡動量的定義,在狹義相對論裡動量是不守恆的,需要修改一下就守恆了),這是二等公民。還有一類東西,無論怎麼改都無法讓它適應這個新框架,這是刁民。
刁民讓人很頭痛啊,不過還好,雖然有刁民,但是刁民的數量不多,就一個:引力。牛頓的萬有引力定律在牛頓力學那個框架裡玩得很愉快,但是它骨頭很硬,不管怎麼改,它就是寧死不服狹義相對論這個新框架,那要怎麼辦呢?當然,我們可以繼續改,我們相信雖然現在引力它不服,但是以後總能找到讓它服氣的改法。但是愛因斯坦另闢蹊徑,他說引力這小子不服改我就不改了,然後他另外提出了一套新理論來描述引力,相當於單獨給引力蓋了一棟別墅。結果這套新引力理論極其成功,而且愛因斯坦提出這套新理論的方式跟以往的物理學家們提出新理論的方式完全不一樣,這種新手法帶來夢幻般的成功驚呆了全世界的物理學家,然後愛因斯坦就被捧上天了,這套新理論就叫廣義相對論。
愛因斯坦用廣義相對論馴服了引力,用狹義相對論安置好了電磁力之後,接下來的路就很明顯了:統一引力和電磁力,就像當年麥克斯韋統一電、磁、光那樣,畢竟用一套理論解釋所以的物理現象是物理學家們的終極夢想。但是,愛因斯坦窮盡他的後半生都沒能統一引力和電磁力。不僅如此,隨著實驗儀器的進步,人們撬開了原子核,在原子核內部又發現了兩種新的力:強力和弱力。
這下可好,不但沒能統一引力和電磁力,居然又冒出來兩種新的力。所以,我們現在的局面變成了有四種力:引力、電磁力、強力和弱力。其中,引力用廣義相對論描述,電磁力用麥克斯韋方程組(量子化之後用量子電動力學QED)描述,強力和弱力都還不知道怎麼描述,統一就更別談了。
到了這裡,我們這篇文章的主角楊-米爾斯理論終於要登場了,我先把結論告訴大家:現在強力就是用楊-米爾斯理論描述的,弱力和電磁力現在已經實現了完全的統一,統一之後的電弱力也是用楊-爾斯理論描述的。也就是說,在四種基本力裡,除了引力,其它三種力都是用楊-米爾斯理論描述的,所以你說楊-米爾斯理論有多重要?
同時,我們也要知道,楊-米爾斯理論是一套非常基礎的理論,它提供了一個非常精妙的模型,但是理論本身並不會告訴你強力和電弱力具體該怎樣怎樣。蓋爾曼他們把楊-米爾斯理論用在強力身上,結合強力各種具體的情況,最後得到的量子色動力學(QCD)才是完整描述強力的理論。格拉肖、溫伯格和薩拉姆等人用來統一弱力和電磁力的弱電統一理論跟楊-米爾斯理論之間也是這種關係。他們之間的具體關係我們後面再說,這裡先了解這些。
以上就是一部極簡的物理學統一史,只有站在這樣的高度,我們才能對楊-米爾斯理論有個比較清晰的定位。統一是物理學的主線,是無數物理學家們孜孜以求的目標,楊-米爾斯能在這條主線裡佔有一席之地,其重要性不言而喻。有了這樣的認知,我們才能繼續我們下面的故事。
在物理學的統一史裡,有一個人的工作至關重要,這個重要倒不是說他提出了多重要的理論(雖然他的理論也極其重要),而是他顛倒了物理學的研究方式。以他為分水嶺,物理學家探索世界的方式發生了根本的改變。正是這種改變,讓20世紀的物理學家們能夠遊刃有餘的處理比之前複雜得多得多的物理世界,讓他們能夠大膽的預言各種以前想都不敢想的東西。這種思想也極其深刻的影響了楊振寧先生,楊振寧先生反過來又把這種思想發揚光大,最後產生了精妙絕倫的楊-米爾斯理論。
那麼這個人是誰呢?沒錯,他就是愛因斯坦。那麼,愛因斯坦究發現了什麼,以至於顛倒了物理學的研究方式呢?
大家先想一想,愛因斯坦之前的物理學家是怎麼做研究的?
他們去做各種實驗,去測量各種資料,然後去研究這些資料裡的規律,最後用一組數學公式來“解釋”這些資料,如果解釋得非常好,他們就認為得到了描述這種現象的物理定律,然後順帶著發現了隱藏在理論裡的某些性質,比如某種對稱性。在這裡我們能清晰的看到實驗-理論-對稱性這樣一條線,這也符合我們通常的理解。
但是,愛因斯坦把這個過程給顛倒了,他發現上面的過程在處理比較簡單的問題的時候還行,但是當問題變得比較複雜,當實驗不再能提供足夠多的資料的時候,按照上面的方式處理問題簡直是一種災難。
比如,牛頓發現萬有引力定律的時候,開普勒從第谷觀測的海量天文資料裡歸納出了行星運動的三大定律,然後牛頓從這裡面慢慢猜出了引力和距離的平方反比關係,這個還馬馬虎虎可以猜出來。我們再來看看牛頓引力理論的升級版-廣義相對論的情況:
上圖是廣義相對論的引力場方程,你告訴我這種複雜的方程要怎樣從實驗資料裡去湊出公式來?況且,廣義相對論在我們日常生活裡跟牛頓引力的結果幾乎一樣,第谷觀測了那麼多天文資料可以讓開普勒和牛頓去猜公式,但是在20世紀初有啥資料讓你去猜廣義相對論?水星近日點進動問題是極少數不符合牛頓引力理論的,但是人們面對這種問題,普遍第一反應是在水星裡面還有一顆尚未發現的小行星,而不是用了幾百年的牛頓引力有問題。退一萬步說,就算你當時認為那是因為牛頓引力不夠精確造成的,但是就這樣一個數據,你怎麼可能從中歸納出廣義相對論的場方程?
經過一連串的深度碰壁之後,愛因斯坦意識到當理論變得複雜的時候,試圖從實驗去歸納出理論的方式是行不通的,洛倫茲不就是被邁克爾遜-莫雷實驗牽著鼻子走,最終才錯失發現狹義相對論的麼?實驗不可靠,那麼愛因斯坦就要找更加可靠的東西,這個更加可靠的東西就是對稱性!
於是愛因斯坦在物理學的研究方式上來了一場哥白尼式的革命:他先透過觀察分析找到一個十分可靠的對稱性,然後要求新的理論具有這種對稱性,從而直接從數學上推匯出它的方程,再用實驗資料來驗證他的理論是否正確。在這裡,原來的實驗-理論-對稱性變成了對稱性-理論-實驗,對稱性從原來理論的副產品變成了決定理論的核心,實驗則從原來的歸納理論的基礎變成了驗證理論的工具。理解這一轉變非常的重要,後面的物理學家都是這麼幹的,我們要先把思路調對,不然到時候就容易出現各種不適應。
愛因斯坦利用這樣思路,先確定了廣義座標不變性,然後從這個對稱性出發得到了一套新的引力理論,這就是廣義相對論。這也是為什麼其他科學家看到廣義相對論之後一臉懵逼,而且說如果不是愛因斯坦,恐怕50年之內都不會有人發現這套理論的原因。愛因斯坦是第一個這麼反過來乾的,廣義相對論大獲成功之後人們才發現原來理論研究還可以這麼幹,這種思想後來被楊振寧先生髮揚光大,並形成了“對稱決定相互作用”這樣的共識。
愛因斯坦完成廣義相對論之後,繼續朝著更偉大的目標“統一場論(統一引力和電磁力)”進軍,在強力和弱力還沒有被發現的年代,能夠統一引力和電磁力的理論似乎就是終極理論了。我們現在都知道愛因斯坦終其後半生都未能完成統一場論,但是統一場論的巨大光環和愛因斯坦自帶的超級偶像的磁場還是吸引了一些物理學家,也帶來了一些有意思的新想法。
我們再來理一理愛因斯坦的思路:愛因斯坦把對稱性放在更加基礎的位置,然後從對稱性匯出新的理論。他從洛倫茲不變性匯出了狹義相對論,從廣義座標不變性匯出了廣義相對論,現在我們試圖統一引力和電磁力,那麼,有一個問題就會很自然地被提上日程:究竟什麼樣的一種對稱性會匯出電磁理論呢?
這個問題很自然吧,但是它的答案卻不是那麼好找的,這麼容易就讓你找到導致電磁理論的不變性,上帝豈不是太沒面子了?麥克斯韋方程組是從前人的實驗經驗定律總結出來的,並沒有指定什麼具體的對稱性,那要怎麼辦呢?
不著急,諾特定理告訴我們對稱性跟守恆定律是一一對應的,我現在不是要找匯出電磁理論的對稱性麼?那麼我就去看看電磁理論裡有什麼守恆定律唄,最好還是電磁理論裡特有的。
說到電磁理論裡特有的守恆定律,那肯定就是電荷守恆啊。電荷肯定是隻有電磁學才有的東西,而且電荷守恆定律又是這麼明顯,不管是不是它,它肯定是嫌疑最大的那個,必須抓起來嚴刑拷問,看看跟它私通的對稱性到底是什麼。
在外爾的嚴刑逼供下,電荷守恆招了:跟電荷守恆相對應的對稱性是波函式的相位不變性,(在量子力學裡粒子的狀態是用波函式來描述的,既然波那肯定就有相位),但是由於歷史原因,這個相位不變性我們一直稱為規範不變性,也叫規範對稱性。
總的來說就是:規範不變性導致電荷守恆。
但是事情還沒完,外爾接著發現了一件真正讓人吃驚的事:我們上面說規範不變性導致電荷守恆,這裡說的規範不變性指的是整體規範不變性,但是外爾發現如果我們要求這個規範不變性是局域的,那麼我們就不得不包括電磁場。
泡利針對這個做了進一步的研究,1941年,泡利發表了一篇論文,他在論文裡嚴格的證明了:U(1)群整體規範對稱性對應電荷守恆,它的局域規範對稱性產生電磁理論,甚至可以直接從它推匯出麥克斯韋方程組。U(1)群是群論裡的一種群的名字,叫酉群(unitary group),或者么正群,數字1表示這是1階酉群,我們現在只需要知道對稱性在數學上就是用群論來描述,而且通常不同的理論對應不同的群(這裡電磁理論就對應U(1)群)就行了。
也就是說,我們現在終於找到了決定電磁理論的對稱性,它就是U(1)群的局域規範對稱性。U(1)群和規範對稱我前面都解釋了,那麼問題的關鍵就落在對稱性的整體和局域的區別上了。
整體對稱,顧名思義,如果一個物體所有的部分都按照一個步調變換,那麼這種變換就是整體的。打個比方,舞臺上所有的演員都同步地向前、向後走,或者全都做同樣的動作,觀眾看著演員都整整齊齊的,覺得所有人都像是一個人的複製品一樣,這樣的變換就是整體的。如果經過這樣一種整體的變換之後,它還能保持某種不變性,我們就說它具有整體對稱性。
有了整體對稱的概念,局域對稱就好理解了,類比一下,如果一個物體不同的部分按照不同的步調變換,那麼這種變換就是局域的。還是以舞臺為例,導演為了使表演更具有個性,他想讓演員表現出波浪的樣子,或者是千手觀音那樣,再或者是形成各種不斷變化的圖案,這種時候每個人的動作變換就不一樣了吧,也不會說所有人都像一個人的複製品一樣了,這時候這種變換就是局域的。因為它不再是所有的人按照一個規則變換,而是區域性的每個人都有他局域特有的變換規則。同樣的,如果經過這樣一種局域的變換之後,它還能保持某種不變性,我們就說它具有局域對稱性。
從上面的情況我們看出來,整體變換要簡單一些,所有的地方都按照同樣的規則變換,而局域變換就複雜多了,不同的地方按照不同的規則變換。所以,很明顯,如果你要求一套理論具有某種局域對稱,這比要求它具有整體對稱複雜得多,局域變換對物理定律形式的要求就更加嚴格一些。但是,你一旦讓它滿足局域對稱了,它能給你的回報也會多得多。
還是電磁理論的例子:整體規範對稱性下我們只能得到電荷守恆,但是一旦要求它具有局域規範對稱性,整個電磁理論,甚至麥克斯韋方程組都直接得到了。電荷守恆和麥克斯韋方程組,這就是整體對稱和局域對稱給的不同回報,孰輕孰重差別很明顯吧?電荷守恆是可以直接從麥克斯韋方程組裡推匯出來的。
以上是偏科普的解釋,從數學的角度來說,整體變換就是你所有的變換跟時空座標無關,局域變換就是你的變換是一個跟時空座標相關的函式。跟時空座標相關的函式,其實就是說不同的時空點,這個函式值是不一樣的,也就是說變換不一樣。
不管從哪種解釋(從數學更容易),我們其實都可以看出:整體變換其實只是局域變換的一種特例。局域變換裡變的是一個跟時空座標相關的函式,但是這個函式的值也可以是一個定值啊,這時候局域變換就退化成整體變換了。
那麼,一個大膽的想法就產生了:在電磁理論裡,整體規範對稱性對應著電荷守恆,但是我一旦要求這個整體規範對稱性在局域下也成立,我立馬就得到了整個電磁理論。那麼我可不可以把這種思想推廣到其他領域呢?比如強力、弱力,有沒有可能同樣要求某種整體對稱性在局域成立,然後可以直接產生強力、弱力的相關理論呢?
這是一個十分誘人的想法,楊振寧從他讀研究生的時候就在開始琢磨這個事,但是一直到十幾年後的1954年,也就是他32歲的時候才有結果,這個結果就是大名鼎鼎的非阿貝爾規範場論,也叫楊-米爾斯理論。
在我們正式講楊-米爾斯理論之前,我們先來聊一聊楊振寧先生的品位。
有一個曾經跟愛因斯坦共事過的物理學家這樣回憶:我記得最清楚的是,當我提出一個自認為有道理的設想時,愛因斯坦並不與我爭辯,而只是說:“啊,多醜!”。只要他覺得一個方程是醜的,他就對之完全失去了興趣,並且不能理解為什麼還會有人願意在上面花這麼多時間。他深信,美是探索理論物理中重要結果的一個指導原則。
愛因斯坦自己也說:“我想知道上帝是如何創造這個世界的。對這個或那個現象、這個或那個元素的譜我並不感興趣。我想知道的是他的思想,其他的都只是細節問題。”
愛因斯坦對一個理論的美學要求達到了一種不可思議的地步。從麥克斯韋電磁學裡發現的洛倫茲不變性成了狹義相對論的核心,但是愛因斯坦覺得狹義相對論偏愛慣性系,這點讓他很不滿。他覺得洛倫茲不變性的範圍太窄了,上帝不應該讓這麼美的思想之侷限在慣性系裡,所以他要以一個在所有參考系裡都成立的不變性為前提,重新構造一個新的理論,這就是廣義座標不變性和廣義相對論的來源。
說白了,愛因斯坦就是覺得:這麼好的對稱性,這麼美的想法,如果上帝你不選用它作為構造世界的理論,那上帝簡直就是瞎子。愛因斯坦深信上帝一定是用簡單和美來構造這個世界的,所以我從如此簡單和美的對稱出發構造的理論一定是有意義的。
楊振寧先生的品位,跟愛因斯坦幾乎是一模一樣的,這也是一位對理論的美學要求達到了不可思議地步的人。楊振寧先生最為崇敬的物理學家就是愛因斯坦,他對愛因斯坦顛倒物理學的研究方式,把對稱性放在極為重要的位置,以及對科學理論簡單和美的追求都有非常深刻的領悟。除此之外,楊振寧還有一個一般物理學家不具備的優勢:他有一個非常厲害的數學家老爹,這就使得楊振寧的數學水平比同時代的物理學家高出很多。數學在現代物理中有多重要不用我多說,這就叫憑實力拼爹~
楊振寧先生是父親楊武之是著名的數學家和數學教育家,是數學教育家就意味著他會以一種非常恰當的方式讓楊振寧接觸並喜歡數學。楊振寧還是中學生的時候,他就從父親那裡接觸到了群論的基礎原理。諾特定理的發現讓物理學家們重視對稱性,但是他們對群論這種對稱性的數學語言卻沒有足夠的重視。當時很多物理學家都反對把群論這種過於抽象的數學語言引入到物理學裡來,懟神泡利直接把群論嘲諷為“群禍”,薛定諤表示附議,愛因斯坦也只是把群論當做一個細枝末節的工作。
幸運的是,楊武之恰好是擅長群論的數學家,他在清華大學開過群論的課程,當時華羅庚、陳省身這些未來的數學大師都來聽過課。有這樣的父親,楊振寧對群論肯定不陌生,而楊振寧在西南聯大學士論文的題目選的就是《群論和多原子分子的振動》,他的老師吳大猷就藉此引導他從群論開始關注物理學的對稱性問題。
所以,年紀輕輕的楊振寧就已經非常重視物理學的對稱性問題,並且在那個其他物理學家還在普遍懷疑群論的年代,他已經很好的掌握了群論這種研究對稱性的重要工具,這無疑是非常幸運的。有這樣的楊振寧,他會對泡利在1941年發表的那篇論文感興趣是很自然的。
我們把眼光再拉回20世紀四五十年代,這時候人們已經知道自然界除了電磁力和引力之外還有強力和弱力,強力把質子和中子黏在一起(不然質子都帶正電,同性相斥早就把原子核拆了),弱力在原子核衰變的時候發揮作用(比如中子衰變變成質子、電子和反中微子的β衰變)。但是那時候對強力和弱力的認識都還非常的膚淺,湯川秀樹的介子理論、費米的四費米子理論都能只能解釋強力、弱力的一些現象,還有大把的問題他們沒法解決,誰都知道這些理論只是關於強力、弱力的一個過渡理論,最後肯定要被更加精確的理論取代,但是該怎樣去尋找更加精確的理論,大家心裡也都沒譜,沒有一個十分清晰的思路。
但是楊振寧先生那時候的思路確是很清晰的:他對理論的美學要求是跟愛因斯坦一樣苛刻的,因此,任何只是試圖粗糙、唯象的模擬強力、弱力的理論他都懶得搭理(就跟愛因斯坦嫌棄它們長得醜一樣)。然後,加上數學大牛的父親和恩師吳大猷的悉心栽培,楊振寧那先生對數學的群論、物理學的對稱性都有非常深刻的理解,所以他就特別理解外爾那種想法的重要性。所以,他要不惜一切代價的擴充套件它。
外爾發現U(1)群整體規範對稱性對應電荷守恆,但是,一旦我把這個整體對稱性推廣到局域,我就可以直接得到整個電磁理論。這種想法對物理學上有“潔癖”的楊振寧來說,吸引力實在是太大了,因為它實在是太美太簡潔,給出的回報也太豐厚。如果我在強力、弱力裡透過把某種規範對稱性從整體推廣到局域,是不是也可以得到關於強力、弱力的理論呢?
我們從事後諸葛亮的角度看,好像這一切都顯得很自然,好像只要是物理學家都應該想到這個。但其實不然,且不說當愛因斯坦在搞統一場論的時候,他就已經被所謂的主流物理學界給邊緣化了,外爾跟著愛因斯坦搞統一場論時提出的這種想法跟著被邊緣化是很正常的事情。物理學家們每天都要產生各種各樣的想法,這些想法哪些可靠,哪些值得考慮,哪些值得自己深入研究,哪些東西值得自己不顧一切的去守護,這原本就是一個極困難的問題,也是非常考驗物理學家水平的事情。
在當時更多物理學家的眼裡,外爾這樣的手法可能確實很漂亮,但有點“繡花枕頭”的嫌疑:麥克斯韋方程組我們早就知道了,狄拉克、費曼等人也已經成功的把電磁場量子化了(就是所謂的量子電動力學),你在電磁領域這樣顛來倒去好像確實很漂亮,但是沒有增加任何知識啊?好吧,就算你的這個東西可能更普適,可能在強力、弱力裡也有用武之地,但是在當時主流的描述強力和弱力的理論(也就是湯川秀樹的介子理論和費米的四費米子理論)裡,也看不到合適的用武的地方。而且,一般物理學家對“對稱決定相互作用”的認識還遠遠沒有達到愛因斯坦和楊振寧的水平,所以他們不怎麼關注這個也是自然的。
所以,當時除了楊振寧、泡利、外爾等寥寥幾人關注這個以外,其他人對此根本就不關心。而在這些關注的人裡,楊振寧又無疑是其中對此關注度最高的一個,畢竟本科論文就是做的這個,後來給他帶來諾貝爾獎的宇稱不守恆也是關於對稱性的,他一直對對稱性在物理學裡的作用保持極高的關注度。
既然想推廣外爾的思想,試圖透過找到某種新的局域規範對稱性來找到強力、弱力的理論,那麼關鍵就是要找到這種對稱性。但是怎麼找這種對稱性呢?當然還是按照諾特定理,去看看強力、弱力裡有什麼守恆定律唄,最好還是像電荷守恆那樣,在那種相互作用力特有的。
楊振寧透過一番審查,發現弱相互作用裡暫時沒有什麼特殊的守恆定律,但是強相互作用力裡卻有一個現成的:同位旋守恆。而且這個同位旋守恆還只在強相互作用下守恆,在其它作用下不一定守恆,這不剛好麼。
同位旋是啥呢?大家只要看一下質子(1.6726231 × 10^-27千克)和中子(1.6749286 ×10^-27千克)的質量,就會發現它們的質量實在是太接近了(差別在千分之一)。而且,人們還發現2個質子、1個質子1箇中子、2箇中子之間的強相互作用幾乎是相同的,也就是說,如果我們不考慮電磁作用,在強相互作用的眼裡,質子和中子完全是相同的。
於是,海森堡就來了提出了一個大膽的想法:他認為質子和中子壓根就是同一種粒子-核子的兩種不同的狀態,它們共同組成了一個同位旋二重態。在抽象的同位旋空間裡,質子可以“旋轉”成為中子,中子也可以“旋轉”成為質子,因為質子和中子在強相互作用下是一樣的,所以,我們就可以說:強相互作用具有同位旋空間下的旋轉不變性。
大家可能注意到我上面的“旋轉”打了一個引號,因為我們這裡說的旋轉並不是在我們常說的真實空間裡,而是在核子內部抽象出來的同位旋空間,因此這種對稱性又叫內部對稱性,而之前我們談的各種跟時空有關的對稱性就叫外部對稱性。內部對稱性咋一看好像不那麼真實,但其實它跟外部對稱是一樣真實自然的,它們一樣對應著守恆定律,強相互作用下同位旋空間裡的這種旋轉不變性就對應同位旋守恆。
關於同位旋的事情這裡就不再多說了,大家只要知道在強相互作用裡同位旋是守恆的,並且同位旋空間下質子和中子可以相互旋轉得到就行了。
因為描述對稱性的數學語言是群論,與同位旋這種對稱相對應的群叫SU(2)(特殊么正群),裡面的數字2提醒我們這是兩個物體(如質子和中子)相互變換來確定的。我們也先甭管這個SU(2)群到底是什麼意思(這是群論的基礎知識,感興趣的自己看群論),只需要知道這個群可以描述兩個物體相互變換的這種對稱性,跟電磁理論裡用U(1)群來描述電磁理論裡的對稱性一樣的就行了。
外爾和泡利發現,只要我們要求系統具有U(1)群的局域規範不變性,我們就能從中推匯出全部的電磁理論。那麼,楊振寧如果認為強力的本質由質子和中子相互作用產生,那麼推廣前面的思想,我們就應該要求系統具有SU(2)群的局域規範不變性。
好吧,要推廣那就推廣吧,不就是把局域規範不變性從U(1)群推廣到SU(2)群麼,有些人認為科學家們風風雨雨什麼沒見過,把一個東西從U(1)群推廣到SU(2)群應該沒什麼難度吧?那你就錯了,這玩意還真不是這麼簡單的,廣義相對論也不過是把狹義相對論裡的洛倫茲不變性推廣到了廣義座標不變性,你覺得這個簡單麼?
U(1)群的問題之所以比較簡單,是因為跟U(1)群對應的電磁理論它本身就具有局域規範對稱性。也就是說,當我們的麥克斯韋同學寫下麥克斯韋方程組的時候,他就已經把U(1)群的局域規範對稱性寫到這方程裡去了,雖然他自己沒有意識到。熟悉電磁理論的人都知道其實我們有兩套表述電磁場的體系,一套就是我們初中就開始學習的場強體系,還有一套勢體系,也就是電磁勢這些東西,從這個角度很容易就能看出它的規範不變性。
但是SU(2)這裡一切都是空白,沒有電磁勢這樣的東西。楊振寧先生想做的就是要找到類似電磁勢這種具有局域規範不變性的東西,然後利用他們來描述強力,所謂的推廣是這個樣子的一種推廣。在這種推廣裡,最困難的地方就在這四個字:非阿貝爾。
在前面我跟大家提過,楊-米爾斯理論又叫非阿貝爾規範場論,這個阿貝爾指的是阿貝爾群(以挪威的天才數學家阿貝爾命名),它又叫交換群,通俗的講就是這個群裡的運算是滿足交換律的。
最簡單的例子就是整數的加法,小學生都知道加法滿足交換律:3+5=5+3,不論你加數的順序怎麼交換,最後的結果都不變。於是,我們就說整數和整數的加法構成了一個整數加法群,這個群的運算(加法)是滿足交換律的,所以這個整數加法群就是阿貝爾群。
那麼,非阿貝爾群自然就是指群的運算不滿足交換律的群。那麼,不滿足交換律的運算有沒有呢?當然有了,最常見的就是矩陣的乘法。稍微有點線性代數基礎的人都知道:兩個矩陣相乘,交換兩個矩陣的位置之後得到的結果是不一樣的。而矩陣這種東西在數學、物理學裡是非常基礎的東西,比如你對一個物體進行旋轉操作,最後都可以轉化為物體跟一個旋轉矩陣的運算,這樣非阿貝爾其實就沒啥奇怪的了。
上圖是一個新兵,他現在要執行兩個操作,一個是順時針旋轉90°(從上往下看),一個是向右倒(其實就是從外往裡看順時針旋轉90°)。上面的a圖是先旋轉再右倒,而下面的b圖則是先右倒再旋轉,我們可以清楚的看到,最後這兩個人的狀態是完全不一樣的(一個左側對著你,一個頭對著你)。
狀態不一樣說明什麼呢?說明這兩個旋轉操作如果改變先後次序的話,得到的結果是不一樣的,而這兩個旋轉操作都可以透過跟兩個矩陣相乘得到,這說矩陣的乘法是不能隨意交換順序的。
好了,有了這些概念,我們再回到楊振寧先生的問題上來。
外爾把U(1)群的整體規範對稱性推廣到了局域,因為U(1)群(1×1矩陣)是阿貝爾群,所以這個過程很簡單;楊振寧試圖把SU(2)群的整體規範對稱也推廣到局域,但SU(2)群(2×2矩陣)是非阿貝爾群,這個就麻煩了。
我們知道楊振寧先生的數學水平在物理學家群體裡是非常高的,他的父親楊武之就是群論大師,他自己也很早就進入了對稱性領域。饒是如此,他從泡利1941年的論文開始,前前後後過了十幾年,一直到1954年,他才和米爾斯(當時和楊振寧先生在同一間辦公室,是克勞爾教授的博士研究生)一起寫出了劃時代的論文《同位旋守恆和同位旋規範不變性》和《同位旋守恆和一個推廣的規範不變性》。
這兩篇論文正式宣告了楊-米爾斯理論的誕生,楊振寧先生終於把局域規範對稱的思想從阿貝爾群推廣到了更一般的非阿貝爾群(阿貝爾群的電磁理論成了它的一個特例),從而使得這種精妙的規範對稱可以在電磁理論之外的天地大展拳腳,也使得他一直堅持的“對稱決定相互作用”有了落腳之地。為了區別起見,我們把外爾的那一套理論成為阿貝爾規範場論,把楊振寧和米爾斯提出來的稱為非阿貝爾規範場論,或者直接叫楊-米爾斯理論。
楊-米爾斯理論給我們提供了一個精確的數學框架,在這個框架裡,只要選擇了某種對稱性(對應數學上的一個群),或者說你只要確定了某個群,後面的相互作用幾乎就被完全確定了,它的規範玻色子的數目也完全被確定了。這就是為什麼後來大家能直接從強力和弱電理論裡預言那麼多還未被發現的粒子的原因。
什麼是規範玻色子?科學家們按照自旋把基本粒子分成了費米子(自旋為半整數)和玻色子(自旋為整數),其中費米子是組成我們基本物質的粒子,比如電子、夸克,而玻色子是傳遞作用力的粒子,比如光子、膠子。有些人可能是第一次聽說傳遞作用力的粒子這種說法,會感覺非常奇怪,怎麼作用力還用粒子傳遞?
沒錯,在量子場論裡,每一種作用力都有專門傳遞作用力的粒子。比如傳遞電磁力的是光子,傳遞強力的是膠子,傳遞弱力的是W和Z玻色子,傳遞引力的是引力子(不過引力子還沒有找到)。兩個同性電子之間為什麼會相互排斥呢?因為這兩個電子之間在不停的發射交換光子,然後看起來就像在相互排斥,這就跟兩個人在溜冰場上互相拋籃球然後都向後退一樣的道理。那麼相互吸引就是朝相反的方向發射光子了,其他的力也都是一樣,這些傳遞相互作用的玻色子在規範場裡都統統被稱為規範玻色子。
也就是說,在楊-米爾斯理論裡,那些傳遞相互作用的粒子都叫規範玻色子,每一個群都有跟他對應的規範玻色子,只要你把這個群確定了,這些規範玻色子的性質就完全確定了。比如在U(1)群裡,規範玻色子就只有一個,那就是光子;在SU(3)群裡,理論計算它的規範玻色子不多不少就是8個,然後實驗物理學家就根據這個去找,然後真的就找到了8種膠子。以前是實驗物理學家發現了新粒子,理論物理學家要琢磨著怎麼去解釋,現在是理論物理學家預測粒子,實驗物理學家再去找,愛因斯坦顛倒研究物理的方法現在終於從蹊徑成了主流。
楊-米爾斯理論從數學上確定了“對稱決定相互作用”,那麼我們接下來的問題就是“什麼樣的對稱決定什麼樣的相互作用”了。比如,我現在要描述強力,那麼強力到底是由什麼對稱決定的呢?
有些人可能覺得奇怪,你上面不是說了一大片同位旋守恆麼,楊振寧先生不就是看到同位旋守恆和電荷守恆的相似性才最終提出了楊-米爾斯理論麼,為什麼現在還要來問強力是什麼對稱決定的,難道不是同位旋麼?
沒錯,還真不是同位旋!
海森堡從質子和中子的質量相近提出了同位旋的概念,同位旋守恆確實也只在強力中成立,但是大家不要忘了質子和中子的質量只是接近,並不是相等。楊-米爾斯理論裡的對稱是一種精確對稱,不是你質子和中子的這種近似相等,當時的科學家們把質子和中子的微小質量差別寄希望於電磁汙染,但事實並非如此。所以,當楊振寧試圖用質子中子同位旋對稱對應的SU(2)群作為強力的對稱群的時候,得到的結果肯定跟實際情況不會相符的。
但是,我們要注意到當時才1954年,人們對強力的認識還太少了,後來我們知道真正決定強力的精確對稱是夸克的色對稱,與之對應的群是SU(3)群,所以我們把最終描述強力的理論稱之為量子色動力學(QCD)。但是,夸克這個概念要到1964年才由蓋爾曼、茨威格提出來,所以楊振寧在1954年就算想破腦袋也不可能想到強力是由夸克的色對稱決定的。
夸克有六種(上夸克、下夸克、奇夸克、粲夸克、底夸克、頂夸克),每一種夸克也稱為一味,質子和中子之間的微小質量差異是就是因為上夸克和下夸克的質量不同。另外,每一味夸克都有三種色(紅、綠、藍),比如上夸克就有紅上夸克、綠上夸克和藍上夸克,這不同色的同種夸克之間質量是完全相等的,這是一種完全精確的對稱,這種色對稱最後決定了強相互作用。
一旦建立了這種夸克模型,並且意識到夸克色對稱這種精確對稱對應SU(3)群,那麼接下來利用楊-米爾斯理論去構造描述強力的理論就是非常簡單的事情,基本上就是帶公式套現成的事。所以,成功描述強力的量子色動力學的核心就是夸克模型+楊-米爾斯理論。
在弱力這邊情況也是類似的,你要想找到描述弱力的理論,那就先去找到決定弱力的精確對稱和相應的群,然後直接按照楊-米爾斯理論來就行了。但是,弱力這邊的情況稍微複雜一點,科學家們沒找到什麼弱力裡特有的精確對稱,但是他們發現,如果我把弱力和電磁力統一起來考慮,考慮統一的電弱力,我倒是能發現這種精確對稱。於是,他們索性不去單獨建立描述弱力的理論了,轉而直接去建立統一弱力和電磁力的弱電統一理論。而最後在弱電相互作用中真正起作用的是(弱)同位旋——超荷這個東西,他們對應的群是SU(2)×U(1)(×表示兩個群的直積)。
描述強力的量子色動力學和描述電磁力和弱力的弱電統一理論一起構成了所謂的粒子物理標準模型,於是我們可以在楊-米爾斯理論這同一個框架下描述電磁力、強力和弱力,這是物理學的偉大勝利。同時,我們也要清楚的知道,楊-米爾斯理論不等於標準模型(沒有夸克模型你拿著理論也不知道怎麼用),它是一個數學框架,是一把神兵利器,它本身並不產生具體的理論知識,但是一旦你把它用在合適的地方,它就能給你帶來超出想象的回報(想想我們50年代末還對強力弱力束手無策,但是70年代末就完全馴服了它們)。
標準模型的建立是另一個非常宏大的故事,這裡就不多說了,這裡談一個不得不說的問題:質量問題。
在上面我們知道了費米子是組成物質的粒子,玻色子是傳遞相互作用力的粒子。比如兩個電子之間透過交換光子來傳遞電磁力,兩個夸克透過交換膠子來傳遞強力,那麼光子和膠子就分別是傳遞電磁力和強力的規範玻色子。但是,大家有沒有考慮過玻色子的質量問題?如果傳遞相互作用力的玻色子質量過大或者過小會咋樣?
還是以溜冰場傳球為例,假設兩個人站在溜冰場上相互傳籃球,那麼一開始他們會因為籃球的衝力而後退(這就是斥力的表現),從而把距離拉開,但是他們會一直這樣慢慢後退下去麼?當然不會!當兩人之間的距離足夠遠的時候,你投籃球根本就投不到我這裡來了,那我就不會後退了。再想一下,如果你投的不是籃球而是鉛球那會怎樣?那可能我們還在很近的時候,你的鉛球就投不到我這裡來了。
在溜冰場的模型裡,球就是傳遞作用力的玻色子,你無法接到球就意味著這個力無法傳到你這裡來,就是說它的力程是有限的。從籃球和鉛球的對比中我們也能清楚的知道:玻色子的質量越大,力程越短,質量越小,力程越長,如果玻色子的質量為零,那麼這個力程就是無限遠的。
所以,為什麼電磁力是長程力,能傳播很遠呢?因為傳遞電磁力的光子沒有質量。但是我們也清楚的知道,強力和弱力都僅僅侷限在原子核裡,也就是說強力、弱力都是短程力,所以,按照我們上面的分析,那麼傳遞強力和弱力的玻色子似乎應該是有質量的,有質量才能對應短程力嘛。
但是,楊振寧在研究規範場的時候,他發現要使得系統具有局域規範不變性,那麼傳遞作用力的規範玻色子的質量就必須為零。也就是說,規範玻色子如果有質量,它就會破壞局域規範對稱性。
為什麼局域規範對稱性要求玻色子的質量必須為零呢?你可以這樣想,什麼叫局域規範對稱?那就是不同的地方在做著不同的變換,既然不同的地方變換是不一樣的,那麼肯定就必須有個中間的信使來傳遞這種狀態,這樣大家才能協調工作,不然你跳你的我跳我的豈不是亂了套?好,既然這個信使要在不同地方(也可能是兩個非常遠的地方)傳遞狀態,按照上面的分析,它是不是應該零質量?只有質量為零才能跑的遠嘛~
所以,這樣分析之後,我們就會發現局域規範對稱性和規範玻色子零質量之間的對應關係是非常自然的。但是,這樣就造成了現在的困境:局域規範對稱性要求規範玻色子是零質量的,但是強力、弱力的短程力事實似乎要求對應的規範玻色子必須是有質量的,怎麼辦?
這個問題不僅困擾著楊振寧,它也同樣困擾著泡利(其實當時對規範場感興趣的也就他們寥寥幾個)。泡利開始對規範場的事情也很感興趣(楊振寧就是讀了泡利1941年的那篇論文才開始對規範場感興趣的),但是當泡利發現了這個似乎無解的質量問題之後,他就慢慢對規範場失去了興趣,也就沒能得出最後的方程。
楊振寧的情況稍微不一樣,他的數學功底非常好,對群論的深入理解能夠讓他更深刻的理解對稱性的問題(想想那會兒物理學家都不待見群論,泡利還帶頭把群論稱為群禍)。另外,在美學思想上,楊振寧是愛因斯坦的鐵桿粉絲,他們都是“對稱決定相互作用”堅定支持者,這使得楊振寧對規範場產生了謎之喜愛。而且,楊振寧那會兒才30歲左右,是科學家精力和創造力的巔峰時期,自然無所畏懼。
所以,楊振寧一直在瘋狂地尋找楊-米爾斯方程,找到方程之後,即便知道有尚未解決的質量問題,他依然決定發表他的論文。在他眼裡,這個方程,這套理論是他心裡“對稱決定相互作用”的完美代表,他跟愛因斯坦一樣深信上帝喜歡簡潔和美,深信上帝的簡單和美是由精確對稱決定的。如果是這樣,那麼還有什麼比基於規範不變性這種深刻對稱的楊-米爾斯理論更能描繪上帝的思想呢?
楊振寧對對稱性的深刻理解使得他對楊-米爾斯理論有非常強的信心,至於強力、弱力上表現出來的質量問題,那不過是這個理論在應用層面出現了一些問題。強力、弱力比電磁力複雜很多,因此用楊-米爾斯理論來解釋強力、弱力自然就不會像處理電磁力那樣簡單。為什麼電磁力這麼簡單?你想想,電子有電效應,電子的運動產生磁效應,電子之間的相互作用是透過光子這個規範玻色子傳遞的,所以電磁力的本質就是電子和光子的相互作用。這裡只有一個粒子電子,和一個規範玻色子光子,而且光子還是沒有質量的,你再看看強力裡面,三種色夸克,八種不同的膠子,這鐵定比電磁力複雜多了啊!
所以,楊振寧想的是:楊-米爾斯理論沒問題,現在它應用在強力弱力上出現了一些問題(質量問題就是初期最大的一個),這也是自然的。這些是問題,而非錯誤,以後隨著人們研究的深入,這些問題應該可以慢慢得到解決的。
歷史的發展確實是這樣,質量問題後來都透過一些其他的手段得到了解決,那麼質量問題最終是怎麼解決的呢?
在描述強力的量子色動力學裡,我們注意到傳遞夸克間作用力的膠子本來就是零質量的,零質量跟規範對稱性是相容的。那但是,如果這樣的話,零質量的玻色子應該對應長程力啊,為什麼強力是短程力(只在原子核裡有效)呢?這就涉及到了強力裡特有的一種性質:漸近自由。漸近自由說夸克之間的距離很遠的時候,它們之間的作用力非常大,一副誰也不能把它們分開的架勢,但是一旦真的讓它們在一起了,距離很近了,它們之間的相互作用力就變得非常弱了,好像對面這個夸克跟它沒任何關係似的,活脫脫的一對夸克小情侶。這樣在量子色動力學裡,零質量的規範玻色子就和強力的短程力沒有衝突了。
漸近自由解釋了為什麼膠子是零質量但是強力確是短程力,那麼傳遞弱力的W和Z玻色子可是有質量的。有質量的話短程力是好解釋了,但是我們上面說有質量的規範玻色子會破壞規範對稱性,這規範對稱性可是楊-米爾斯理論的根基啊,它被破壞了那還怎麼玩?
最後解決這個問題的是希格斯機制。希格斯機制是來打圓場的:你楊-米爾斯理論要求規範玻色子是零質量的,但是最後我們測量到W和Z玻色子是有質量的,怎麼辦呢?簡單,我認為W和Z這些傳遞弱力的規範玻色子一出生的時候是零質量的,但是它來到這個世界之後慢慢由於某種原因獲得了質量,也就是說它們的質量不是天生的而是後天賦予的,這樣就既不與楊-米爾斯理論相沖突,也不跟實際測量相沖突了。
所以,希格斯機制其實就是賦予粒子質量的機制。它認為我們的宇宙中到處都充滿了希格斯場,粒子如果不跟希格斯場發生作用,它的質量就是零(比如光子、膠子),如果粒子跟希格斯場發生作用,那麼它就有質量,發生的作用越強,得到的質量就越大(需要說明的是,並不是所有的質量都來自於粒子和希格斯場的相互作用,還有一部分來自粒子間的相互作用)。2012年7月,科學家終於在大型強子對撞機(LHC)中找到了希格斯粒子,為這段故事畫上了一個圓滿的句號,也理所當然地預約了2013年的諾貝爾物理學獎。
這樣楊-米爾斯理論就可以完整的描述強力、弱力和電磁力了,在霍夫特完成了非阿貝爾規範場的重整化(重整化簡單的說就是讓理論能算出有意義的數值,而不是無窮大這種沒意義的結果,這是點粒子模型經常會出現的問題。舉個最簡單的例子,我們都知道電荷越近,它們之間的電磁力越大,那麼當電荷的距離趨近於零的時候,難道電磁力要變成無窮大麼?這個當做思考題~)之後,粒子物理標準模型就正式投產商用。
楊-米爾斯(Yang-Mills)理論,是現代規範場理論的基礎,20世紀下半葉重要的物理突破,旨在使用非阿貝爾李群描述基本粒子的行為,是由物理學家楊振寧和米爾斯在1954年首先提出來的。這個當時沒有被物理學界看重的理論,通過後來許多學者於1960到1970年代引入的對稱性自發破缺與漸進自由的觀念,發展成今天的標準模型。這一理論中出現的楊-米爾斯方程是一組數學上未曾考慮到的極有意義的非線性偏微分方程。
它起源於對電磁相互作用的分析,利用它所建立的弱相互作用和電磁相互作用的統一理論,已經為實驗所證實,特別是這理論所預言的傳播弱相互作用的中間玻色子,已經在實驗中發現。楊-米爾斯理論又為研究強子(參與強相互作用的基本粒子)的結構提供了有力的工具。在某種意義上說,引力場也是一種規範場。所以這一理論在物理中的作用非常重要。
簡單的說,楊-米爾斯理論把外爾發現的可交換群(阿貝爾群)的規範理論(應用於電磁理論)拓展到了不可交換群(非阿貝爾群),因此它又叫非阿貝爾規範場論。拓展後的非阿貝爾規範場論最後成功的描述了電弱相互作用和強相互作用,是粒子物理標準模型的基礎。
大家也知道楊振寧和李政道先生因此斬獲了全球華人的第一個諾貝爾獎,然而,對楊振寧關注多一點的人就會經常聽到這樣一個說法,說宇稱不守恆雖然為楊振寧贏得了物理學界至高無上的諾貝爾獎,但這並不是他的最高成就,楊先生最大的貢獻是楊-米爾斯理論。
這下子很多人就懵圈了。楊-米爾斯理論是啥?上學的時候老師肯定沒講過,去百度上搜,搜出來結果更是一頭霧水,那都是隻有懂的人才能看得懂的東西。隱隱約約能感覺到楊振寧先生好像做了什麼非常了不起的工作,但是要具體說他做了啥,在科學上有啥意義,就迷糊了。
那楊-米爾斯理論到底重不重要?重要,當然重要,絕對的重要,這是現代規範場論和粒子物理標準模型的基礎。在講宇稱不守恆的時候我就說過,楊-米爾斯理論是一個背景更加宏大的故事。宇稱不守恆雖然也影響了物理學的方方面面,但是我們把它單獨拎出來還是馬馬虎虎能講清楚的,而楊-米爾斯理論就不一樣了,想要把它搞清楚,我們得把視角上升到整個物理學發展的高度上來,因為這是一個跟物理學主線密切相關的故事。
物理學家到底在研究什麼?
大自然中有各種各樣的現象,有跟物體運動相關的,有跟聲音、光、熱相關的,有跟閃電、磁鐵相關的,也有跟放射性相關的等等。物理學家們就去研究各種現象背後的規律,然後他們得到了一堆關於運動啊,聲學、光學、熱學之類的定律,然後物理學家們就滿意了麼?
當然不滿意,為啥?定律太多了!
你想想,如果每一種自然現象都用一種專門的定律來描述它,那得有多少“各自為政”的定律啊。於是物理學家們就想:我能不能用更少的定律來描述更多的現象呢?有沒有可能有兩種現象表面上看起來毫不相關,但是在更深層次上卻可以用同一種理論去描述?有沒有可能最終用一套理論來描述所有的已知的事情?
這個事情,本質上就跟秦始皇要統一六國一樣,我決不允許還有其他六個各自為政的國家存在,必須讓所有人遵守同樣的法律,服從同一個政令,用同樣的語言和文字,這樣才和諧。物理學家的統一之路,也是這樣浩浩蕩蕩地開始的。
牛頓統一了天上和地上的力,麥克斯韋統一了電、磁、光。到了19世紀,隨著人們對微觀世界研究的深入,許多在宏觀上風牛馬不相及的東西,在微觀層面上卻很好的統一了起來。比如我們熟悉的支援力、彈力、摩擦力之類的東西,在宏觀上它們確實是不同的東西,但是到了微觀一看:這些雜七雜八的力全都是分子間作用力造成的,而分子間作用力本質上就是電磁力。並且,這些分子、原子運動的快慢,在宏觀層面上居然體現為溫度,然後熱現象就變成了一種力學現象。
於是,到了19世紀末,人類所有已知現象背後的力就都歸結為引力和電磁力,其中引力由牛頓的萬有引力定律描述,電磁力由麥克斯韋方程組描述。但尷尬的是,麥克斯韋方程組和牛頓力學這套框架居然是矛盾的,那麼到底是麥克斯韋方程組有問題還是牛頓力學的這套框架有問題呢?
愛因斯坦說麥克斯韋方程組沒毛病,牛頓的框架有問題。於是愛因斯坦升級了一下牛頓的這套框架,在新框架下繼續跟麥克斯韋方程組愉快的玩耍,這套升級後的新框架就叫狹義相對論。
在狹義相對論這個新框架裡,麥克斯韋方程組不用做任何修改就能直接入駐,這是一等公民。另外,牛頓力學裡有些東西無法直接搬過來,但是稍微修改一下就可以很愉快的搬到這個新框架裡來,比如動量守恆定律(直接用牛頓力學裡動量的定義,在狹義相對論裡動量是不守恆的,需要修改一下就守恆了),這是二等公民。還有一類東西,無論怎麼改都無法讓它適應這個新框架,這是刁民。
刁民讓人很頭痛啊,不過還好,雖然有刁民,但是刁民的數量不多,就一個:引力。牛頓的萬有引力定律在牛頓力學那個框架裡玩得很愉快,但是它骨頭很硬,不管怎麼改,它就是寧死不服狹義相對論這個新框架,那要怎麼辦呢?當然,我們可以繼續改,我們相信雖然現在引力它不服,但是以後總能找到讓它服氣的改法。但是愛因斯坦另闢蹊徑,他說引力這小子不服改我就不改了,然後他另外提出了一套新理論來描述引力,相當於單獨給引力蓋了一棟別墅。結果這套新引力理論極其成功,而且愛因斯坦提出這套新理論的方式跟以往的物理學家們提出新理論的方式完全不一樣,這種新手法帶來夢幻般的成功驚呆了全世界的物理學家,然後愛因斯坦就被捧上天了,這套新理論就叫廣義相對論。
愛因斯坦用廣義相對論馴服了引力,用狹義相對論安置好了電磁力之後,接下來的路就很明顯了:統一引力和電磁力,就像當年麥克斯韋統一電、磁、光那樣,畢竟用一套理論解釋所以的物理現象是物理學家們的終極夢想。但是,愛因斯坦窮盡他的後半生都沒能統一引力和電磁力。不僅如此,隨著實驗儀器的進步,人們撬開了原子核,在原子核內部又發現了兩種新的力:強力和弱力。
這下可好,不但沒能統一引力和電磁力,居然又冒出來兩種新的力。所以,我們現在的局面變成了有四種力:引力、電磁力、強力和弱力。其中,引力用廣義相對論描述,電磁力用麥克斯韋方程組(量子化之後用量子電動力學QED)描述,強力和弱力都還不知道怎麼描述,統一就更別談了。
到了這裡,我們這篇文章的主角楊-米爾斯理論終於要登場了,我先把結論告訴大家:現在強力就是用楊-米爾斯理論描述的,弱力和電磁力現在已經實現了完全的統一,統一之後的電弱力也是用楊-爾斯理論描述的。也就是說,在四種基本力裡,除了引力,其它三種力都是用楊-米爾斯理論描述的,所以你說楊-米爾斯理論有多重要?
同時,我們也要知道,楊-米爾斯理論是一套非常基礎的理論,它提供了一個非常精妙的模型,但是理論本身並不會告訴你強力和電弱力具體該怎樣怎樣。蓋爾曼他們把楊-米爾斯理論用在強力身上,結合強力各種具體的情況,最後得到的量子色動力學(QCD)才是完整描述強力的理論。格拉肖、溫伯格和薩拉姆等人用來統一弱力和電磁力的弱電統一理論跟楊-米爾斯理論之間也是這種關係。他們之間的具體關係我們後面再說,這裡先了解這些。
以上就是一部極簡的物理學統一史,只有站在這樣的高度,我們才能對楊-米爾斯理論有個比較清晰的定位。統一是物理學的主線,是無數物理學家們孜孜以求的目標,楊-米爾斯能在這條主線裡佔有一席之地,其重要性不言而喻。有了這樣的認知,我們才能繼續我們下面的故事。
在物理學的統一史裡,有一個人的工作至關重要,這個重要倒不是說他提出了多重要的理論(雖然他的理論也極其重要),而是他顛倒了物理學的研究方式。以他為分水嶺,物理學家探索世界的方式發生了根本的改變。正是這種改變,讓20世紀的物理學家們能夠遊刃有餘的處理比之前複雜得多得多的物理世界,讓他們能夠大膽的預言各種以前想都不敢想的東西。這種思想也極其深刻的影響了楊振寧先生,楊振寧先生反過來又把這種思想發揚光大,最後產生了精妙絕倫的楊-米爾斯理論。
那麼這個人是誰呢?沒錯,他就是愛因斯坦。那麼,愛因斯坦究發現了什麼,以至於顛倒了物理學的研究方式呢?
大家先想一想,愛因斯坦之前的物理學家是怎麼做研究的?
他們去做各種實驗,去測量各種資料,然後去研究這些資料裡的規律,最後用一組數學公式來“解釋”這些資料,如果解釋得非常好,他們就認為得到了描述這種現象的物理定律,然後順帶著發現了隱藏在理論裡的某些性質,比如某種對稱性。在這裡我們能清晰的看到實驗-理論-對稱性這樣一條線,這也符合我們通常的理解。
但是,愛因斯坦把這個過程給顛倒了,他發現上面的過程在處理比較簡單的問題的時候還行,但是當問題變得比較複雜,當實驗不再能提供足夠多的資料的時候,按照上面的方式處理問題簡直是一種災難。
比如,牛頓發現萬有引力定律的時候,開普勒從第谷觀測的海量天文資料裡歸納出了行星運動的三大定律,然後牛頓從這裡面慢慢猜出了引力和距離的平方反比關係,這個還馬馬虎虎可以猜出來。我們再來看看牛頓引力理論的升級版-廣義相對論的情況:
上圖是廣義相對論的引力場方程,你告訴我這種複雜的方程要怎樣從實驗資料裡去湊出公式來?況且,廣義相對論在我們日常生活裡跟牛頓引力的結果幾乎一樣,第谷觀測了那麼多天文資料可以讓開普勒和牛頓去猜公式,但是在20世紀初有啥資料讓你去猜廣義相對論?水星近日點進動問題是極少數不符合牛頓引力理論的,但是人們面對這種問題,普遍第一反應是在水星裡面還有一顆尚未發現的小行星,而不是用了幾百年的牛頓引力有問題。退一萬步說,就算你當時認為那是因為牛頓引力不夠精確造成的,但是就這樣一個數據,你怎麼可能從中歸納出廣義相對論的場方程?
經過一連串的深度碰壁之後,愛因斯坦意識到當理論變得複雜的時候,試圖從實驗去歸納出理論的方式是行不通的,洛倫茲不就是被邁克爾遜-莫雷實驗牽著鼻子走,最終才錯失發現狹義相對論的麼?實驗不可靠,那麼愛因斯坦就要找更加可靠的東西,這個更加可靠的東西就是對稱性!
於是愛因斯坦在物理學的研究方式上來了一場哥白尼式的革命:他先透過觀察分析找到一個十分可靠的對稱性,然後要求新的理論具有這種對稱性,從而直接從數學上推匯出它的方程,再用實驗資料來驗證他的理論是否正確。在這裡,原來的實驗-理論-對稱性變成了對稱性-理論-實驗,對稱性從原來理論的副產品變成了決定理論的核心,實驗則從原來的歸納理論的基礎變成了驗證理論的工具。理解這一轉變非常的重要,後面的物理學家都是這麼幹的,我們要先把思路調對,不然到時候就容易出現各種不適應。
愛因斯坦利用這樣思路,先確定了廣義座標不變性,然後從這個對稱性出發得到了一套新的引力理論,這就是廣義相對論。這也是為什麼其他科學家看到廣義相對論之後一臉懵逼,而且說如果不是愛因斯坦,恐怕50年之內都不會有人發現這套理論的原因。愛因斯坦是第一個這麼反過來乾的,廣義相對論大獲成功之後人們才發現原來理論研究還可以這麼幹,這種思想後來被楊振寧先生髮揚光大,並形成了“對稱決定相互作用”這樣的共識。
愛因斯坦完成廣義相對論之後,繼續朝著更偉大的目標“統一場論(統一引力和電磁力)”進軍,在強力和弱力還沒有被發現的年代,能夠統一引力和電磁力的理論似乎就是終極理論了。我們現在都知道愛因斯坦終其後半生都未能完成統一場論,但是統一場論的巨大光環和愛因斯坦自帶的超級偶像的磁場還是吸引了一些物理學家,也帶來了一些有意思的新想法。
我們再來理一理愛因斯坦的思路:愛因斯坦把對稱性放在更加基礎的位置,然後從對稱性匯出新的理論。他從洛倫茲不變性匯出了狹義相對論,從廣義座標不變性匯出了廣義相對論,現在我們試圖統一引力和電磁力,那麼,有一個問題就會很自然地被提上日程:究竟什麼樣的一種對稱性會匯出電磁理論呢?
這個問題很自然吧,但是它的答案卻不是那麼好找的,這麼容易就讓你找到導致電磁理論的不變性,上帝豈不是太沒面子了?麥克斯韋方程組是從前人的實驗經驗定律總結出來的,並沒有指定什麼具體的對稱性,那要怎麼辦呢?
不著急,諾特定理告訴我們對稱性跟守恆定律是一一對應的,我現在不是要找匯出電磁理論的對稱性麼?那麼我就去看看電磁理論裡有什麼守恆定律唄,最好還是電磁理論裡特有的。
說到電磁理論裡特有的守恆定律,那肯定就是電荷守恆啊。電荷肯定是隻有電磁學才有的東西,而且電荷守恆定律又是這麼明顯,不管是不是它,它肯定是嫌疑最大的那個,必須抓起來嚴刑拷問,看看跟它私通的對稱性到底是什麼。
在外爾的嚴刑逼供下,電荷守恆招了:跟電荷守恆相對應的對稱性是波函式的相位不變性,(在量子力學裡粒子的狀態是用波函式來描述的,既然波那肯定就有相位),但是由於歷史原因,這個相位不變性我們一直稱為規範不變性,也叫規範對稱性。
總的來說就是:規範不變性導致電荷守恆。
但是事情還沒完,外爾接著發現了一件真正讓人吃驚的事:我們上面說規範不變性導致電荷守恆,這裡說的規範不變性指的是整體規範不變性,但是外爾發現如果我們要求這個規範不變性是局域的,那麼我們就不得不包括電磁場。
泡利針對這個做了進一步的研究,1941年,泡利發表了一篇論文,他在論文裡嚴格的證明了:U(1)群整體規範對稱性對應電荷守恆,它的局域規範對稱性產生電磁理論,甚至可以直接從它推匯出麥克斯韋方程組。U(1)群是群論裡的一種群的名字,叫酉群(unitary group),或者么正群,數字1表示這是1階酉群,我們現在只需要知道對稱性在數學上就是用群論來描述,而且通常不同的理論對應不同的群(這裡電磁理論就對應U(1)群)就行了。
也就是說,我們現在終於找到了決定電磁理論的對稱性,它就是U(1)群的局域規範對稱性。U(1)群和規範對稱我前面都解釋了,那麼問題的關鍵就落在對稱性的整體和局域的區別上了。
整體對稱,顧名思義,如果一個物體所有的部分都按照一個步調變換,那麼這種變換就是整體的。打個比方,舞臺上所有的演員都同步地向前、向後走,或者全都做同樣的動作,觀眾看著演員都整整齊齊的,覺得所有人都像是一個人的複製品一樣,這樣的變換就是整體的。如果經過這樣一種整體的變換之後,它還能保持某種不變性,我們就說它具有整體對稱性。
有了整體對稱的概念,局域對稱就好理解了,類比一下,如果一個物體不同的部分按照不同的步調變換,那麼這種變換就是局域的。還是以舞臺為例,導演為了使表演更具有個性,他想讓演員表現出波浪的樣子,或者是千手觀音那樣,再或者是形成各種不斷變化的圖案,這種時候每個人的動作變換就不一樣了吧,也不會說所有人都像一個人的複製品一樣了,這時候這種變換就是局域的。因為它不再是所有的人按照一個規則變換,而是區域性的每個人都有他局域特有的變換規則。同樣的,如果經過這樣一種局域的變換之後,它還能保持某種不變性,我們就說它具有局域對稱性。
從上面的情況我們看出來,整體變換要簡單一些,所有的地方都按照同樣的規則變換,而局域變換就複雜多了,不同的地方按照不同的規則變換。所以,很明顯,如果你要求一套理論具有某種局域對稱,這比要求它具有整體對稱複雜得多,局域變換對物理定律形式的要求就更加嚴格一些。但是,你一旦讓它滿足局域對稱了,它能給你的回報也會多得多。
還是電磁理論的例子:整體規範對稱性下我們只能得到電荷守恆,但是一旦要求它具有局域規範對稱性,整個電磁理論,甚至麥克斯韋方程組都直接得到了。電荷守恆和麥克斯韋方程組,這就是整體對稱和局域對稱給的不同回報,孰輕孰重差別很明顯吧?電荷守恆是可以直接從麥克斯韋方程組裡推匯出來的。
以上是偏科普的解釋,從數學的角度來說,整體變換就是你所有的變換跟時空座標無關,局域變換就是你的變換是一個跟時空座標相關的函式。跟時空座標相關的函式,其實就是說不同的時空點,這個函式值是不一樣的,也就是說變換不一樣。
不管從哪種解釋(從數學更容易),我們其實都可以看出:整體變換其實只是局域變換的一種特例。局域變換裡變的是一個跟時空座標相關的函式,但是這個函式的值也可以是一個定值啊,這時候局域變換就退化成整體變換了。
那麼,一個大膽的想法就產生了:在電磁理論裡,整體規範對稱性對應著電荷守恆,但是我一旦要求這個整體規範對稱性在局域下也成立,我立馬就得到了整個電磁理論。那麼我可不可以把這種思想推廣到其他領域呢?比如強力、弱力,有沒有可能同樣要求某種整體對稱性在局域成立,然後可以直接產生強力、弱力的相關理論呢?
這是一個十分誘人的想法,楊振寧從他讀研究生的時候就在開始琢磨這個事,但是一直到十幾年後的1954年,也就是他32歲的時候才有結果,這個結果就是大名鼎鼎的非阿貝爾規範場論,也叫楊-米爾斯理論。
在我們正式講楊-米爾斯理論之前,我們先來聊一聊楊振寧先生的品位。
有一個曾經跟愛因斯坦共事過的物理學家這樣回憶:我記得最清楚的是,當我提出一個自認為有道理的設想時,愛因斯坦並不與我爭辯,而只是說:“啊,多醜!”。只要他覺得一個方程是醜的,他就對之完全失去了興趣,並且不能理解為什麼還會有人願意在上面花這麼多時間。他深信,美是探索理論物理中重要結果的一個指導原則。
愛因斯坦自己也說:“我想知道上帝是如何創造這個世界的。對這個或那個現象、這個或那個元素的譜我並不感興趣。我想知道的是他的思想,其他的都只是細節問題。”
愛因斯坦對一個理論的美學要求達到了一種不可思議的地步。從麥克斯韋電磁學裡發現的洛倫茲不變性成了狹義相對論的核心,但是愛因斯坦覺得狹義相對論偏愛慣性系,這點讓他很不滿。他覺得洛倫茲不變性的範圍太窄了,上帝不應該讓這麼美的思想之侷限在慣性系裡,所以他要以一個在所有參考系裡都成立的不變性為前提,重新構造一個新的理論,這就是廣義座標不變性和廣義相對論的來源。
說白了,愛因斯坦就是覺得:這麼好的對稱性,這麼美的想法,如果上帝你不選用它作為構造世界的理論,那上帝簡直就是瞎子。愛因斯坦深信上帝一定是用簡單和美來構造這個世界的,所以我從如此簡單和美的對稱出發構造的理論一定是有意義的。
楊振寧先生的品位,跟愛因斯坦幾乎是一模一樣的,這也是一位對理論的美學要求達到了不可思議地步的人。楊振寧先生最為崇敬的物理學家就是愛因斯坦,他對愛因斯坦顛倒物理學的研究方式,把對稱性放在極為重要的位置,以及對科學理論簡單和美的追求都有非常深刻的領悟。除此之外,楊振寧還有一個一般物理學家不具備的優勢:他有一個非常厲害的數學家老爹,這就使得楊振寧的數學水平比同時代的物理學家高出很多。數學在現代物理中有多重要不用我多說,這就叫憑實力拼爹~
楊振寧先生是父親楊武之是著名的數學家和數學教育家,是數學教育家就意味著他會以一種非常恰當的方式讓楊振寧接觸並喜歡數學。楊振寧還是中學生的時候,他就從父親那裡接觸到了群論的基礎原理。諾特定理的發現讓物理學家們重視對稱性,但是他們對群論這種對稱性的數學語言卻沒有足夠的重視。當時很多物理學家都反對把群論這種過於抽象的數學語言引入到物理學裡來,懟神泡利直接把群論嘲諷為“群禍”,薛定諤表示附議,愛因斯坦也只是把群論當做一個細枝末節的工作。
幸運的是,楊武之恰好是擅長群論的數學家,他在清華大學開過群論的課程,當時華羅庚、陳省身這些未來的數學大師都來聽過課。有這樣的父親,楊振寧對群論肯定不陌生,而楊振寧在西南聯大學士論文的題目選的就是《群論和多原子分子的振動》,他的老師吳大猷就藉此引導他從群論開始關注物理學的對稱性問題。
所以,年紀輕輕的楊振寧就已經非常重視物理學的對稱性問題,並且在那個其他物理學家還在普遍懷疑群論的年代,他已經很好的掌握了群論這種研究對稱性的重要工具,這無疑是非常幸運的。有這樣的楊振寧,他會對泡利在1941年發表的那篇論文感興趣是很自然的。
我們把眼光再拉回20世紀四五十年代,這時候人們已經知道自然界除了電磁力和引力之外還有強力和弱力,強力把質子和中子黏在一起(不然質子都帶正電,同性相斥早就把原子核拆了),弱力在原子核衰變的時候發揮作用(比如中子衰變變成質子、電子和反中微子的β衰變)。但是那時候對強力和弱力的認識都還非常的膚淺,湯川秀樹的介子理論、費米的四費米子理論都能只能解釋強力、弱力的一些現象,還有大把的問題他們沒法解決,誰都知道這些理論只是關於強力、弱力的一個過渡理論,最後肯定要被更加精確的理論取代,但是該怎樣去尋找更加精確的理論,大家心裡也都沒譜,沒有一個十分清晰的思路。
但是楊振寧先生那時候的思路確是很清晰的:他對理論的美學要求是跟愛因斯坦一樣苛刻的,因此,任何只是試圖粗糙、唯象的模擬強力、弱力的理論他都懶得搭理(就跟愛因斯坦嫌棄它們長得醜一樣)。然後,加上數學大牛的父親和恩師吳大猷的悉心栽培,楊振寧那先生對數學的群論、物理學的對稱性都有非常深刻的理解,所以他就特別理解外爾那種想法的重要性。所以,他要不惜一切代價的擴充套件它。
外爾發現U(1)群整體規範對稱性對應電荷守恆,但是,一旦我把這個整體對稱性推廣到局域,我就可以直接得到整個電磁理論。這種想法對物理學上有“潔癖”的楊振寧來說,吸引力實在是太大了,因為它實在是太美太簡潔,給出的回報也太豐厚。如果我在強力、弱力裡透過把某種規範對稱性從整體推廣到局域,是不是也可以得到關於強力、弱力的理論呢?
我們從事後諸葛亮的角度看,好像這一切都顯得很自然,好像只要是物理學家都應該想到這個。但其實不然,且不說當愛因斯坦在搞統一場論的時候,他就已經被所謂的主流物理學界給邊緣化了,外爾跟著愛因斯坦搞統一場論時提出的這種想法跟著被邊緣化是很正常的事情。物理學家們每天都要產生各種各樣的想法,這些想法哪些可靠,哪些值得考慮,哪些值得自己深入研究,哪些東西值得自己不顧一切的去守護,這原本就是一個極困難的問題,也是非常考驗物理學家水平的事情。
在當時更多物理學家的眼裡,外爾這樣的手法可能確實很漂亮,但有點“繡花枕頭”的嫌疑:麥克斯韋方程組我們早就知道了,狄拉克、費曼等人也已經成功的把電磁場量子化了(就是所謂的量子電動力學),你在電磁領域這樣顛來倒去好像確實很漂亮,但是沒有增加任何知識啊?好吧,就算你的這個東西可能更普適,可能在強力、弱力裡也有用武之地,但是在當時主流的描述強力和弱力的理論(也就是湯川秀樹的介子理論和費米的四費米子理論)裡,也看不到合適的用武的地方。而且,一般物理學家對“對稱決定相互作用”的認識還遠遠沒有達到愛因斯坦和楊振寧的水平,所以他們不怎麼關注這個也是自然的。
所以,當時除了楊振寧、泡利、外爾等寥寥幾人關注這個以外,其他人對此根本就不關心。而在這些關注的人裡,楊振寧又無疑是其中對此關注度最高的一個,畢竟本科論文就是做的這個,後來給他帶來諾貝爾獎的宇稱不守恆也是關於對稱性的,他一直對對稱性在物理學裡的作用保持極高的關注度。
既然想推廣外爾的思想,試圖透過找到某種新的局域規範對稱性來找到強力、弱力的理論,那麼關鍵就是要找到這種對稱性。但是怎麼找這種對稱性呢?當然還是按照諾特定理,去看看強力、弱力裡有什麼守恆定律唄,最好還是像電荷守恆那樣,在那種相互作用力特有的。
楊振寧透過一番審查,發現弱相互作用裡暫時沒有什麼特殊的守恆定律,但是強相互作用力裡卻有一個現成的:同位旋守恆。而且這個同位旋守恆還只在強相互作用下守恆,在其它作用下不一定守恆,這不剛好麼。
同位旋是啥呢?大家只要看一下質子(1.6726231 × 10^-27千克)和中子(1.6749286 ×10^-27千克)的質量,就會發現它們的質量實在是太接近了(差別在千分之一)。而且,人們還發現2個質子、1個質子1箇中子、2箇中子之間的強相互作用幾乎是相同的,也就是說,如果我們不考慮電磁作用,在強相互作用的眼裡,質子和中子完全是相同的。
於是,海森堡就來了提出了一個大膽的想法:他認為質子和中子壓根就是同一種粒子-核子的兩種不同的狀態,它們共同組成了一個同位旋二重態。在抽象的同位旋空間裡,質子可以“旋轉”成為中子,中子也可以“旋轉”成為質子,因為質子和中子在強相互作用下是一樣的,所以,我們就可以說:強相互作用具有同位旋空間下的旋轉不變性。
大家可能注意到我上面的“旋轉”打了一個引號,因為我們這裡說的旋轉並不是在我們常說的真實空間裡,而是在核子內部抽象出來的同位旋空間,因此這種對稱性又叫內部對稱性,而之前我們談的各種跟時空有關的對稱性就叫外部對稱性。內部對稱性咋一看好像不那麼真實,但其實它跟外部對稱是一樣真實自然的,它們一樣對應著守恆定律,強相互作用下同位旋空間裡的這種旋轉不變性就對應同位旋守恆。
關於同位旋的事情這裡就不再多說了,大家只要知道在強相互作用裡同位旋是守恆的,並且同位旋空間下質子和中子可以相互旋轉得到就行了。
因為描述對稱性的數學語言是群論,與同位旋這種對稱相對應的群叫SU(2)(特殊么正群),裡面的數字2提醒我們這是兩個物體(如質子和中子)相互變換來確定的。我們也先甭管這個SU(2)群到底是什麼意思(這是群論的基礎知識,感興趣的自己看群論),只需要知道這個群可以描述兩個物體相互變換的這種對稱性,跟電磁理論裡用U(1)群來描述電磁理論裡的對稱性一樣的就行了。
外爾和泡利發現,只要我們要求系統具有U(1)群的局域規範不變性,我們就能從中推匯出全部的電磁理論。那麼,楊振寧如果認為強力的本質由質子和中子相互作用產生,那麼推廣前面的思想,我們就應該要求系統具有SU(2)群的局域規範不變性。
好吧,要推廣那就推廣吧,不就是把局域規範不變性從U(1)群推廣到SU(2)群麼,有些人認為科學家們風風雨雨什麼沒見過,把一個東西從U(1)群推廣到SU(2)群應該沒什麼難度吧?那你就錯了,這玩意還真不是這麼簡單的,廣義相對論也不過是把狹義相對論裡的洛倫茲不變性推廣到了廣義座標不變性,你覺得這個簡單麼?
U(1)群的問題之所以比較簡單,是因為跟U(1)群對應的電磁理論它本身就具有局域規範對稱性。也就是說,當我們的麥克斯韋同學寫下麥克斯韋方程組的時候,他就已經把U(1)群的局域規範對稱性寫到這方程裡去了,雖然他自己沒有意識到。熟悉電磁理論的人都知道其實我們有兩套表述電磁場的體系,一套就是我們初中就開始學習的場強體系,還有一套勢體系,也就是電磁勢這些東西,從這個角度很容易就能看出它的規範不變性。
但是SU(2)這裡一切都是空白,沒有電磁勢這樣的東西。楊振寧先生想做的就是要找到類似電磁勢這種具有局域規範不變性的東西,然後利用他們來描述強力,所謂的推廣是這個樣子的一種推廣。在這種推廣裡,最困難的地方就在這四個字:非阿貝爾。
在前面我跟大家提過,楊-米爾斯理論又叫非阿貝爾規範場論,這個阿貝爾指的是阿貝爾群(以挪威的天才數學家阿貝爾命名),它又叫交換群,通俗的講就是這個群裡的運算是滿足交換律的。
最簡單的例子就是整數的加法,小學生都知道加法滿足交換律:3+5=5+3,不論你加數的順序怎麼交換,最後的結果都不變。於是,我們就說整數和整數的加法構成了一個整數加法群,這個群的運算(加法)是滿足交換律的,所以這個整數加法群就是阿貝爾群。
那麼,非阿貝爾群自然就是指群的運算不滿足交換律的群。那麼,不滿足交換律的運算有沒有呢?當然有了,最常見的就是矩陣的乘法。稍微有點線性代數基礎的人都知道:兩個矩陣相乘,交換兩個矩陣的位置之後得到的結果是不一樣的。而矩陣這種東西在數學、物理學裡是非常基礎的東西,比如你對一個物體進行旋轉操作,最後都可以轉化為物體跟一個旋轉矩陣的運算,這樣非阿貝爾其實就沒啥奇怪的了。
上圖是一個新兵,他現在要執行兩個操作,一個是順時針旋轉90°(從上往下看),一個是向右倒(其實就是從外往裡看順時針旋轉90°)。上面的a圖是先旋轉再右倒,而下面的b圖則是先右倒再旋轉,我們可以清楚的看到,最後這兩個人的狀態是完全不一樣的(一個左側對著你,一個頭對著你)。
狀態不一樣說明什麼呢?說明這兩個旋轉操作如果改變先後次序的話,得到的結果是不一樣的,而這兩個旋轉操作都可以透過跟兩個矩陣相乘得到,這說矩陣的乘法是不能隨意交換順序的。
好了,有了這些概念,我們再回到楊振寧先生的問題上來。
外爾把U(1)群的整體規範對稱性推廣到了局域,因為U(1)群(1×1矩陣)是阿貝爾群,所以這個過程很簡單;楊振寧試圖把SU(2)群的整體規範對稱也推廣到局域,但SU(2)群(2×2矩陣)是非阿貝爾群,這個就麻煩了。
我們知道楊振寧先生的數學水平在物理學家群體裡是非常高的,他的父親楊武之就是群論大師,他自己也很早就進入了對稱性領域。饒是如此,他從泡利1941年的論文開始,前前後後過了十幾年,一直到1954年,他才和米爾斯(當時和楊振寧先生在同一間辦公室,是克勞爾教授的博士研究生)一起寫出了劃時代的論文《同位旋守恆和同位旋規範不變性》和《同位旋守恆和一個推廣的規範不變性》。
這兩篇論文正式宣告了楊-米爾斯理論的誕生,楊振寧先生終於把局域規範對稱的思想從阿貝爾群推廣到了更一般的非阿貝爾群(阿貝爾群的電磁理論成了它的一個特例),從而使得這種精妙的規範對稱可以在電磁理論之外的天地大展拳腳,也使得他一直堅持的“對稱決定相互作用”有了落腳之地。為了區別起見,我們把外爾的那一套理論成為阿貝爾規範場論,把楊振寧和米爾斯提出來的稱為非阿貝爾規範場論,或者直接叫楊-米爾斯理論。
楊-米爾斯理論給我們提供了一個精確的數學框架,在這個框架裡,只要選擇了某種對稱性(對應數學上的一個群),或者說你只要確定了某個群,後面的相互作用幾乎就被完全確定了,它的規範玻色子的數目也完全被確定了。這就是為什麼後來大家能直接從強力和弱電理論裡預言那麼多還未被發現的粒子的原因。
什麼是規範玻色子?科學家們按照自旋把基本粒子分成了費米子(自旋為半整數)和玻色子(自旋為整數),其中費米子是組成我們基本物質的粒子,比如電子、夸克,而玻色子是傳遞作用力的粒子,比如光子、膠子。有些人可能是第一次聽說傳遞作用力的粒子這種說法,會感覺非常奇怪,怎麼作用力還用粒子傳遞?
沒錯,在量子場論裡,每一種作用力都有專門傳遞作用力的粒子。比如傳遞電磁力的是光子,傳遞強力的是膠子,傳遞弱力的是W和Z玻色子,傳遞引力的是引力子(不過引力子還沒有找到)。兩個同性電子之間為什麼會相互排斥呢?因為這兩個電子之間在不停的發射交換光子,然後看起來就像在相互排斥,這就跟兩個人在溜冰場上互相拋籃球然後都向後退一樣的道理。那麼相互吸引就是朝相反的方向發射光子了,其他的力也都是一樣,這些傳遞相互作用的玻色子在規範場裡都統統被稱為規範玻色子。
也就是說,在楊-米爾斯理論裡,那些傳遞相互作用的粒子都叫規範玻色子,每一個群都有跟他對應的規範玻色子,只要你把這個群確定了,這些規範玻色子的性質就完全確定了。比如在U(1)群裡,規範玻色子就只有一個,那就是光子;在SU(3)群裡,理論計算它的規範玻色子不多不少就是8個,然後實驗物理學家就根據這個去找,然後真的就找到了8種膠子。以前是實驗物理學家發現了新粒子,理論物理學家要琢磨著怎麼去解釋,現在是理論物理學家預測粒子,實驗物理學家再去找,愛因斯坦顛倒研究物理的方法現在終於從蹊徑成了主流。
楊-米爾斯理論從數學上確定了“對稱決定相互作用”,那麼我們接下來的問題就是“什麼樣的對稱決定什麼樣的相互作用”了。比如,我現在要描述強力,那麼強力到底是由什麼對稱決定的呢?
有些人可能覺得奇怪,你上面不是說了一大片同位旋守恆麼,楊振寧先生不就是看到同位旋守恆和電荷守恆的相似性才最終提出了楊-米爾斯理論麼,為什麼現在還要來問強力是什麼對稱決定的,難道不是同位旋麼?
沒錯,還真不是同位旋!
海森堡從質子和中子的質量相近提出了同位旋的概念,同位旋守恆確實也只在強力中成立,但是大家不要忘了質子和中子的質量只是接近,並不是相等。楊-米爾斯理論裡的對稱是一種精確對稱,不是你質子和中子的這種近似相等,當時的科學家們把質子和中子的微小質量差別寄希望於電磁汙染,但事實並非如此。所以,當楊振寧試圖用質子中子同位旋對稱對應的SU(2)群作為強力的對稱群的時候,得到的結果肯定跟實際情況不會相符的。
但是,我們要注意到當時才1954年,人們對強力的認識還太少了,後來我們知道真正決定強力的精確對稱是夸克的色對稱,與之對應的群是SU(3)群,所以我們把最終描述強力的理論稱之為量子色動力學(QCD)。但是,夸克這個概念要到1964年才由蓋爾曼、茨威格提出來,所以楊振寧在1954年就算想破腦袋也不可能想到強力是由夸克的色對稱決定的。
夸克有六種(上夸克、下夸克、奇夸克、粲夸克、底夸克、頂夸克),每一種夸克也稱為一味,質子和中子之間的微小質量差異是就是因為上夸克和下夸克的質量不同。另外,每一味夸克都有三種色(紅、綠、藍),比如上夸克就有紅上夸克、綠上夸克和藍上夸克,這不同色的同種夸克之間質量是完全相等的,這是一種完全精確的對稱,這種色對稱最後決定了強相互作用。
一旦建立了這種夸克模型,並且意識到夸克色對稱這種精確對稱對應SU(3)群,那麼接下來利用楊-米爾斯理論去構造描述強力的理論就是非常簡單的事情,基本上就是帶公式套現成的事。所以,成功描述強力的量子色動力學的核心就是夸克模型+楊-米爾斯理論。
在弱力這邊情況也是類似的,你要想找到描述弱力的理論,那就先去找到決定弱力的精確對稱和相應的群,然後直接按照楊-米爾斯理論來就行了。但是,弱力這邊的情況稍微複雜一點,科學家們沒找到什麼弱力裡特有的精確對稱,但是他們發現,如果我把弱力和電磁力統一起來考慮,考慮統一的電弱力,我倒是能發現這種精確對稱。於是,他們索性不去單獨建立描述弱力的理論了,轉而直接去建立統一弱力和電磁力的弱電統一理論。而最後在弱電相互作用中真正起作用的是(弱)同位旋——超荷這個東西,他們對應的群是SU(2)×U(1)(×表示兩個群的直積)。
描述強力的量子色動力學和描述電磁力和弱力的弱電統一理論一起構成了所謂的粒子物理標準模型,於是我們可以在楊-米爾斯理論這同一個框架下描述電磁力、強力和弱力,這是物理學的偉大勝利。同時,我們也要清楚的知道,楊-米爾斯理論不等於標準模型(沒有夸克模型你拿著理論也不知道怎麼用),它是一個數學框架,是一把神兵利器,它本身並不產生具體的理論知識,但是一旦你把它用在合適的地方,它就能給你帶來超出想象的回報(想想我們50年代末還對強力弱力束手無策,但是70年代末就完全馴服了它們)。
標準模型的建立是另一個非常宏大的故事,這裡就不多說了,這裡談一個不得不說的問題:質量問題。
在上面我們知道了費米子是組成物質的粒子,玻色子是傳遞相互作用力的粒子。比如兩個電子之間透過交換光子來傳遞電磁力,兩個夸克透過交換膠子來傳遞強力,那麼光子和膠子就分別是傳遞電磁力和強力的規範玻色子。但是,大家有沒有考慮過玻色子的質量問題?如果傳遞相互作用力的玻色子質量過大或者過小會咋樣?
還是以溜冰場傳球為例,假設兩個人站在溜冰場上相互傳籃球,那麼一開始他們會因為籃球的衝力而後退(這就是斥力的表現),從而把距離拉開,但是他們會一直這樣慢慢後退下去麼?當然不會!當兩人之間的距離足夠遠的時候,你投籃球根本就投不到我這裡來了,那我就不會後退了。再想一下,如果你投的不是籃球而是鉛球那會怎樣?那可能我們還在很近的時候,你的鉛球就投不到我這裡來了。
在溜冰場的模型裡,球就是傳遞作用力的玻色子,你無法接到球就意味著這個力無法傳到你這裡來,就是說它的力程是有限的。從籃球和鉛球的對比中我們也能清楚的知道:玻色子的質量越大,力程越短,質量越小,力程越長,如果玻色子的質量為零,那麼這個力程就是無限遠的。
所以,為什麼電磁力是長程力,能傳播很遠呢?因為傳遞電磁力的光子沒有質量。但是我們也清楚的知道,強力和弱力都僅僅侷限在原子核裡,也就是說強力、弱力都是短程力,所以,按照我們上面的分析,那麼傳遞強力和弱力的玻色子似乎應該是有質量的,有質量才能對應短程力嘛。
但是,楊振寧在研究規範場的時候,他發現要使得系統具有局域規範不變性,那麼傳遞作用力的規範玻色子的質量就必須為零。也就是說,規範玻色子如果有質量,它就會破壞局域規範對稱性。
為什麼局域規範對稱性要求玻色子的質量必須為零呢?你可以這樣想,什麼叫局域規範對稱?那就是不同的地方在做著不同的變換,既然不同的地方變換是不一樣的,那麼肯定就必須有個中間的信使來傳遞這種狀態,這樣大家才能協調工作,不然你跳你的我跳我的豈不是亂了套?好,既然這個信使要在不同地方(也可能是兩個非常遠的地方)傳遞狀態,按照上面的分析,它是不是應該零質量?只有質量為零才能跑的遠嘛~
所以,這樣分析之後,我們就會發現局域規範對稱性和規範玻色子零質量之間的對應關係是非常自然的。但是,這樣就造成了現在的困境:局域規範對稱性要求規範玻色子是零質量的,但是強力、弱力的短程力事實似乎要求對應的規範玻色子必須是有質量的,怎麼辦?
這個問題不僅困擾著楊振寧,它也同樣困擾著泡利(其實當時對規範場感興趣的也就他們寥寥幾個)。泡利開始對規範場的事情也很感興趣(楊振寧就是讀了泡利1941年的那篇論文才開始對規範場感興趣的),但是當泡利發現了這個似乎無解的質量問題之後,他就慢慢對規範場失去了興趣,也就沒能得出最後的方程。
楊振寧的情況稍微不一樣,他的數學功底非常好,對群論的深入理解能夠讓他更深刻的理解對稱性的問題(想想那會兒物理學家都不待見群論,泡利還帶頭把群論稱為群禍)。另外,在美學思想上,楊振寧是愛因斯坦的鐵桿粉絲,他們都是“對稱決定相互作用”堅定支持者,這使得楊振寧對規範場產生了謎之喜愛。而且,楊振寧那會兒才30歲左右,是科學家精力和創造力的巔峰時期,自然無所畏懼。
所以,楊振寧一直在瘋狂地尋找楊-米爾斯方程,找到方程之後,即便知道有尚未解決的質量問題,他依然決定發表他的論文。在他眼裡,這個方程,這套理論是他心裡“對稱決定相互作用”的完美代表,他跟愛因斯坦一樣深信上帝喜歡簡潔和美,深信上帝的簡單和美是由精確對稱決定的。如果是這樣,那麼還有什麼比基於規範不變性這種深刻對稱的楊-米爾斯理論更能描繪上帝的思想呢?
楊振寧對對稱性的深刻理解使得他對楊-米爾斯理論有非常強的信心,至於強力、弱力上表現出來的質量問題,那不過是這個理論在應用層面出現了一些問題。強力、弱力比電磁力複雜很多,因此用楊-米爾斯理論來解釋強力、弱力自然就不會像處理電磁力那樣簡單。為什麼電磁力這麼簡單?你想想,電子有電效應,電子的運動產生磁效應,電子之間的相互作用是透過光子這個規範玻色子傳遞的,所以電磁力的本質就是電子和光子的相互作用。這裡只有一個粒子電子,和一個規範玻色子光子,而且光子還是沒有質量的,你再看看強力裡面,三種色夸克,八種不同的膠子,這鐵定比電磁力複雜多了啊!
所以,楊振寧想的是:楊-米爾斯理論沒問題,現在它應用在強力弱力上出現了一些問題(質量問題就是初期最大的一個),這也是自然的。這些是問題,而非錯誤,以後隨著人們研究的深入,這些問題應該可以慢慢得到解決的。
歷史的發展確實是這樣,質量問題後來都透過一些其他的手段得到了解決,那麼質量問題最終是怎麼解決的呢?
在描述強力的量子色動力學裡,我們注意到傳遞夸克間作用力的膠子本來就是零質量的,零質量跟規範對稱性是相容的。那但是,如果這樣的話,零質量的玻色子應該對應長程力啊,為什麼強力是短程力(只在原子核裡有效)呢?這就涉及到了強力裡特有的一種性質:漸近自由。漸近自由說夸克之間的距離很遠的時候,它們之間的作用力非常大,一副誰也不能把它們分開的架勢,但是一旦真的讓它們在一起了,距離很近了,它們之間的相互作用力就變得非常弱了,好像對面這個夸克跟它沒任何關係似的,活脫脫的一對夸克小情侶。這樣在量子色動力學裡,零質量的規範玻色子就和強力的短程力沒有衝突了。
漸近自由解釋了為什麼膠子是零質量但是強力確是短程力,那麼傳遞弱力的W和Z玻色子可是有質量的。有質量的話短程力是好解釋了,但是我們上面說有質量的規範玻色子會破壞規範對稱性,這規範對稱性可是楊-米爾斯理論的根基啊,它被破壞了那還怎麼玩?
最後解決這個問題的是希格斯機制。希格斯機制是來打圓場的:你楊-米爾斯理論要求規範玻色子是零質量的,但是最後我們測量到W和Z玻色子是有質量的,怎麼辦呢?簡單,我認為W和Z這些傳遞弱力的規範玻色子一出生的時候是零質量的,但是它來到這個世界之後慢慢由於某種原因獲得了質量,也就是說它們的質量不是天生的而是後天賦予的,這樣就既不與楊-米爾斯理論相沖突,也不跟實際測量相沖突了。
所以,希格斯機制其實就是賦予粒子質量的機制。它認為我們的宇宙中到處都充滿了希格斯場,粒子如果不跟希格斯場發生作用,它的質量就是零(比如光子、膠子),如果粒子跟希格斯場發生作用,那麼它就有質量,發生的作用越強,得到的質量就越大(需要說明的是,並不是所有的質量都來自於粒子和希格斯場的相互作用,還有一部分來自粒子間的相互作用)。2012年7月,科學家終於在大型強子對撞機(LHC)中找到了希格斯粒子,為這段故事畫上了一個圓滿的句號,也理所當然地預約了2013年的諾貝爾物理學獎。
這樣楊-米爾斯理論就可以完整的描述強力、弱力和電磁力了,在霍夫特完成了非阿貝爾規範場的重整化(重整化簡單的說就是讓理論能算出有意義的數值,而不是無窮大這種沒意義的結果,這是點粒子模型經常會出現的問題。舉個最簡單的例子,我們都知道電荷越近,它們之間的電磁力越大,那麼當電荷的距離趨近於零的時候,難道電磁力要變成無窮大麼?這個當做思考題~)之後,粒子物理標準模型就正式投產商用。