發表在最近的《自然-科學報告》的論文,所描述的一種新的機器學習理論,提出了一個關於科學本質的基本問題。
有人可能會感到奇怪:提出了什麼樣的基本問題?機器學習與科學本質有什麼關係?這得要從機器學習與科學本質的基本概念簡單說起。
機器學習是人工智慧的一個分支,它以資料為基礎,以“推理”為重點,到以“知識”為重點,再到以“學習”為重點的自然清晰的學習方法。顯然,機器學習是實現人工智慧的一個途徑,即以機器學習為手段解決人工智慧中的問題。機器學習演算法從資料中自動分析獲得規律,並利用規律對未知資料進行預測。
科學是認識宇宙的實踐方法與知識體系,也是以所觀察到的資料為基礎,以“推理”為重點,到以“知識”為重點,再到以“學習”為重點的自然清晰的途徑,從資料中分析獲得規律,並利用規律對未知資料進行預測。科學強調預測結果的具體性和可證偽性,這有別於泛泛的哲學。科學也不等同於尋求絕對無誤的真理,而是在現有基礎上,摸索式地不斷接近真理,所以科學的發展史就是一部人類對宇宙的認識偏差的糾正史。
譬如通常在物理學中,會進行觀察,然後基於這些觀察的資料建立一個理論,然後使用該理論預測新的現象。
所以,該研究論文所做的是,用一種機器學習的黑匣子代替這樣的科學研究過程,這種黑匣子可以在不使用任何傳統理論、或定律的情況下,產生準確的預測。
該研究論文設計了一種新的機器學習理論與演算法,將過去對水星、金星、地球、火星、木星、和矮行星穀神星的軌道觀測的資料,輸入了計算機程式。該程式與稱為“服務演算法”的程式一起,無需使用牛頓運動定律和萬有引力定律,就可以準確地預測太陽系中其它行星的軌道。
該程式體現了用來確定自然界任何物理系統動力學的基本原理,該演算法在使用了很少的訓練例項後就學習了行星運動定律。換句話說,這種機器學習確實“學習了物理學定律。”
這就如機器學習的計算機程式使機器翻譯成為可能。機器翻譯會篩選大量資訊,以確定將一種語言中的一個單詞,翻譯成另一種語言中的單詞的頻率。這樣,機器學習程式可以進行準確地翻譯,而無需實際學習任何一種語言。
這一過程也體現在哲學思想實驗中,例如中文房間問題。中文房間(英語:Chinese room),是由當今世界最著名、最具影響力的哲學家之一、約翰·塞爾(John Searle)提出的一個思想實驗,一個不懂中文的人仍然可以使用一套代替理解的指令或規則,將中文句子“翻譯”成英語或其它任何語言而讓他人理解。
這在哲學上提出了這樣的基本問題:認知一種事物到底是意味著什麼?人的認知是否意味著除了遵循規則之外,頭腦中還發生著其他事情?
該研究的部分靈感來自牛津哲學家、尼克·博斯特倫(Nick Bostrom)的哲學思想實驗,即宇宙是計算機模擬。如果這是真的,那麼基本的物理定律應該揭示出宇宙是由各個時空塊組成的。這樣的離散的時空塊化理論被稱為離散場論。
離散場論(discrete field theories)認為宇宙是由一個個位元組成的,與人們通常創造的理論不同。儘管科學家通常會設計出有關物理世界行為方式的總體概念,但計算機只是在收集資料點的集合。
論文指出,“如果我們生活在模擬中,我們的世界必須是離散的。” 所設計的這一機器學習黑盒子技術,不需要物理學家從字面上相信模擬猜想,儘管它是基於此思想建立的程式,但可以做出準確的物理預測。
這樣的計算機機器學習理論提出了有關科學本身性質的問題:科學家不是要開發解釋世界、而不是簡單地收集資料的物理學理論嗎?這些機器學習理論不是物理學的基礎知識,對解釋和理解現象是否必要?
論文作者、普林斯頓大學物理學家、秦洪(Hong Qin)說:“我認為任何科學家的最終目標都是預測。” “您可能不一定需要定律。例如,如果我可以完美地預測一個行星軌道,那麼我就不需要知道牛頓的引力和運動定律。您可以辯稱,這樣做,您所認知的比所知道的牛頓定律要少。從某種意義上說是正確的,但是從實際的角度來看,目的都是在於做出準確的預測,這無可厚非。”