可以從Random graph (Random graph - Wikipedia)的角度進行數學描述:
將全球所有的人視為節點數量 [公式]趨近無窮的一個圖,圖中任意兩個節點之間的連線是否存在是隨機的。我們想要的是:任意『兩個人之間的最短路徑』這個隨機變數的期望。嘗試將這個隨機圖的生成過程用 preferential attachment models(Preferential attachment)描述:
在[公式]時間,假設已經有一小撮人生活在地球,其人數亦為[公式](理解為每增加一個人時間+1)。這[公式]個人以某種隨機的方式相互認識or不認識。記他們之間的無向圖為[公式], 在[公式]中每個節點[公式]的度數為[公式].
在下一時刻[公式],新加入一個人[公式],這個人認識[公式]的機率是[公式],[公式]取值取決於實際模型。 可以看出,模型假設之前的[公式]個人誰認識的人越多(度數[公式]越大),那麼就更有可能被新加入的人認識。
以此類推,每時刻增加一個人,以機率[公式]與之前的人隨機認識,直到[公式]等於全球人數[公式],我們就得到了一個龐大的無向隨機圖[公式],它描述了全球所有人之間的相識情況。
需要注意的是這個隨機圖基於 preferential attachment model 的假設,所以你也可以試著用更廣義的configuration model (http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/csci5352_2013_L11.pdf )去假設機率,自己規定合理的連線模式,比如每個人認識其他任何人的機率都是一樣的,等於總人數分之1(然而這個顯然不合理= =)。
接下來可以證明(https://www.win.tue.nl/~rhofstad/NotesRGCN.pdf)在最終的全球人口的無向圖[公式]中:
任意一個人[公式]認識人數為[公式]的機率約為 [公式]。
任意一個人[公式]認識的人數的期望為:[公式]
有了上面的機率[公式],我們就可以幹很多事情了。 比如:
推導兩點之間距離,即最短路徑,記為[公式]的期望[公式]
這就是題主要的東西,對於特定的模型引數[公式],可以使得這個[公式].
推導這個隨機圖的直徑[公式],有篇論文(http://www.win.tue.nl/~rhofstad/diamCMrev.pdf)
總之,我們很難統計出幾十億人之間準確的關係,然後據此畫一個圖來看六度理論是不是成立。但是可以利用基本假設(比如PAM的連線模式)去構建一個隨機圖,從機率論的角度推導『兩個人之間的最短路徑』這個隨機變數的期望。另外也可以在基本假設下,用計算機很簡單的模擬具有大量節點的隨機圖,然後直接去算兩個節點之間的平均距離。
可以從Random graph (Random graph - Wikipedia)的角度進行數學描述:
將全球所有的人視為節點數量 [公式]趨近無窮的一個圖,圖中任意兩個節點之間的連線是否存在是隨機的。我們想要的是:任意『兩個人之間的最短路徑』這個隨機變數的期望。嘗試將這個隨機圖的生成過程用 preferential attachment models(Preferential attachment)描述:
在[公式]時間,假設已經有一小撮人生活在地球,其人數亦為[公式](理解為每增加一個人時間+1)。這[公式]個人以某種隨機的方式相互認識or不認識。記他們之間的無向圖為[公式], 在[公式]中每個節點[公式]的度數為[公式].
在下一時刻[公式],新加入一個人[公式],這個人認識[公式]的機率是[公式],[公式]取值取決於實際模型。 可以看出,模型假設之前的[公式]個人誰認識的人越多(度數[公式]越大),那麼就更有可能被新加入的人認識。
以此類推,每時刻增加一個人,以機率[公式]與之前的人隨機認識,直到[公式]等於全球人數[公式],我們就得到了一個龐大的無向隨機圖[公式],它描述了全球所有人之間的相識情況。
需要注意的是這個隨機圖基於 preferential attachment model 的假設,所以你也可以試著用更廣義的configuration model (http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/csci5352_2013_L11.pdf )去假設機率,自己規定合理的連線模式,比如每個人認識其他任何人的機率都是一樣的,等於總人數分之1(然而這個顯然不合理= =)。
接下來可以證明(https://www.win.tue.nl/~rhofstad/NotesRGCN.pdf)在最終的全球人口的無向圖[公式]中:
任意一個人[公式]認識人數為[公式]的機率約為 [公式]。
任意一個人[公式]認識的人數的期望為:[公式]
有了上面的機率[公式],我們就可以幹很多事情了。 比如:
推導兩點之間距離,即最短路徑,記為[公式]的期望[公式]
這就是題主要的東西,對於特定的模型引數[公式],可以使得這個[公式].
推導這個隨機圖的直徑[公式],有篇論文(http://www.win.tue.nl/~rhofstad/diamCMrev.pdf)
總之,我們很難統計出幾十億人之間準確的關係,然後據此畫一個圖來看六度理論是不是成立。但是可以利用基本假設(比如PAM的連線模式)去構建一個隨機圖,從機率論的角度推導『兩個人之間的最短路徑』這個隨機變數的期望。另外也可以在基本假設下,用計算機很簡單的模擬具有大量節點的隨機圖,然後直接去算兩個節點之間的平均距離。