在各式各樣的遊戲成為了年輕人主要社交方式的當下,諸如王者、吃雞的電子競技遊戲佔據了主流市場。不同於休閒或冒險遊戲,它們強調玩家個人技術與團隊協作能力,總有一種“與人鬥其樂無窮”的快樂。
既然是競技,就會有高低之分。現在的玩家見面不再像古時武林中人一般難測對方深淺,一個個具體可見的“天梯分”或“段位”就高懸於角色頭頂,水平高低一目了然。
而這一切,都源自一個名為ELO等級分制度(Elo Rating System)的發明。這個被廣泛運用在國際象棋、圍棋等單人體育專案的評分等級演算法,在被遷移運用到多人電子競技專案後變得更加複雜,更曾激起了無數區別於“玄學上分”的“數理上分”討論。
上個世紀,如何為國際象棋、圍棋等對弈比賽制定一個等級分的計算標準曾經是一個國際難題。因為選手眾多,每場次1V1的對局只能說明某位棋手(在當前狀態下)勝過了對手。但當棋類愛好者談論起棋手間的強弱時,往往各執一詞沒有定論。
舉個例子,棋手A勝了B又敗給了C,而BC間的對弈結果卻是B勝的話,單憑這三場比賽如何衡量三位棋手的棋力強弱呢?根本就無法得出令人信服的結論。為此各種棋類協會紛紛推出自己的等級分制度,以求得到一個綜合性的棋力衡量標準。
儘管南韓選手李世石曾經戰勝人工智慧AlphaGo 其等級分排名還是在柯潔之下
不過,不管是流行於歐洲INGO系統還是美國象棋協會的肯尼斯·哈克尼斯等級分系統,得出來的演算法結果都未能令人信服。直到上世紀中期,物理學家Arpad Elo 建立了Elo等級分制度,才一舉解決了這個世紀難題。
Elo等級分制度中有三個關鍵資料:選手水平分、勝率期望值以及等級分增減值。
其工作原理就是首先給予每個棋手初始的分數R,我們假設有棋手A、B,則根據Elo公式:
可得出棋手A對B的勝率期望值E。
而每場比賽過後棋手的等級分增減由其比賽結果得分與勝率期望值的差值決定(一般來說勝利=1分,平局=0.5分,負=0分)。等級分增減值的具體數學公式為:
*其中K為係數,S為選手在比賽中的真實得分
這個演算法最合理之處就在於先根據原有的分差得出勝負概率,再由勝負概率與實際戰果的綜合考慮得出最終的增減,而不是簡單粗暴地進行積分累加。(那會造成選手挑著弱者來對戰從而瘋狂得分等問題)
1960年,美國國際象棋協會率先廢棄了原有的等級分制度,改用Elo計分方法。這種先進合理的演算法很快被推廣開來,1970年國際棋聯也正式改用這個等級分制度。
不止是國際象棋,目前最權威的世界職業圍棋等級分排行網站Go Ratings用的所謂“全歷史排名演算法”(Whole-History Rating)其實也是基於Elo等級分制度的改版。
儘管該演算法聲稱比Elo等級分演算法更科學,頁面上還是寫著“Elo等級分”字樣
時間來到2000年前後,邁入新世紀的人類社會計算機技術發展迅速,各種電子遊戲也隨之興起,並漸漸取代了“對弈”這種流傳千年的傳統遊戲模式。
或許還有人記得那個電子競技的蠻荒年代。CS、魔獸爭霸、紅色警戒曾是一代人的經典回憶,玩家從單機打到區域網,再到各種對戰平臺的興起。漸漸開始有了“線上對戰”這種電子競技的概念。
當然棋類遊戲也有過短暫的線上對弈輝煌時刻。那會QQ遊戲中的“中國象棋”,設定了以“縣令”、“總督”、“丞相”等級別為體現的等級分制度,算得上是Elo等級分制度在網路遊戲世界的初代應用。
隨著電子競技遊戲網路對戰概念的普及,騰訊、浩方、VS、11等對戰平臺相繼崛起。遊戲是現成的,但所有對戰平臺都需要面對的問題是“如何幫助玩家匹配到勢均力敵的對手”,從而保證其遊戲體驗。
其中的道理很簡單,一個高階棋手跟初學者下棋肯定會覺得索然無味,而對於菜鳥來說頻頻受虐的遭遇也會直接勸退使其失去興趣。
思來想去,一番挖掘,Elo等級分制度就此進入了遊戲開發者與運營商的視野。
電子競技遊戲《Dota2》中的分級制度
Elo等級分制體系中,以前只是一個計算步驟的“勝率期望值”成了運用在電子競技領域的重中之重——系統運用公式計算尋找出兩個勝率期望值均儘量接近50%的玩家或者隊伍,自然也就實現了使其勢均力敵的需求。
可以說從11對戰平臺的天梯名將系統,一直沿襲不斷改進到Dota2遊戲中的天梯系統,再被中中國產遊戲英雄聯盟借鑑使用,一直到現在人盡皆知的手機遊戲王者榮耀中的段位系統,都是Elo等級分制度在遊戲中的運用體現。
但隨之而來的問題是,Elo等級分制度在電子競技領域的運用與體育競技領域的運用,還是有著極大的差別。
乒乓球等體育競技也有演算法排名
首先是人數的區別,對弈類競技是1對1,不管是需要參考的水平分還是評分的偏差範圍考慮都極小。但在很多電子競技專案中往往是多對多的比賽對抗,即使是常量的5對5,已經會造成極大的計算偏差可能性。
這些偏差包括但不僅限於某一玩家的精神狀態不穩定、某一隊伍的成員性格迥異導致配合度不高,甚至是某一玩家網路的不穩定導致競技水平受影響等等等。這也就是為什麼電子競技愛好者常常有“系統針對我,給我匹配太厲害的對手或者太弱的隊友”的感覺。
真正各方面都旗鼓相當的酣暢對局,其實是很難得的。
世界頂尖電競高手的對決其實與棋類對弈極像
另外一個問題是遊戲的平衡性與對弈類專案有異。棋類競賽雙方除了先後手因素以外,身處的往往是一個“全對稱”的戰局,這幾乎是絕對平衡的。然而遊戲開發者很難做到絕對平衡,地圖、角色、裝備……雙方隊伍各種因素的差異必定是存在的,因此只能儘量做到接近平衡狀態。
為了解決這些直接挪用棋類的Elo等級分制度會出現的不平衡問題,遊戲的評分與匹配製度其實做過很多改善。其中最主要的就是增加了一個“評分可靠性”(Ratings Reliability,簡稱RD)系統。
長時間線上遊玩的選手,其評分可靠性較高,因而其“評分標準差”會較低;而較長時間不線上的選手,或是水平發揮浮動較大的選手,其評分可靠性會偏低,則其評分標準差會較大。
選手的評分標準差越低,或者對手的評分標準差越高,選手在賽後的評分波動就會越小。而且在無法迅速匹配到與自己的準確評分一致的對手時,系統就會根據標準差的範圍來拓寬匹配對手選擇。
這個東西,就被很多玩家稱為“隱藏分”。但很多人會誤解認為自己的“隱藏分”過高或者過低,其實從演算法上看來,隱藏分的概念是波動值,從來就不是什麼太高或者太低。
當出現覺得被系統錯誤匹配的時候,不要抱怨,儘量穩住自己的評分標準差(或者提高水平)才是正途。
總而言之,一個正常運營的遊戲,它的段位演算法不管怎麼改進,肯定是為了讓所有人儘快到達自己實力對應的段位,以求讓所有玩家能找到勢均力敵的對手,從而更好地運轉下去。
不過話說回來,至於那種不合理運用Elo演算法來造成玩家到了關鍵對局無法升段,從而提高遊戲內玩家日活量的做法,肯定是被業內也是被玩家所唾棄,無法長久的。
歐陽梅生.基於ELO演算法的競技專案評價體系研究,武漢理工大學碩士學位論文,2013年5月
林澳釗.MOBA遊戲平衡性探究,雲南大學碩士研究生學位論文,2015年4月
Wikipedia:Elo rating system,Glicko rating system
pinkry.ELO演算法教程.GameRes.com 2013.10
www.goratings.org/zh/