序言裡我們提到,面板資料是一項已經非常陳舊,卻在無時不刻影響人們看球觀點的產品。那些面板資料最為華麗的球員,往往會優先讓人們記住。這也是“球星決定比賽”的由來。
那麼這句話對不對呢?也對,也不對。對的地方在於,籃球比賽單方只能派出5個人,足夠優秀的單個球星確實能夠大幅度影響結果。粗暴一些的形容就是,5v5的運動有人能做到以一敵二,已經足夠恐怖了。
而不對的地方也在於,籃球比賽單方終究要派出5個人,足夠優秀的單個球星也不能無上限地改變結果。以後的章節裡我們會提到隨著籃球比賽的進步,角色球員的作用越來越重要,甚至達到了軍備競賽的程度。但今天大家理解一件事情就好了:籃球分析裡最容易陷入的一個誤區,就是過於重視球星後讓角色球員“標籤化”。由於面板資料不夠顯眼的關係,彷彿NBA大部分角色球員的水準都是差不多的,頂多按照位置,或者諸如射手、藍領等功能性做一些粗略的區分。
實際上呢?NBA根本不存在兩個風格特點以及球技水平完全相同的球員。霍林格很久以前就提出這樣的觀點:進階資料在評價球員時,對配角的意義要大於放在鎂光燈下的球星。你要分清楚科比和德文-喬治一點兒也不難,要搞清楚德文-喬治在同類型球員裡究竟是什麼水平則要難得多。
我們每年夏天給每個球員撰寫數百字的個人報告,也是基於“不同”來做的。但剛入門的朋友用這種自下而上的方法來解讀比賽,其實是在設定雙重難題:
1.你需要跨越面板資料的侷限性,學會看球員的進階資料。
2.你需要把每個球員的進階資料整合起來,在球隊層面解釋他們究竟為什麼戰績好或者不好。
兩個步驟都不容易,尤其是防守端,球員們的進階資料並沒有進攻端那麼齊全,進一步增加了整合的難度。有很多人還會自行串改“自下而上”的推導步驟,即看看名單裡有哪些球星,再對比一下戰績,簡單來句“球星帶得動/帶不動”,“有/沒有化學反應”就完事了。
這也是為什麼資料專家迪恩-奧利弗(1),在21世紀初就給大家提過建議,希望籃球分析可以基於“自上而下”的原則。簡單說就是你先去探索這支球隊具體有哪些強弱項,再把強弱項拆分到球員,看看誰在強項的功勞最大,誰又得為弱項付最多的責任。
球隊資料的優點還包括:
1.它在防守端也給予你同等於進攻端的權重,即使在拆分到球員時會更難一些。
2.它的量化對比相較400+的球員要好做,至少賽季的資料只需要看1到30的排名就行了。
但非常遺憾的是,國內的網站,在資料呈現上對籃球分析裡“自上而下”最基礎的環節,壓根兒就不重視(包括CBA),簡直是倒逼大家去胡亂“自下而上”。
點開各種球隊頁面,通常固定的組成部分有,陣容花名冊也就是roster,賽程也就是schedule或者game log。這兩塊大頭以外,球隊資料反而成了點綴。
第二個問題是,球隊資料不僅僅“面板化”,而且“單向面板化”。
這是什麼意思呢?面板化很好理解,就是說網站既然列球員的場均資料即得分籃板助攻搶斷蓋帽失誤云云,那麼球隊也照方抓藥就好了。但我們前文說了呀,球隊資料的優點不就在於防守端有配套的權重嗎?
我們就不說得分籃板助攻搶斷蓋帽在球隊層面的侷限性了,只說一點:如果你認為A隊的場均助攻很重要,那麼A隊平時的對手場均助攻是不是同等重要?比賽既然是攻守兩端的綜合結果,哪有隻列一端資料的道理(球員不這樣做是因為做不到)?
第一章第2節,我會重點闡述籃球比賽的本質——回合制遊戲,以及球隊資料呈現應該從哪裡開頭。系列文章微博“旋貓”首發,每天中午12點和晚上6點雙更(工作日)或日更(週末)。
註釋:
1.迪恩-奧利弗:老牌資料專家,四要素的創始人。