上一節我們介紹了籃球回合制的本質,以及百回合得失分的基本概念。接下來我們要做的,就是把各類面板資料做一個歸類,讓進攻的歸進攻,防守的歸防守。
這句話聽起來很容易,實際上沒那麼簡單。在第一章第1節裡我們提到過,大部分網站在做球隊資料時,都有“單向面板化”的問題。而在分析比賽(比如半場休息)時,對手資料有了更加明確的主體,“單向”是避免了,“面板化”仍然無法避免。我們還是以雄鹿對陣湖人作為例子,比較常見的呈現方式是這樣的:
乍看好像沒有什麼問題,我們就來開始分類吧。分類的原則應該是,發生在雄鹿的回合,也就是影響雄鹿扮演進攻方角色的行為,算作雄鹿的進攻資料,我們用綠色圓點來表示;發生在湖人的回合,也就是影響湖人扮演進攻方角色的行為,算作湖人的進攻資料,我們用黃色圓點來表示。
標註以後你會發現,雄鹿一列裡大部分仍然是雄鹿的進攻資料,但有幾個例外:搶斷和蓋帽發生在湖人的回合,應該算作湖人的進攻資料(被搶斷/被蓋帽),或者雄鹿的防守資料;籃板和犯規由於沒有明確指明是進攻籃板還是防守籃板,是進攻犯規還是防守犯規,屬於球場兩端都可能發生,卻被混在一起計算的資料。我們按照這個原則再縷一遍:
我們把搶斷和蓋帽對調了位置,籃板和犯規根據攻防兩端做了拆分。雄鹿這一欄裡還是有兩項資料還是發生在防守端的,我出於表達的關係沒有繼續對調。如果要對調,防守籃板應該計為“被對手搶到的防守籃板”。比如雄鹿被湖人搶到了42個防守籃板,這是雄鹿的進攻資料,也是湖人的防守資料。防守犯規應該計為“造防守犯規”。比如雄鹿造了湖人24次防守犯規,這是雄鹿的進攻資料,也是湖人的防守資料。
OK,分類清楚一些以後,是不是就可以對號入座,看這些分項對攻防有哪些具體影響呢?彆著急,還是一個小麻煩是我們沒有解決的。
這麼說吧,如果你想分析A這個大問題,接下來拆分成abcd幾個小問題,是不是先得確保abcd之間沒有從屬關係?面板資料裡其實有很多重複計算的因素,是我們得嘗試去掉的。非常明顯的有3項:
1.助攻是含在進球裡的,你可以說雄鹿總共投進37球,“其中”22球來自助攻。但不要把22和投籃資料放在並列的關係裡討論。既然助攻在拆分關係裡屬於第3級別,我們先去掉。
2.被搶斷是含在失誤裡的,你可以說雄鹿總共失誤19次,“其中”11次來自被搶斷。但不要把19和11兩個資料放在並列的關係裡討論。既然被搶斷在拆分關係裡屬於第3級,我們先去掉。
3.被蓋帽是含在投失球裡的,你可以說雄鹿89投37中,“其中”投丟的62球裡4次來自被蓋帽。但不要把4和投籃資料放在並列的關係裡討論。既然被蓋帽在拆分關係裡屬於第3級,我們先去掉。
三分球在表達上也有從屬關係,比如雄鹿89投37中,其中三分球43投12中。但三分由於多出1分的關係,給予特殊對待倒沒什麼問題,我們可以予以保留。大家如果一定想追求各項的並列關係,可以把投籃減去三分,得出來一個兩分資料。得分是一個總的結果,是之前所有因素的彙總,可以留著或者擺在最上面。
還沒完呢,還有一項資料比較特別,就是犯規。它有的屬性和失誤重疊,有的屬性和罰球重疊,有的都不重疊,比如沒進入bonus狀態的普通犯規。但最後這種,其實暫時不會影響回合的結果,我們也可以先去掉。現在剩下的第一層拆分長成這樣:
是的,剩下的這些資料才是球隊資料分析裡第一層拆解的精華。它們各自獨立,不存在從屬關係。最關鍵的是,每個行為的發生,都會直接影響回合的結果,它包含了籃球場上所有的可能性。
如果你投進兩分,投進三分,造成罰球或者罰進,你將成功結束自己的回合(程度不同)。如果你沒投進兩分、三分或者第二個罰球,搶到進攻籃板,你將延續自己的回合。如果你沒投進兩分、三分或者第二個罰球,被對手搶到防守籃板,你將失敗結束自己的回合。如果你在投兩分、三分或者造到罰球之前,就失誤了,你同樣將失敗結束自己的回合。
現在大家可以對比一下開頭的表,會不會發現在梳理分項資料和攻防關係的時候,條理更加清楚了一些呢?或者可以這樣說,我可以忍受一張資料表裡沒有搶斷、蓋帽、犯規這些資料,這並不妨礙我做最基礎的分析。但我沒辦法忍受攻防籃板混在一起算,幾項投籃資料只顯示命中率之類。這塊也是給大家一個參考,即技術條件有限的時候,球隊資料應該優先統計哪些門類。
對於雄鹿來說,平時賽季中最重要的球隊場均資料則是這樣的,綠色為進攻資料,黃色為防守資料,一定是符合“攻防兩端,分開呈現,各自表達”的原則的:
如果你感覺縮減以後,還是不夠清楚分項和整體攻防的關係。沒關係,第一節第4章,我們會重點介紹奧利弗的“四要素”。