首頁>體育>

對於籃球的資料分析,大家經常聽到這樣一句話:“資料有它的侷限性”。對此我們其實深表贊同。是的,即使我們計劃在未來一段時間裡,圍繞籃球資料做抽絲剝繭的探討和解讀,卻並不意味著我們非得扮演狂信徒的角色。

只不過在承認侷限性這個大前提以後,我們還是希望把這句話做一些更細緻的拆解。首先是福斯眼中的籃球資料究竟是指什麼?其次是面對侷限性,我們究竟應該怎麼做?

1891年奈史密斯發明了籃球運動,可以想見最初的資料欄裡肯定有得分,否則比賽打完根本就不知道誰贏了。55年以後即1946-47賽季,NBA的前身BAA進入元年。根據美國的歷史資料庫顯示,當時就有統計並且現在仍然可以查到資料包括:1.得分,2.助攻,3.投籃相關(含出手數、命中數以及命中率),4.罰球相關(含出手數、命中數以及命中率),5.犯規。

4年後也就是1950-51賽季,NBA開始統計籃板。1年後也就是1951-52賽季,NBA開始統計出場時間。22年後也就是1973-74賽季,NBA開始統計搶斷、蓋帽和失誤(有網友提醒完整統計失誤始於1977-78賽季,但BBR統計全聯盟的平均資料及球隊資料會更早一些),並且做了進攻籃板和防守籃板的拆分。

這裡非常有趣的地方就來了,如果不算NBA創立之前的年份,相當於美國人大概花了27年時間,來完善面板資料(box score)以及其相應的場均資料的構成,然後就不再做任何主動性的大幅調整。期間1979-80賽季開始統計三分相關(含出手數、命中數以及命中率),更多是基於引入新規則後必須做的被動性調整。整個發展史大概是這樣的:

我的意思是,一個40年都沒有更新的東西,就不應該被當成某種“完全形態”來看待,甚至於它沒有侷限性才很奇怪。看到這裡你大概會問:既然如此,我不看它不就完了?專注於比賽本身不好嗎?如果你只是想茶餘飯後看看球消遣一番,當然可以。但如果你想對籃球或者NBA有更深的了解,甚至是相關從業者,面板資料由於它的普適性,就是會無時不刻影響著你。

就拿NBA來說,30個隊1,230場常規賽沒有哪個神仙可以有精力全部看完。最死忠的球迷會看完主隊的82場比賽,但想了解對手資訊仍然會優先通過面板資料。

這個世界也不存在看個幾分鐘球,就能洞窺某個球隊和球員是什麼水準的所謂“高手”,NBA的資深教練和球探都做不到。本-法爾克(1)曾在多支NBA球隊有過球探經歷,光是花在錄影拉片和剪輯上的時間就不知凡幾。然而他卻承認,自己跑去執教高中聯賽時“資料缺失導致資訊量太少了”,“不清楚對面的中鋒投籃到底什麼水平”,“策略難做會影響球員執行”。

真的太矛盾了!一個最容易影響到人們觀點的工具,偏偏又是一個數十年未更新極其落後的工具。這方面全世界的籃球人都太照本宣科了,僅僅因為籃球是美國人發明的,在統計面板資料時就被人牽在屁股後面走,別人統計什麼我們也統計什麼。比如可能已經是世界上影響力第二高的專業賽事男籃世界盃,我查詢FIBA官網就沒看出有什麼創新之舉。

大家或許會覺得,美國不僅僅是籃球的發明者,也是籃球的領先者,跟在他們屁股後面走有什麼不對呢?難道我們還能關起門來搞發明創造,去做別人的老師不成?

但接下來的核心點就出現了:美國人不做面板資料的更新,並不是沒有能力,而是認為沒必要去做。他們同時花大量的時間精力來研究各種進階資料(advanced stats)的演算法和呈現,並且已經實實在在地影響到了比賽。

毫不誇張地講,NBA的近15年,就是進階資料分析在引領籃球發展的15年。資料分析不是某種派別,某個風格,不是“劍宗”和“氣宗”之爭;而是毫無疑義的“更加先進的生產力”,類似於現代軍事與肉搏戰白刃戰的區別。

大家請不要誤解,資料分析仍然不能解決籃球場上的所有問題,但它只要能幫助我們比單純的“肉眼看球”,或者“肉眼結合面板資料看球”解決更多問題,就值得付出努力去研究它。

如果把“領悟籃球奧祕”比作一個進度條的話,美國人自己也在納悶進度條走到80%以後如何更進一步,真的是道阻且長。但我們作為學生,可以暫時不一起去糾纏這最後的20%應該怎麼完善,而是應該想想別人在前50%,前60%到底是怎麼走的。

人家在“存異”之前,早就花了大量精力來“求同”。用霍林格(2)的話來說,“美國籃球分析已經摘下了樹上位置最低的蘋果”。我們應該自問的是自己究竟摘下了沒有。如果答案暫時是否定的,這個蘋果究竟是什麼,應該如何去摘下它。

文章的最後我想再強調的是,就是千萬不要對資料分析有妖魔化的預設,拿一個不存在的靶子來打毫無意義。進階資料的研究,從來都沒有也不該和“看錄影”擺在衝突的,二選一的關係上,不是說你研究完資料就可以不用看比賽了。它更不是僅指某種建模後得出的簡單粗暴的一體化資料。倘若面板資料是障人耳目的起點,一體化資料是某個只能不斷逼近的終點,那麼起點和終點之間的空白地帶,散佈著各種各樣評價單項技能的資料,就是當下最值得我們研究的。

對於學習先進經驗,一個壞訊息是,美國籃球其實已經過了分享氛圍最好的時代了。各隊花錢聘請分析師,基於利益考慮就不會做大量的資訊交換,更別說我們來自不同的國家,說著不同的語言。

好訊息則是,也有越來越多的業內人士意識到這個問題,而且美國籃球圈本來就很多人在“媒體人”和“隊內分析師”兩種角色裡來回橫移,也有助於我們更好地琢磨背後的思路。他們“桃李不言”,我們照樣能夠“下自成蹊”。

目前我的計劃是這樣,系列文章大概會分成幾部分,先是球隊資料分析,接著是球員資料分析,最後是單場比賽的分析。裡頭除了具體資料的簡介和拆解,還會有不少涉及NBA歷史的發展,各個位置的功能演變,以及資料對於實戰的結合。本體連載是免費的,首發於微博“旋貓”,每天中午12點和晚上6點雙更(工作日)或日更(週末)。將來把基礎部分完善了以後,會視情況推出類似於DLC的更深度付費內容。

第一章第1節,我會和大家聊聊為什麼要先講球隊資料,以及它的解讀和呈現上存在最大的誤區是什麼。

註釋:

1.本-法爾克:曾任76人和開拓者的球探,現cleaningtheglass的創始人,目前在對外呈現的資料量化方面最出色的分析師。

2.約翰-霍林格:曾供職於ESPN和灰熊管理層,現為The Athletic主筆,也是最早嘗試撰寫單個球員報告的媒體人。

最新評論
  • 為了抗癌,男子堅持吃下為狗驅蟲的“芬苯達唑”,後來如何了?
  • 地震級交易,籃網6換1組超級三巨頭?群雄爭霸恐將上演