回覆列表
-
1 # 罷不道吾
-
2 # 扣籃看臺
任何資料都不會是完美的,所以高階資料也是如此。但存在即合理,高階資料出現的原因不是因為他望門,而是因為他的存在是為了彌補基礎資料過於簡單,難以合理反映球員在場上實際作用的缺點。
每一個高階資料模型都是由人設立的,所以高階資料模式建立過程中必然會受到人為因素影響,比如某個資料應該分配大多權重等等。沒人能保證分配的權重完全公平,公正,但至少建模的人會盡量做到公平。所以說,高階資料不是偽科學,但存在侷限卻是必然。
比如現在最常見的PER(player efficiency rating,球員效率值),這原本是一個棒球領域的高階資料,被原ESPN專做資料分析的霍林格改造,應用在了籃球範疇上。雖然計算球員效率值的公式已經得到了廣泛的應用,但霍林格至今沒有解釋為什麼他在不同的得分上會分配相應的權重,這其中自然就存在了非理性的因素,也就是人為因素。
霍林格自己也承認,球員效率值無法全面反映球員在防守上的作用。而且經過其他人對球員效率值的深入研究,這個資料在對比不同時代的球員時也會出現誤差(因為比賽節奏會因為規則的改變而受到影響)。但球員效率值更精準的意義在於,縱向對比一個球員在不同時期的表現。橫向對比如果集中在同一時代,會更有意義。
與球員效率值相似的高階資料還有很多類似的不完善性,但他們都是科學的,這一點毋庸置疑。NBA球隊廣泛運用這些高階資料,事實上就是對此最好的註解。
數學模型的意思是用一套演算法算個值出來幫你得出一些結論評估某個模型的好壞通常要和實際結論相結合模型算出來的和實際出來的在一定程度上相近就是好模型,就可以幫我們做結論你可以說某個模型不好用,因為算出來的和實際不符但是你不能說數學建模是偽科學
高階資料就是一種數學建模