欢迎光临散文网 会员登陆 & 注册

NBA选MVP是否有黑幕,透过高阶数据可以预测?(Jokic vs. Booker)

2022-04-20 19:12 作者:HmhmRacer  | 我要投稿

2022赛季太阳胜率78%大幅领先其它球队,Booker作为领军人物场均得分近27分但肯定无缘MVP,历史罕见,不少国内外球迷为其鸣冤;加上今天Booker伤了缺阵下半场后,太阳输给西部排名第九的鹈鹕,Jokic也还未能带领掘金在勇士面前拿到一场胜利,现在说NBA偏袒Jokic,不捧Booker的阴谋论变得更有市场。19年的MVP争议也很大,Harden高阶数据占优,但是MVP给了战绩较好的Antetokounmpo,显得投票人好像一时看战绩,一时看高阶数据,没什么公正性。真是这样吗?

先说结论,本文试图用一个简单且数量化的模型去回测从84年以来MVP的结果,之后再尝试解释结果的原因,进一步猜测投票人眼里最有价值的金标准是什么。

回测规则如下:预测MVP只会从两个候选人中产生,最佳战绩领军球星 和 球队战绩还行(球队至少分区前7名)的高阶数据第一人(并列不算第一)。高阶数据取四个数据(Basketball Reference里有详细数据的 WS, WS/48, BPM, VORP) 的NBA第一人,如果一个球员两项或以上高阶数据NBA第一,没有其他球员能平手,定义这个球员为高阶数据第一人。两位候选人(最佳战绩领军球星 和 高阶数据第一人)之间,用中阶数据 PER 来比较高低,胜者为MVP。


上图看出2000年以前,我们的模型准确率不好,确实有唯战绩论或者对去年矫枉过正的投票结果,但是高阶数据陆续发明以后,比如Win Share发明以后,模型的准确率超过80%,而BPM发明以后,模型就没有错过。

虽然我对高阶数据的详细计算方法一窍不通,有高手可以多加指正,但是我认为发明这些高阶数据就是为了给球迷 管理层 球评等等可以在一个原本只记录团队胜负的团队运动里,更好的衡量单个球员的价值,所以有了高阶数据以后大家评哪个球员有价值,就一致化了很多,不再有天马行空的角度。

那为什么不简单的唯高阶数据论呢?像任何的初级理论,用它比没有理论强但是还是离真理很远。高阶数据虽然已经考虑这个球员比起他的队友,对球队的成绩贡献了多少,但是以我浅显的理解1)很多防守行为是没有数据记录的,2)场上队友也不是完全一样的,比如A球员带4个全明星打74胜 vs. B球员带4个高中生打42胜,一般来讲B球员的高阶数据肯定更好看,因为没有B,可能是0胜而且球权全在B手里,但是这代表B互换A队也能打出74胜吗?

所以我们的模型把 最佳战绩领军球星 和 高阶数据第一人 都挑出来看看,认为都是强,再用纯个人能力的中阶数据 PER 分个高下。

最后,Jokic 连庄MVP是实至名归的,四项高阶数据2021 2022全都是NBA第一而且历史前列,如果只比高阶数据这个维度没有更好的人选,在和战绩好的领军人物Booker比,PER超了Booker 10以上,差距明显。

NBA选MVP是否有黑幕,透过高阶数据可以预测?(Jokic vs. Booker)的评论 (共 条)

分享到微博请遵守国家法律