转一篇关于当下主流一体化高阶数据可信度 您所在的位置:网站首页 bpm数据在哪查 转一篇关于当下主流一体化高阶数据可信度

转一篇关于当下主流一体化高阶数据可信度

2024-06-27 23:36| 来源: 网络整理| 查看: 265

来自微博:@公民Uitler

前两天我刚看到一篇Hoopshype的文章,介绍目前联盟比较流行的一系列一体化高阶数据的可信度排名,正打算仔细阅读呢,正好今天圈哥也提到这篇文章了,干脆我就来个简版吧。这篇文章就是通过调查问卷的形式调查联盟中的篮球工作者对高阶一体化数据的看法,HoopsHype最终收到了近30名参与者的回答,其中包括各路媒体成员以及有一半以上的参与者与NBA球队有过工作经验。答案来自组织内各个级别的人员,包括那些在教练组工作的人以及分析部门的几位不同级别的主管。

因为种类众多的面板数据并不能很好的反映出一个球员在场上的方方面面,所以联盟逐渐演变及进化出一种一体化数据,就是通过某几个(或几群)数据通过一系列算法最终得到一个评价球员表现的唯一数值。

不过这个文章中提到一个很重要的点。就是任何有数据分析的球队,都会更专注于自己开发的球员评价体系,而他们的分析系统通常也是绝不会对外界开放,只是自己使用的。所以球迷包括专业媒体所能看到的那些高阶数据,也只是作为专业评论人士写作的素材,或者球迷之间相互讨论的一种谈资罢了。

下面开始介绍:顺序是从最不可信的数据到最流行的数据,点击后面的链接可以找到数据页面:

13. Per(Player Efficiency Rating),以面板数据为基础,不考虑正负值影响。霍林格开发的,07年在ESPN公布,一体化数据的鼻祖之一,但是因为他的种种局限性,现在已经完全过时了,不会被引用了,但他确实是篮球数据分析标志性的一个创新。网页链接

12. PIE(Player Impact Estimate),以面板数据为基础,不考虑正负值影响。NBA官网发明的评价数据,本质上和PER类似,目的是判断每个球员在比赛中贡献的百分比。单场比赛出场过同队球员的PIE值相加就是100. PIE和PER的区别是,他的公式更注重防守端的影响,也因此去年恩比德的PIE值是少数几个超越最终MVP得主约基奇的高阶数据之一。Players

11. WS/48(Win Shares per 48 minutes),以面板数据为基础,不考虑正负值影响。由BBR开发并使用,他是通过面板数据的一系列计算来评价一个球员的对球队赢球的贡献程度,但是根据Nylon Calculus的评估,这个数据的评价不是很稳定,现在被引用的也不多了。网页链接

10. FIC(Floor Impact Counter),以面板数据为基础,不考虑正负值影响。RealGM开发并使用的评价数据,跟PER和PIE类似。FIC在NBA并没有被广泛引用,但是 对于G League 以及国际篮球评价,这个数据还是挺有参考价值的。网页链接

9. SR(Simple Rating),以面板数据为基础,不考虑正负值影响。82game.com开发并使用的数据,这个平时很少见到,不介绍了,网页链接

8. WPA(Win Probability Added),以面板数据为基础,不考虑正负值影响。这个数据有趣的是,他更专注于投篮失误、创造投篮机会、失误和罚球,同时忽略篮板、助攻、盖帽和抢断。在他的网站上,您还可以根据某人在关键时刻的表现与他们在垃圾时间内的表现相比,对个人表现进行排序和评价。好像用的也不太多了。网页链接

下面要进入正题了:

7. RPM(Real Plus-Minus),使用了追踪数据和on-off数据为计算基础。这可是几年前大名鼎鼎的一体化评价数据,由于其开发者ESPN在行业内的突出地位,RPM长期以来一直被认为是正负值类评价数据中的黄金标准。但在2020年的某个时候,奇怪的事情发生了。目前ESPN上所引用的数据已经不是原有算法的RPM了,因此这个数据已经被扫入历史的垃圾堆无人问津了。不过我补充一句,RPM开启了球迷对正负值类数据的关注,有关这个数据的介绍,大家去学习圈哥的文章就好了,以前他写过大量的介绍,非常专业详细,我就不用跟这废话解释了。链接也不放了,这个数据没用了。

6. BPM(Box Plus-Minus),以面板数据为基础,但同时兼顾了正负值影响,由BBR开发并使用,BPM的目标是评估球员在场上的贡献。BPM结合了禁区得分表现,球队表现和球员位置,以评估球员每100回合的表现与联盟平均水平之间的差距。BPM的原理基本与VORP(Value Over Replacement Player)一致,只是后者同时加入了时间的维度。

对于BPM来说,联盟平均数设定为0,你可以很容易地比较个人表现(比如,10.0是有GOAT级别表现,8.0被认为是MVP级别,4.0是边缘全明星级别,-2.0是板凳球员水平等)。网页链接

5. RAPM(Regularized Adjusted Plus-Minus),这个数据我完全没搞懂,都没法翻译,我建议直接去找圈哥的文章学习吧......

4. RAPTOR(Robust Algorithm (using) Player Tracking (and) On/Off Ratings),猛禽指数,使用了面板数据、追踪数据和on-off数据为计算基础。大名鼎鼎的538开发并使用的数据,这个数据的算法中包含大量描述性数据,比如说快攻的开始,单打失误,或外线防守者造失误的距离等等。RAPTOR对于小样本量数据以及阵容大量变动时会出现失真,这是他的局限性,但总体来说是值得尊敬的。网页链接

3. LEBRON(Luck-adjusted player Estimate using a Box prior Regularized ON-off),使用了面板数据、追踪数据和on-off数据为计算基础。在过去几年中越来越受欢迎的新指标之一是由BBall开发并使用网页链接

2. EPM(Estimated Plus-Minus),使用了面板数据、追踪数据和on-off数据为计算基础。EPM由数据科学家和前犹他爵士篮球分析协调员Taylor Snarr开发。当他在2020年2月推出EPM时,他将其描述为"最准确"的NBA球员指标。根据比较研究,EPM在将对比赛影响的功劳分配给正确的球员方面做得最好。EPM现在被认为是一体化指标的黄金标准。网页链接

1. DPM(Daily Plus-Minus),这个我就没法翻了,因为我根本看不懂...太专业了,涉及到专业的统计学术语,反正这个数据引用了机器学习技术,是一个预测球员未来发展的综合性数据,网页链接

基本介绍完了,我觉得对一般人而言,只要知道,哪个一体化评价数据更权威,可信度更高就不错了。他们的工作原理实在过于复杂,我基本也都是从圈哥那里学习他们的含义,其实也是一知半解,太超越我的知识范畴,所以我就不解释了,大家感兴趣直接去看圈哥的文章吧,微博正文,微博正文,微博正文,好多文章在他的公号里,反正自己翻就对了。就不喂嘴边了好吧。

全文完,(纯工具文)



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有