菜单 更多箭头 是的

提交:

Corsi与探戈 - 我们是否需要采用加权射击 Differential?

New, 121 注释

棒球分析作家汤姆探戈与他的文章掀起了曲棍球分析社区“介绍了加权射击差别(又名探戈)”。它是替代或改善corsi吗?我们是否需要改变我们如何使用基于拍摄的差异分析曲棍球?

@Fearthefin.

本周早些时候,汤姆探戈是一个着名的棒球分析作家,他们不时地越过其他运动,发表了一篇关于他博客的文章, tangotiger.com.,题为“介绍加权射击差分(又名探戈)。”文章是联系的 这里。这是短暂的,我强烈推荐给它阅读。在写关于我的意见之前,我想在曲棍球分析社区腌制几天的时间。

基本上,文章说,曲棍球分析师在COREI上挂着帽子的方式,措施的镜头尝试和/或反对那些不考虑射击的类型或质量,或者是否被阻止或错过了网,严重误导。他认为,我们通过将目标视为与其他射击次数相同,我们一直忽略了宝贵的数据。目标应该在任何镜头尝试差分度量(例如CF%)中加权,因为它们比任何旧射击尝试都比未来的评分更加预测。

他进一步争辩说,在对球队的“CORERI”的分析中,他可能会收到不同类型的拍摄尝试,但对于实用性的缘故,我们可能会从重视一个目标,通过烘焙数量恢复几年,他确定了每个非目标拍摄尝试的“约”0.2。他自我标题了加权射击差异 探戈 并宣布将未来目标更加预测对文章的评论。

我在阅读汤姆探戈的文章时的第一次想法** 是,“好的,有趣的想法,是的,目标是不仅仅是镜头的事情......没有人否认这一点。但是,这些目标并不是通过非目标拍摄数据的非目标巨大的巨大性来洗掉?”

** 第二次思考“这件作品的基调是聪明的曲棍球人民迈出了多年的讽刺。”

分数调整的CORSI与探戈

评分调整后的CORSI是我们最相关的统计数据,以预测未来的目标和胜利。

截至较晚,分数调整的CORERI在分析界中获得了牵引力,并且有充分的理由。分数调整的CORSI基本上考虑了各种游戏状态。它目前是未来目标和胜利的最具预测的统计数据,因此已经达到了比未加工的5V5 CORES迟到,并且已经呈现了5V5得分关闭CORES(忽略游戏状态的一部分数据)相对过时。

分数调整占有代理统计数据的基础和方法,如CORERI(全部拍摄尝试)和FENWICK(所有未脱扣射击尝试),并分析游戏状态(和 分数效果)在原始的CORES数据中, 日期回来几年. 评分调整有助于缓解分数效应的影响。评分效果基本上是一支球队在游戏中导致的团队进入“防守壳”的倾向,从而允许反对派跑到他们的COREI / FENWICK总数。分数调整显着提高了对目标和胜利的预测性。

阅读更多关于分数调整的Corsi的美德 这里.

所以,我去工作拉动数据进行回归分析,并比较加权射击差异与辅助各种化身的相关性,最具体地说得分调整的CORERI。

在我鸽子之前,我会检查推特。 中立的,编辑我们的朋友们 害怕鳍,打败我:

这也是我的思考。 “探戈”或加权射击尝试差异,不提供足够的目标数据点来移动针。两者之间的相关性是〜1,这是完全相同的。因此,它是最好的改变,并且在最坏的情况下过分令人困惑,甚至可以采用它。

无论如何,没有曲棍球分析社区已经追逐射击尝试龙,抓住它,并意识到它没有呼吸呼吸? 当我们看待像分数调整的团队CORSI这样的东西时,就像预测目标/获胜一样,那么加权镜头 可能 有一些用途。但问题是,始终是,采样和无法预测的/不完美的目标。此外,如在那些推文中所述,加权它们是任意与否,根本不会改变数字,因为目标太少。它被冲出了。

已确定的是,插入射击质量没有帮助数据分析。

和这个问题, 的问题 射击质量 没有帮助预测未来的目标/获胜任何比所有射击尝试更好,已经 在曲棍球分析社区研究和建立.

Eric Tulsky,以前 广阔的冰球 和SBN的 数量超过,现在是NHL团队顾问,以前写道:

一般来说,射击质量因素往往足够小,以至于它们不会严重改变我们对游戏的理解,并且在季节性分析中,它们往往被噪音淹没。最好的理解明显需要超过枪支总数的威严浏览,但基于射击的分析一直被证明是识别人才和预测未来结果的强烈方法。

Garret Hohl 曲棍球图 最近很聪明地补充说:

要纠正经常使用的一个稻草男人的论点:只要牢记[这个]并不意味着射击质量并不重要 在冰上 [重点添加]。对于玩家和团队来说,努力的重要性与分析数据的重要性不同。

在分析数据时,拍摄尝试差异简单地介绍了较小的样本尺寸的SH%的疯狂 很多 更快并处理得分机会的不可预测(通常是幸运/随机)的性质,并且射门评分比得分更好。因此,看起来与目标差异相反的总拍摄差异是有意义的。汤姆探戈和他在他的文章中评论的一些分析倾向的读者可能没有意识到这一切。但他的文章的普令和不屑性肯定摩擦了一些人,他们花了时间和努力来揭开,错误的方式。

此外,加权对我没有意义。探戈争辩.2基于他跑的数据和回归的非目标,但它既不在这里也不在那里。但是,数据年份到年份最多就会出现随机。此外,Corsi Sh%悬停了约4%。所以,如果你真的想要“重量”的目标数据,那就太大了,你想把它比其他类型的镜头更有价值25倍。 IE 1为目标,.04为非目标,对吧?对我来说,底线是这种方法没有意义。对于所有长期观看运动的美国人,我们普遍知道目标并不一样,拍摄尝试并不是一样的,从目标收集的数据通常不大于非目标镜头。有时候冰球只是......你知道......进去。有时他们只是没有,即使拍摄类型,距离,平面,轨迹,速度等相同或相似。任意加权每目标25倍,甚至比每个非目标都更加加权,而不是由于目标的运气和不可预测而没有意义。调整不同类型的目标将是最佳,任意和误导性的主观。

Corsi是一个占有的代理。占有是法律(或某事)的9/10。

从实用的角度来看,探戈的目的并不完全与Corsi的目的一致。我认为这是棒球分析和曲棍球分析发散的观点。 Corsi传统上被用作冰球占有的代理统计数据。因为我们没有在曲棍球中的实时占有数据,但想知道谁有冰球,我们假设有更多拍摄尝试的团队(通常是甚至是力量,以免歪斜特殊团队的数字),有一般“赢得”占有战斗。加权镜头对Corsi的这种用法没有任何作用。

在他对他的文章的评论中,探戈认为,“如果你得到一个目标,你可能拥有比非目标射击更长的冰球。”这是一个非常大的飞跃,因为我真的不应该细节。虽然探戈继续争辩说,使用Corsi作为占有的代理是一个最好的假设,但是多年的研究与〜.9内的实时占有的统计数据相关,这非常非常密切相关。这是一个必要的假设,一个我们要接受的人,并且必须接受,因为为分析参与者和团队的表现而值得的。否则,我们根本没有任何东西。

如果我们试图衡量与CORESI的占有,那么加权实际上将浑水与基于运气的变量,随机性和不属于依赖的变量浑浊。这将包括守门员的SV%和射击者的SH%。使用射击差分基于统计数据,在专注于专注的分析下,没有目的是重量。

公共消费实用性

纯粹是为了实用性的缘故,现在对词典进行不必要的横向变化,当许多人才开始采用像Corsi和Fenwick这样的统计数据,几乎没有意义。主流分析的冒泡掩盖了景象背后的事实多年来。但是,看公众的一般曲棍球只是对这些命名的统计数据舒适,实际上只是相当公平的概念。这值得考虑。

每种类型统计数据的目标(朋克)通过分析从冰上发生的可重复的能力或事件中汲取的数据,应对成功(目标,差异,胜利)的成功(目标,目标,胜利)进行更大的相关性和预测性。从“以数学”到“曲棍球知识中心”(技术术语,我知道)谁可以做出贡献,有许多卓越的思想家。有时我们将运行测试或理论,并且不会净回报。那没关系。汤姆探戈的思想过程确实有意义。我们不应该抛弃数据,加权是一个有价值的考虑因素。但如果净回报没有移动针头,为什么采用它?为什么争辩说一支球队应该采用它吗?它没有提供任何边缘。因此很难使用它。

这是曲棍球分析社区中每个人的消息:

远离理论。但是运行测试,看看是否存在实际和 可靠的 改进,思考统计分析的价值以及如何用来影响冰上的可重复的曲棍球技能,然后以直接和非争议的方式涉及它。不完全工作,而不是完全工作。排他性和Snark正在破坏进步,并且在一个试图从阴影中出来的社区来反映不良,而不是在他们内部潜伏。作为社区的新人,但不是一个运动或分析它的新人,我发现这是为了为讨论的真正兴趣进入人们的#1障碍。而且我自己也犯了罪。

直到我们有用于编制其他其他体育的数据的手段,例如 Sportvu. and 实时跟踪技术,我们陷入了困境的代理和不完美的数据。没有一个统计数据是全部最终。我们都承认这一点。但事实并不意味着每次似乎(但不是真正)的小说思想都应该抛弃多年的研究和分析。这也不是指我们应该每次认为我们可能改善的东西时跳出我们的鞋子。

有一天,未来可能不会太远,所有这些Corsi和Fenwick Chatter都将与技术发展或被抛弃,以支持新的分析措施。但不是今天。