如何通过简单的泊松分布计算足球比赛中各个比分发生的概率
预测足球比赛的比分,最常用的是泊松模型,泊松模型也专门用于处理比分数据。
考虑到很多玩家之前可能从未接触过统计模型,根本没有基础,所以也无所谓。 这个答案还是可以让你学会如何通过简单的泊松分布来计算足球比赛中每次得分的概率,进而计算出比赛获胜或平局的概率。
我们以明天早上沃尔夫斯堡对阵拜仁慕尼黑的德甲比赛为例。
1.模型的意义
首先,我们需要对泊松分布有一个大致的了解。 这里只是简单的解释一下。
泊松分布是统计和概率中常见的离散概率分布。 由法国数学家 Denis 于1838年发表。泊松分布适合描述单位时间内发生的随机事件数量的概率分布。 例如,公交车站等候的人数、服务器在一定时间内接受服务请求的次数、电话交换机接听的呼叫次数、机器故障的次数、自然灾害的次数、DNA序列的突变数量、放射性核的衰变数量等等。
泊松分布的概率质量函数为:
对于足球比赛来说,比赛的进球数也服从泊松分布。 泊松分布的参数λ是单位时间(即一场比赛)发生的随机事件(进球)的平均数量。 因此,通过结合历史数据,我们可以使用泊松分布计算一场足球比赛中可能的进球数。 然后使用简单的泊松分布公式计算足球比赛中所有得分发生的概率。
2. 参数计算
在使用泊松分布预测足球比分之前,我们需要评估球队的进球能力和失球能力。 评价球队进球和失球能力的最佳数据是xG(预期进球数)和xGA(预期失球数)。 但考虑到大多数球员可能不会计算xG和xGA,我们也可以用平均进球来代替。
在之前的回答中,我告诉过大家“预期进球数比进球数更可靠”,但如果是超过15场比赛或者半个赛季以上的样本,那么进球数据也是非常可靠的。 所以这里使用平均进球数是可以的。
所以第一步,我们需要计算每支球队在比赛中的平均进球数。 得到的平均数用于确定各队的“进攻强度”和“防守强度”,然后将两者进行比较。
需要注意的是,在计算攻防强度时,选择的数据范围非常重要。 如果范围太大,数据就会偏离球队目前的真实实力。 如果范围太小,异常值会影响数据的准确性。 本赛季的德甲联赛已经过半,各队已经踢了近15场联赛,这为应用泊松分布提供了足够的样本量。
接下来我们看看如何计算一支球队的进攻强度和防守强度。
在根据本赛季至今德甲比赛的成绩计算各队的进攻实力时,我们首先需要确定各队主客场的平均进球数。
球队的平均进球数与联赛平均进球数的比值就是球队的进攻实力。
同样的,我们也可以计算出各队的防守强度,只需将上面的计算互换即可(因为主队的进球数等于客队的失球数)。
一支球队的平均丢球数与联赛平均丢球数的比值就是球队的防守实力。
现在,我们可以计算一下沃尔夫斯堡和拜仁慕尼黑的攻防实力。
沃尔夫斯堡平均主场进球数=11/7=1.571
沃尔夫斯堡平均主场丢球数 = 7/7 = 1.000
拜仁慕尼黑平均客场进球数=17/7=2.429
拜仁慕尼黑客场平均丢球数=6/7=0.857
这时我们可以计算:
沃尔夫斯堡主场进攻强度=1.571/1.964=0.800(越高越好)
沃尔夫斯堡主场防守强度=1/1.394=0.717(越低越好)
拜仁客场进攻强度=2.429/1.394=1.742(越高越好)
拜仁客场防守强度=0.857/1.964=0.436(越低越好)
接下来我们可以计算出本场比赛两队的预期进球数:
沃尔夫斯堡本场比赛预期进球数=沃尔夫斯堡主场进攻强度×拜仁慕尼黑客场防守强度×联赛主场平均进球数=0.800×0.436×1.964=0.685
拜仁慕尼黑预期进球数=拜仁客场进攻强度×沃尔夫斯堡主场防守强度×联赛平均客场进球数=1.742×0.717×1.394=1.741
3.泊松概率计算
上面计算的数据表明,在明天上午的比赛中,沃尔夫斯堡预计进球数为0.685个,拜仁预计进球数为1.741个。 但对于一场足球比赛来说,实际得分不可能是0.685到1.741,所以我们需要找到一系列结果之间的概率分布。 换句话说,我们在整个分布中计算上面计算的预期目标的每个结果的概率。
对于转换过程,我们可以利用EXCEL中的泊松函数来计算本场比赛两队不同进球的概率分布(这里我们使用的数据范围是0到5)。 计算得到的概率分布如下:
计算结果显示,沃尔夫斯堡进0球的概率为50.41%,进1球的概率为34.53%,进2球的概率为11.83%,以此类推。
拜仁进0球的概率为17.53%,进1球的概率为30.53%,进2球的概率为26.57%足球比赛预测模型,以此类推。
然后我们将它们的概率相乘,进一步得到不同分数的概率。 例如,0:2 的概率为 50.41% × 26.57% = 13.39%。 计算得到的概率分布如下:
需要注意的是,这里所有概率的总和<100%,因为有超过5个进球的得分不包含在计算中。
此时,从上面的概率分布中,我们已经得到了本场比赛各种得分的概率。
例如,0:0的概率为8.84%足球比赛预测模型,1:3的概率为5.32%,2:2的概率为3.14%足球比赛预测模型,以此类推。
其中概率最高的是0:1,也就是说本场比赛最有可能的比分是0:1,其次是0:2、1:1和1:2。
标签: 足球比赛预测模型