世界杯怎么那么多冷门?
从概率的角度来看,所谓“冷门”不过是“正常结果”发生的可能性被低估了而已(或者说高估了“意外”的发生)。 举个例子,在10个人面前猜拳,问10个人中有多少人能连续出5个布(例如:一拳、剪、布、布、拳),绝大多数人都会觉得至少有一两个人可以办到;但事实上大部分人的水平都只能保证在5把之内不出重样的拳头或者剪刀,5把之后大概率全布或全拳——这就是大量概率事件重合导致的“冷门”结果。
回到足球世界,虽然足球比赛的结果由两队决定,但实际上影响比赛结果的变量有很多,其中很多变量的分布都具有聚集性,这样一场比赛的冷门实际上是由很多场冷门叠加而成。 如果我们能够识别具有聚集性特征的变量,并且尽可能多地收集相关数据,就可以构建一个模型来预测冷门的概率。以2018年世界杯H组第一轮阿根廷对冰岛的比赛为例,我们可以通过搜集的数据构建一个包含36个自变量的模型来预测这场比赛中出现“冷门”的概率。
其中部分变量的值可以通过常规方法获取,例如国家队的世界排名、队中顶级联赛球员的人数等等;而个别变量的值需要根据历史数据进行估算,比如每支球队在场上排出的阵型以及球员们在场上完成的跑动。尽管这些变量难以获得完全准确的数据,但通过收集足够多的历史数据并使用合理的算法进行计算,我们就可以得到各支球队“冷门”的概率,并且以此来进行投注或者是预测下一届世界杯的夺冠走势。
值得注意的是,上述过程并没有涉及到任何关于“冷板凳”的知识,我们完全可以抛开已经熟知的历史数据分析还未知的数据。利用这种方法我们也可以对新赛季英超各支球队的排名进行预测。