大乐透篮球均值是什么意思?
“平均值”这个概念在数学上的定义其实是很广的,在统计学中,“样本的平均值”和“总体的平均值”这两个概念要区分开来——前者是用于描述所研究的对象整体“一般情况”(样本个数可以无穷多)的一个量;后者则是用来对给定数量的特定对象进行计算。所以,问题中的“篮球平均值”应该是指“总体平均值”。 这里先简单介绍有关概率的基本知识。
在随机事件A发生的条件下,记P(A)为事件A发生的概率,则 P(A)=\int_{\mathcal{A}}^{\ }f(\textbf {x})d\textbf {x} \\ 其中 f(\mathbf{x}) 为发生事件A的概率函数。 又因为概率是对所有事件的描述,而平均值是对单个对象的测量,所以平均值的定义应该是在某个固定的概率水平下对事件进行测度从而得到的。因此有
E[X]=\int_{-\infty}^{\ \infty} xp(x)dx \\ 上面这一堆方程式子叫做 概率的积分公式 。当事件 A 的概率函数未知时,可以通过测度计算期望 E[X ] 来估计这个概率。
回到这个问题里,因为不知道“大乐透篮球”的中奖方式(这个问题的本质其实是问如何选取号码才能中奖),所以我们无法确切计算出每个球的颜色出现次数概率,也就是不能算出每个颜色的号码被开出后的概率 p(x) 。但是我们可以通过观测统计出各颜色球的出球次数,进而得到一个近似概率 q(x), 继而求解期望值 E[X],并令其最大,最终选出一个最有可能中大奖的投注方案。
虽然通过观察统计出各个数字出现的频率是一个很好的近似方法,但是这显然是不能确保结果最优化的。比如当我们发现红球出球频率最高是186次/千期时,我们很自然地会假设红球下一个开出的机会是187次/千期(也就是下一期中奖号码是187)。然而实际上,下个开奖号码是185的概率要比187大一些。
这就是所谓的 数值分析的问题:由于样本容量有限,我们无法肯定地假设某样事件下一次发生时一定会发生在某个确定的位置。为了求解这个不确定性,我们就需要引入一个先验的概率分布,使得我们能够通过对现有数据的分析来估计这个先验概率,进而通过计算得出最优的决策规则——这个过程其实就是数理统计里的 最大似然估计 (Maximum Likelihood Estimation, MLE)。