彩票是数据分析吗?
先说答案,再解释理由。 数据挖掘分析与购买彩票之间有关系,但关系并不大——至少对大部分彩民来说是这样。 首先我们要知道什么是数据挖掘分析(data mining),百度百科上给出的是如下定义: “从大型数据库中挖掘到有意义的信息” 从这个定义我们可以提炼出这样一条信息:数据挖掘分析是要挖掘出之前不被人们注意的信息。
那么我们再来看买彩票的过程: 彩民选择5注号码进行投注,这已经属于数据的选择了,我们选定的这些数字是否拥有更高的概率出现?通过计算我们发现其中3注号码的两连号特征十分明显,因此可以将这三注号码打组成为7注号码。 最后我们将这7注号码进行投注。 这整个过程就是一个数据挖掘与分析的过程,只不过这个过程很初级,并没有使用什么复杂的算法。
如果说这7注号码是我们根据某种方法筛选出来的,那么所谓的“方法”就是数据挖掘的过程结果;如果我们能够找到更多这样的“方法”,并将它们汇总起来用于筛选更多的中奖号码组合,我们就可以期待从中发现类似11选5这样的玩法,甚至是可以自创一种新玩法——当然,这种玩法很可能只是一时的幸运而已。
但是数据挖掘分析对于很多人来说是很有诱惑力的,因为人们总是希望能从中得到有价值的信息——“我发现了这个秘密,所以我能中大奖!” 但是事实往往是残酷的,我们发现的“秘密”可能是假的,我们使用的“方法”可能根本行不通。
我曾经有过一次这样的经历,那还是大学的时候,学计算机的人或多或少都对编程有一定的热爱,我也一样。当时正在学C语言,因为C语言可以编写很复杂的算法。有一天上课的时候老师给我们出了一个题目让我们回家编写程序,题目要求是:求最大公约数。(最大公约数是一个数学概念,在这里指两个整数除得的余数为0的最大正整数。)
第二天老师看了看我们的代码,说你们每个人编写的程序都很复杂,其实不用这样编的……然后她给了我们正确的代码。当时我那个羞愧啊,简直无地自容。但是就是这样,我还是坚持了我的看法,我用我的方法得到了正确的结果——虽然是用别人的想法得出了自己的结论。