第22章 小数法则—样本大小与统计结论(2)

我们知道,大数法则需要很大的样本数才能发挥作用,基数越大,就越稳定。随着样本的增大,随机变量对平均数的偏离是不断下降的。所以,大医院更稳定。这一基本的统计概念显然与人们的直觉是不符的。

杜伊先生果然钻进了圈套,他认为较大的医院有更多超过60%的新生儿是男孩的日子。

再没有一种学问比概率更能让专家洋相百出了。一个整天向学生灌输大数法则的教授,自己居然不相信大数法则!

普通人又如何呢?

特韦斯基后来把这个问题做了严格的实验。22%的受试者认为较大的医院有更多这样的日子,而56%的受试者认为两个医院有相等的可能性,仅仅22%的受试者正确地认为较小的医院会有更多这样的日子。

很多研究者,其实也是“直觉型统计学家”,很多一本正经的调研数据,其实一文不值。因为调查的样本过小,就会产生很大的失误。

就连丹尼尔·卡尼曼也忍不住自我检讨,他也和很多研究型心理学家一样,曾犯过小数法则的错误。而且这种错误对于卡尼曼来说甚为尴尬,因为他也曾经教授过统计学。

小数法则

大数法则是统计学的基本常识,有人称之为“统计学的灵魂”。大数法则虽然威力无穷,普通人却因它其貌不扬而将其忽视。

针对人们在思考时常常无视大数法则的现象,特韦斯基提出了“小数法则”的概念。“小数法则”不是什么定律或法则,而是一种常见的心理误区。

用错误的心理学“小数法则”代替了正确的概率论大数法则,这是人们赌博心理大增的缘由。

小数法则是一种心理偏差,是人们将小样本中某事件的概率分布看成是总体分布。人们在具有不确定性的情形下,会抓住问题的某个特征直接推断结果,而不考虑这种特征出现的真实概率以及与特征有关的其他原因。

小数法则是一种直觉思维,很多情况下,它能帮助人们迅速地抓住问题的本质推断出结果,但有时也会造成严重的偏差,特别是会忽视事件的无条件概率和样本大小。

做生意,不要相信“小数法则”

爱因斯坦说:“上帝不掷骰子。”对上帝来说,一切都是确定的。

大数法则就是一种先验概率,而天生是“概率盲”的人类,却直觉地相信“小数法则”。

当当网网上商城的创办人俞渝女士,曾在一个叫作《创业百问》的电视节目中,和郭广昌这样讨论—

郭总刚才讲的,5个合伙人,15年可以同步进步,这事我觉得违反自然规律。这个团队有人进步有人退步,有人进得多,有人退得少,这在经济学上来讲是一个大数法则。

以刚才描述的现象,在我听来,是一个小数法则的现象,小数法则里头有这种神话,而这种神话发生在您身上,那您很幸运,但是我觉得在其他正在建立团队的人身上,去同样复制的可能性很小。我觉得做企业,一定要看大数法则……

小贴士:

大数法则是一种统计定律;小数法则是一种心理偏差。

大数法则是一种科学;小数法则是一种迷信。

大数法则是中性词;小数法则是贬义词。

股神大哥的预测模式

行为经济学家马修·拉宾曾假设:如果你是一位投资者,你亲见一位基金经理在过去两年中的投资业绩好于平均情况。你是否就会得出这位经理要比一般经理优秀的结论?

然而真实的统计意义非常微弱。让我们来看看股神大哥的预测模式。

第一周,发10000条短信,股神大哥预言某只股票的涨跌。其中5000条说某只股票涨,5000条说跌。

第二周,股神大哥向其中说对的5000人再发一条短信,其中2500条说某只股票涨,2500条说某只股票跌。

第三周,他再向说对的2500人发短信,其中1250条说某只股票会涨,1250条说某只股票会跌。

最后有1250人,发现这位股神大哥连续3次说对某只股票的涨跌,简直太崇拜了。其中有500人真的把钱交给他投资了。当然,如果赚钱是要分成的。

股神大哥拿到钱后会做什么呢?他会给这500个不同的账户各买一只股票,尽量让这些股票各不相同。一段时间过后,股票有的涨,有的跌。

如果一个人的账户买了一只涨的股票,他对股神大哥就会更加信赖,甚至还会追加投资。

假如碰到一个大牛市,大部分时间里,大部分股票上涨概率大大超过下跌。因此,股神大哥的这种模式是非常有“钱途”的。

假如来了个大熊市,大部分股票在大部分时间下跌超过上涨,股神大哥也是不用负责的,大不了退出江湖而已。

赌客谬误

小数法则的经典表现就是“赌客谬误”。

李太太一连生了五个女儿。

李太太说:“希望我们下一个孩子是男孩。”

李先生说:“亲爱的,都生了五个女儿了,下一个肯定是儿子。”

李先生说得对吗?

众所周知,掷硬币正反面出现的概率为50%,在掷硬币游戏中,如果前几次大多数出现正面,那么很多人会相信下一次投掷很可能出现反面。这就是赌客谬误(gambler"sfallacy),也是很多赌客信心大增的原因。

赌客谬误的产生,是因为人们错误地诠释了“大数法则”的平均律。投资者倾向于认为大数法则适用于大样本的同时,也适用于小样本。

赌博是随机事件。

一枚硬币,连出三把都是正面,那么下一把出反面的概率仍然不会大于50%。

从理论上讲,硬币也好,骰子也好,既没有记忆,也没有良心,概率法则支配一切。

随便到一家合法的赌场,就能看到这种赌客“猜反正”的现象:

连输几次就该赢了;

连出几次红就感觉该出黑了;

连出几次庄就以为该出闲了;

连出几张是小牌肯定该出大牌了;

……

这是很多赌客感觉能战胜庄家的理论依据,甚至很多有学问的赌徒写的“赌经”,都明显带有这种错误。

你可曾见赌客拿本子记录百家乐出闲和庄?赌瘾甚至可以让一个天资平庸的赌徒变成统计学教授。

理论背景:雅各布与大数法则

雅各布·贝努利(JacobBernoulli)1654年生于瑞士,他没有遵照父亲的意思去当律师或经商,而是自学成为一名数学家。

雅各布生活的时代,是一个牛人辈出的时代。例如约翰·阿布斯诺特(JohnArbuthnot),他是一位御医,同时还是一位业余数学家。他对概率十分感兴趣,用丰富的病例来阐述他的观点。他在一篇论文中,研究了“20岁的妇女是否有处女膜”的概率以及“20岁的花花公子没得淋病”的概率。

这种学术风气,促使雅各布开始留意概率问题。雅各布和牛顿生活在同一时代,他有着贝努利家族传统的自负心态,他认为他和牛顿不相上下。1703年雅各布·贝努利率先提出了如何从样本中发现概率的问题。

雅各布教授自己的弟弟约翰数学。约翰和雅各布一样聪明,而且和他的哥哥一样,他是个对名声的追求近乎病态的人。

雅各布和弟弟约翰有一个习惯,就是对一个问题有竞争性地进行研究,并且在媒体中无情地攻击对方。

雅各布虽然发现了大数法则,但由于兄弟俩在科学问题上过于激烈争论,致使双方的家庭也被卷入。以至于雅各布死后,他的《猜度术》手稿被他的遗孀和儿子在外藏匿多年,直到1713年才得以出版,几乎使这部经典著作的价值受到损害。

《猜度术》是雅各布·贝努利一生最有创造力的著作。在这部著作中,他提出了概率论中的“贝努利定理”,该定理是“大数法则”的最早形式。

为了说明大数法则,雅各布假设了一个装满30000枚白色石子和20000枚黑色石子的罐子,不知道每种颜色的石子的数目。

我们从罐子中,按不断增加的数目取出石子,并在将它们放回瓶子之前,记录每枚石子的颜色。

如果我们取出越来越多的石子,最终我们会得到“接受必然的可能性”,也就是说,在实际事件上是必然的,但又不是绝对的必然—两种颜色石子的比率是3∶2。

雅各布的计算显示,从瓶子中取出25550枚石子后,则有大于1000/1001的概率使其结果与真实结果(3∶2)间的差异在2%之内。也就是所谓的“接受必然的可能性”。

雅各布宣称,我们可以对任何不确定的数量进行科学的预测了。如果我们能“先知”的话,那么我们几乎能很准确地判断“事后”的事例的数目。

由于“大数法则”的极端重要性,1913年12月彼得堡科学院曾举行庆祝大会,纪念“大数法则”诞生200周年。

《猜度术》是概率论的第一部奠基性著作,所含概率思想具有划时代的重大意义,可谓对概率论作出了决定性的贡献,推进了概率论的进一步发展。因而其出版是概率论成为独立数学分支的标志。

第6章 禁脔效应—奢侈品与炫耀性消费(1)第17章 时间折扣—今天的100元大于明天的100元(2)第19章 窥测天机—风险探索简史(2)第19章 窥测天机—风险探索简史(2)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第15章 乐观偏见—自信、自负与拖延(2)第5章 参照效应—没有比较,就没有鉴别(2)第22章 小数法则—样本大小与统计结论(2)第8章 心智分账—挣到的100元大于白捡的100元(1)第3章 风险悖论—谨慎和大胆,只是一体两面第9章 心智分账—挣到的100元大于白捡的100元(2)第25章 理性原罪—多重选择下的冲突第27章 满意指数—快乐与满足的最大化(2)第23章 正态分布—钟形曲线的妙用与滥用(1)第3章 风险悖论—谨慎和大胆,只是一体两面第19章 窥测天机—风险探索简史(2)第4章 参照效应—没有比较,就没有鉴别(1)第25章 理性原罪—多重选择下的冲突第5章 参照效应—没有比较,就没有鉴别(2)第19章 窥测天机—风险探索简史(2)第10章 懊悔理论—懊悔规避与寻求自豪(1)第26章 满意指数—快乐与满足的最大化(1)第12章 锚定理论—随意却有效的参照暗示(1)第28章 九重幻象—认知与决策偏差(1)第6章 禁脔效应—奢侈品与炫耀性消费(1)第2章 损失厌恶—丢失的100元大于白捡的100元(2)第22章 小数法则—样本大小与统计结论(2)第2章 损失厌恶—丢失的100元大于白捡的100元(2)第14章 乐观偏见—自信、自负与拖延(1)第26章 满意指数—快乐与满足的最大化(1)第25章 理性原罪—多重选择下的冲突第15章 乐观偏见—自信、自负与拖延(2)第28章 九重幻象—认知与决策偏差(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第12章 锚定理论—随意却有效的参照暗示(1)第9章 心智分账—挣到的100元大于白捡的100元(2)第25章 理性原罪—多重选择下的冲突第13章 锚定理论—随意却有效的参照暗示(2)第16章 时间折扣—今天的100元大于明天的100元(1)第19章 窥测天机—风险探索简史(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第4章 参照效应—没有比较,就没有鉴别(1)第8章 心智分账—挣到的100元大于白捡的100元(1)第10章 懊悔理论—懊悔规避与寻求自豪(1)第27章 满意指数—快乐与满足的最大化(2)第18章 窥测天机—风险探索简史(1)第22章 小数法则—样本大小与统计结论(2)第18章 窥测天机—风险探索简史(1)第3章 风险悖论—谨慎和大胆,只是一体两面第27章 满意指数—快乐与满足的最大化(2)第13章 锚定理论—随意却有效的参照暗示(2)第5章 参照效应—没有比较,就没有鉴别(2)第17章 时间折扣—今天的100元大于明天的100元(2)第26章 满意指数—快乐与满足的最大化(1)第21章 小数法则—样本大小与统计结论(1)第15章 乐观偏见—自信、自负与拖延(2)第27章 满意指数—快乐与满足的最大化(2)第8章 心智分账—挣到的100元大于白捡的100元(1)第27章 满意指数—快乐与满足的最大化(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第3章 风险悖论—谨慎和大胆,只是一体两面第23章 正态分布—钟形曲线的妙用与滥用(1)第23章 正态分布—钟形曲线的妙用与滥用(1)第5章 参照效应—没有比较,就没有鉴别(2)第7章 禁脔效应—奢侈品与炫耀性消费(2)第25章 理性原罪—多重选择下的冲突第20章 均值回归—可媲美万有引力的一个发现第4章 参照效应—没有比较,就没有鉴别(1)第24章 正态分布—钟形曲线的妙用与滥用(2)第8章 心智分账—挣到的100元大于白捡的100元(1)第25章 理性原罪—多重选择下的冲突第24章 正态分布—钟形曲线的妙用与滥用(2)第22章 小数法则—样本大小与统计结论(2)第13章 锚定理论—随意却有效的参照暗示(2)第16章 时间折扣—今天的100元大于明天的100元(1)第7章 禁脔效应—奢侈品与炫耀性消费(2)第8章 心智分账—挣到的100元大于白捡的100元(1)第27章 满意指数—快乐与满足的最大化(2)第17章 时间折扣—今天的100元大于明天的100元(2)第28章 九重幻象—认知与决策偏差(1)第10章 懊悔理论—懊悔规避与寻求自豪(1)第7章 禁脔效应—奢侈品与炫耀性消费(2)第26章 满意指数—快乐与满足的最大化(1)第3章 风险悖论—谨慎和大胆,只是一体两面第20章 均值回归—可媲美万有引力的一个发现第26章 满意指数—快乐与满足的最大化(1)第7章 禁脔效应—奢侈品与炫耀性消费(2)第21章 小数法则—样本大小与统计结论(1)第19章 窥测天机—风险探索简史(2)第13章 锚定理论—随意却有效的参照暗示(2)第26章 满意指数—快乐与满足的最大化(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第15章 乐观偏见—自信、自负与拖延(2)第12章 锚定理论—随意却有效的参照暗示(1)第16章 时间折扣—今天的100元大于明天的100元(1)第5章 参照效应—没有比较,就没有鉴别(2)