第23章 正态分布—钟形曲线的妙用与滥用(1)

把钟形曲线用在商业领域是不合适的。

—彼得·德鲁克

疯子,就是用错误前提进行正确推理的人。

—约翰·洛克

真是令人震惊:钟形曲线竟然成为风险管理工具,被监管者和穿深色西服、以乏味的方式谈论货币的中央银行人员使用。

—尼古拉斯·塔勒布

一棵树上的果子有大有小,但大部分都是中等的。河里的石子有圆有扁,但多数属于不太圆也不太扁的。巨人很少见,侏儒也很稀少,多数人是身高中等的普通人。只要样本足够多,那么这个样本群体的情况就会呈现一种规律性。但这种规律却很可能被滥用……

“数学王子”与钟形曲线

德国数学家高斯被认为是最重要的数学家,享有“数学王子”的美誉。

高斯的母亲是一个贫穷石匠的女儿,虽然十分聪明,却没有接受过教育,近似于文盲。高斯的父亲曾做过园丁、工头、商人的助手等。

在整个数学史上,没有人像高斯那样早熟,比如高斯三岁时便能够纠正他父亲借债账目的事情。

高斯自己曾说,他在草堆上学会了计算。能够在头脑中进行复杂的计算,是上帝赐予他一生的天赋。

当高斯12岁时,已经开始怀疑元素几何学中的基础证明。当他16岁时,预测在欧氏几何之外必然会产生一门完全不同的几何学,即非欧几里得几何学。高斯的传奇、奇闻异事可以写成厚厚一部故事集。

18岁时,高斯开始专注于曲面与曲线的计算,并成功得到高斯钟形曲线(正态分布曲线)。其函数被命名为标准正态分布(或高斯分布),并在概率计算中大量使用。

钟形曲线是一根两端低中间高的曲线。高斯用它来描述科学观察中量度与误差两者的分布。

在钟形曲线上,大部分观察值都积聚于中间,曲线上的极点对统计结果影响不大。比如,随机挑选1000个男人进行身高统计,他们之中接近平均值的分布最多,巨人和侏儒分布最少,这种分布就符合正态分布。自然界中的很多随机变量,可以近似地用钟形曲线来描述:

一棵苹果树上的苹果有大有小,把这些苹果一一称重,会得到一条钟形曲线。

河床上布满了鹅卵石,这些石子有圆有扁,把这些鹅卵石的曲度统计出来,也会形成一条钟形曲线。

茫茫人海,总会有几个巨人,也会有几个袖珍人,但大部分人是身高中等的普通人。

同质群体的身高、红细胞数、血红蛋白量、胆固醇等,呈现为正态或近似正态分布。

……

只要样本足够多,那么这个样本群体的情况就会呈现一种规律性。

数学不会错,但数学会被用错

类似这种说法你可能听说过:

“××效应无处不在!”

“万事万物都逃不开××法则!”

说者如此亢奋,仿佛真的发现了一条能解释宇宙万物的绝对真理。

就连高斯自己恐怕也没有想到,自己发现的钟形曲线,会被泛滥地运用到社会生活的各个方面。

前面讲过,“统计狂人”高尔顿爵士通过研究豌豆遗传和人类世代演变,联想到了均值回归理论,这个重要理论使得钟形曲线在很多情况下具有可操作性。

与高尔顿大约同时代,有个数学家叫凯特勒,他号称:“钟形曲线无处不在!”

凯特勒要把钟形曲线用在一切地方,他要把世界纳入他的平均哲学中。

凯特勒提出,人的特性均趋向于钟形曲线的均数或中数,越靠两极越少。凯特勒从统计学角度出发看人,认为人的成长会依从一套既定的法则。所以,我们可以透过统计数字,去推算一个人的发展。他还发明了通过身高体重比(BMI)来推算一个人的健康状况。

但凯特勒本人一点也不平均,甚至可以说是个偏执的工作狂。凯特勒对钟形曲线的痴迷到了走火入魔的境地,他提出了“体质平均人”的概念,通过收集统计数据,他开始制造“平均”的标准。胸围、身高、新生儿体重……很少有什么逃过他的标准。

阿道夫·凯特勒又把注意力转入社会学领域,针对人们的行为模式,提出了“气质平均人”概念。凯特勒划定了偏离平均值的范围,他眼里的正常人要么在平均值左边,要么在平均值右边,而那些站在钟形曲线极左端和极右端的人则属于另类,需要惩罚。

尼古拉斯·塔勒布在其睥睨群英的作品中,对钟形曲线进行了深入批判。当然,塔勒布并非对钟形曲线进行质疑的第一人,他只是继承了亨利·庞加莱等人的思想,而这种生搬硬套钟形曲线的方法论,也被人们称为“凯特勒谬误”。

高斯并没有错,高尔顿也没有错,“凯特勒才是思想史上最具有破坏性的人”。数学不会错,但数学会被用错,在凯特勒的“传染”下,钟形曲线得以广泛用于社会领域。

统计歧视

有人调侃,人生就像一个钟形曲线—

你5岁的时候不尿床就是成功;

10岁的时候你开始有自己的朋友就是成功;

25岁时你有自己的幸福家庭就是成功;

35岁时你依然有自己幸福的家庭就是成功;

65岁时你依然拥有好多朋友就是成功;

85岁时你不尿床就是成功。

类似这种玩笑话并无害处,但有些人却以科学之名,推销自己的思想,就变得可怕了。

凯特勒的幽灵还在徘徊,十多年前,曾有一本名为《钟形曲线》(TheBellCurve)的书热闹了一阵子,该书的副标题是《美国生活中的智力和阶级结构》。

此书是美国哈佛大学心理学家理查德·J.哈瑞斯坦与政治科学家查尔斯·莫瑞合作完成的。该书主要内容包括四部分:

1.基于智力基础的社会分层现象日益明显。

2.智商与各种社会、经济地位之间存在明显的相关性。

3.IQ在美国不同种族之间所形成的社会的与经济的贡献中的作用。

4.这个了不起的发现对于美国的教育和社会政策会产生哪些影响。

书名之所以称作“钟形曲线”,主要是基于IQ得分的钟形的正态分布。

在书中,作者以大量的智力测量结果论证,人的智力是先天遗传决定的,不同的种族具有不同的智力水平,这种观点自然会引起不少争议。这本哗众取宠的作品,为种族歧视提供了理论基础,也被种族主义者奉为宝典。

将军里面挑瘸子

GE公司前CEO杰克·韦尔奇最值得自我吹嘘的管理秘诀就是“活力曲线”,其实质是强制正态分布。

在这个钟形曲线里,韦尔奇将业绩排在前面20%的员工划为A类,中间70%的员工划为B类,业绩排在后面10%的员工划为C类。C类是必须裁掉的对象。

韦尔奇以科学的名义进行奖惩,一直以钟形曲线的法则推行末位淘汰制,从不间歇,所以叫作活力曲线。

这种绩效评估的原理,是按照事物“两头小、中间大”的正态分布规律,先确定好各等级在被评价员工总数所占的比例,然后按照每个员工绩效的优劣程度,强制列入其中的一级。

但问题是,假如低素质员工淘汰完了以后,就要在中等和优良员工里硬挑一些低素质员工来淘汰了。最极端的情形可能是“将军里面挑瘸子”。就好比满分是100分,全部成绩都在90分以上,也要把90分的那位淘汰下来。

韦尔奇很幸运,他在任的时候GE股票猛涨。但GE的成功,不代表他所有的做法都是对的。当韦尔奇成为明星经理人后,他的办法得以传播。强制钟形曲线管理法,在社会上热过一阵子后,基本上销声匿迹了。

幂率曲线

19世末,“的幽灵,在欧洲徘徊”。

此时,有一位叫帕累托的意大利经济学家发现,财富分配也是不均的。帕累托被称作“资本主义的马克思”,他指出:英格兰财富的80%,掌握在了20%的人口手里。许多其他国家和地方也是如此。帕累托由此得出一个结论:财富分配和人口结构之间,存在着一种可以估算的比率。帕累托称之为“关键少数定律”,也就是现在所谓的“二八法则”。

类似帕累托的这种财富曲线,叫作幂律(PowerLaw)曲线。

我们再以图书销售为例,把图书的销售排名作为横轴,销售量作为纵轴,我们就会得到类似下面这个销售曲线。

幂律的典型是二八法则,实际上幂律正是从它开始的发现。意大利经济学家帕累托发现,在财富的分配上存在着幂律分布,即20%的人掌握着80%的社会财富。

有人将这一法则延伸,80%的工作由20%的人完成;或者80%的工作只产生20%的结果,反之亦然。

“二八法则”也遭遇了惊人的滥用,比如被墨索里尼拿去,为其法西斯主义作合理化解释。

分清“中庸先生”与“极端先生”

天气、豌豆的直径、身体指标等属于平均事件,是按照钟形曲线分布的(姑且称之为“中庸先生”),所以,就算这辈子你看不到一个身高为5米的家伙,也没什么值得稀奇的。

财富数量、图书销量、网站访问量等属于极端事件,遵从的是所谓的幂律曲线(姑且称之为“平均先生”)。

比如,屋子里有100个随机选取的人,世界上个子最高的人走进去之后,这些人的平均身高并不会发生太大的变化。但如果比尔·盖茨走了进去,在场所有人的平均财富将会显著增加。

如果说钟形曲线是一位性格温和的“中庸先生”的话,幂率曲线就是一位性格狂野的“极端先生”。

对自然问题,多问问“中庸先生”;对社会问题,尤其是金钱问题,“极端先生”的意见更为靠谱。

“中庸先生”信奉“天之道”,“极端先生”信奉“人之道”。

在“中庸先生”那里,充满了金色的平均主义,谁也不会比谁高出多少。

在“极端先生”那里,一个数字就足以瓦解你所有的平均值,一次亏损就可以抹平你100多年的积累。

我们唯一应记住的是:道可道,非常道。真理只能证伪,不能证实。面对这个复杂的世界,没有任何一个万能公式,更没有放之四海而皆准的教条。

钟形乌托邦

钟形曲线并非放之四海而皆准,但很多人觉得“钟形曲线无所不在”。钟形曲线为何这么受欢迎?

钟形曲线的魅力在于它分布得很对称,很和谐,很中庸,很民主,容易掌握,让人感觉是温和又可以预测的。收集了足够的数据之后,模式就会自动显现。这符合懒人的胃口,我们不妨把这种理想叫作“钟形乌托邦”。

理解幂率曲线,可以帮助我们和中庸的钟形曲线保持距离。但幂率曲线是位“极端先生”,从来就不像钟形曲线这位“中庸先生”那么受欢迎。

钟形曲线是一位温和的“中庸先生”,幂率曲线是一位狂暴的“极端先生”。

钟形曲线属于自然法则,幂率曲线属于丛林法则。

第10章 懊悔理论—懊悔规避与寻求自豪(1)第4章 参照效应—没有比较,就没有鉴别(1)第23章 正态分布—钟形曲线的妙用与滥用(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第21章 小数法则—样本大小与统计结论(1)第20章 均值回归—可媲美万有引力的一个发现第4章 参照效应—没有比较,就没有鉴别(1)第24章 正态分布—钟形曲线的妙用与滥用(2)第10章 懊悔理论—懊悔规避与寻求自豪(1)第2章 损失厌恶—丢失的100元大于白捡的100元(2)第7章 禁脔效应—奢侈品与炫耀性消费(2)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第27章 满意指数—快乐与满足的最大化(2)第21章 小数法则—样本大小与统计结论(1)第18章 窥测天机—风险探索简史(1)第19章 窥测天机—风险探索简史(2)第13章 锚定理论—随意却有效的参照暗示(2)第13章 锚定理论—随意却有效的参照暗示(2)第19章 窥测天机—风险探索简史(2)第14章 乐观偏见—自信、自负与拖延(1)第13章 锚定理论—随意却有效的参照暗示(2)第10章 懊悔理论—懊悔规避与寻求自豪(1)第12章 锚定理论—随意却有效的参照暗示(1)第16章 时间折扣—今天的100元大于明天的100元(1)第9章 心智分账—挣到的100元大于白捡的100元(2)第26章 满意指数—快乐与满足的最大化(1)第9章 心智分账—挣到的100元大于白捡的100元(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第13章 锚定理论—随意却有效的参照暗示(2)第11章 懊悔理论—懊悔规避与寻求自豪(2)第14章 乐观偏见—自信、自负与拖延(1)第24章 正态分布—钟形曲线的妙用与滥用(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第23章 正态分布—钟形曲线的妙用与滥用(1)第12章 锚定理论—随意却有效的参照暗示(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第17章 时间折扣—今天的100元大于明天的100元(2)第21章 小数法则—样本大小与统计结论(1)第15章 乐观偏见—自信、自负与拖延(2)第25章 理性原罪—多重选择下的冲突第1章 损失厌恶—丢失的100元大于白捡的100元(1)第7章 禁脔效应—奢侈品与炫耀性消费(2)第3章 风险悖论—谨慎和大胆,只是一体两面第16章 时间折扣—今天的100元大于明天的100元(1)第5章 参照效应—没有比较,就没有鉴别(2)第18章 窥测天机—风险探索简史(1)第6章 禁脔效应—奢侈品与炫耀性消费(1)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第26章 满意指数—快乐与满足的最大化(1)第19章 窥测天机—风险探索简史(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第2章 损失厌恶—丢失的100元大于白捡的100元(2)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第28章 九重幻象—认知与决策偏差(1)第26章 满意指数—快乐与满足的最大化(1)第26章 满意指数—快乐与满足的最大化(1)第15章 乐观偏见—自信、自负与拖延(2)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第10章 懊悔理论—懊悔规避与寻求自豪(1)第18章 窥测天机—风险探索简史(1)第23章 正态分布—钟形曲线的妙用与滥用(1)第19章 窥测天机—风险探索简史(2)第5章 参照效应—没有比较,就没有鉴别(2)第15章 乐观偏见—自信、自负与拖延(2)第4章 参照效应—没有比较,就没有鉴别(1)第27章 满意指数—快乐与满足的最大化(2)第27章 满意指数—快乐与满足的最大化(2)第10章 懊悔理论—懊悔规避与寻求自豪(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第11章 懊悔理论—懊悔规避与寻求自豪(2)第17章 时间折扣—今天的100元大于明天的100元(2)第10章 懊悔理论—懊悔规避与寻求自豪(1)第23章 正态分布—钟形曲线的妙用与滥用(1)第19章 窥测天机—风险探索简史(2)第9章 心智分账—挣到的100元大于白捡的100元(2)第25章 理性原罪—多重选择下的冲突第27章 满意指数—快乐与满足的最大化(2)第24章 正态分布—钟形曲线的妙用与滥用(2)第12章 锚定理论—随意却有效的参照暗示(1)第26章 满意指数—快乐与满足的最大化(1)第14章 乐观偏见—自信、自负与拖延(1)第21章 小数法则—样本大小与统计结论(1)第16章 时间折扣—今天的100元大于明天的100元(1)第15章 乐观偏见—自信、自负与拖延(2)第6章 禁脔效应—奢侈品与炫耀性消费(1)第1章 损失厌恶—丢失的100元大于白捡的100元(1)第18章 窥测天机—风险探索简史(1)第26章 满意指数—快乐与满足的最大化(1)第22章 小数法则—样本大小与统计结论(2)第17章 时间折扣—今天的100元大于明天的100元(2)第28章 九重幻象—认知与决策偏差(1)第11章 懊悔理论—懊悔规避与寻求自豪(2)第23章 正态分布—钟形曲线的妙用与滥用(1)第2章 损失厌恶—丢失的100元大于白捡的100元(2)第21章 小数法则—样本大小与统计结论(1)第17章 时间折扣—今天的100元大于明天的100元(2)第15章 乐观偏见—自信、自负与拖延(2)第26章 满意指数—快乐与满足的最大化(1)第8章 心智分账—挣到的100元大于白捡的100元(1)