「完美奶茶」该先倒红茶还是牛奶?史上首次随机对照实验找出SOP

奶茶要好喝,该先倒红茶,还是牛奶?(示意图/Unsplash)

文/涂子沛

摘自/时报出版《数商:向阿里巴巴前副总裁学习数据时代的生存商数

人类很早就认识到,除了可以借助观察、提问的方式收集数据,还可以透过实验来收集数据,以验证自己的推断和猜测。观察和提问在一般情况下都不会改变自然条件,但实验完全不同,实验是故意改变自然条件,干预世界的运行以创造条件,收集最适合追踪因果关系的数据。

接下来要讲的是历史上最著名的一个实验,故事主角是继高尔顿皮尔森之后,统计学当之无愧的新领袖费雪(R. A. Fisher, 1890–1962),他被后世誉为「现代统计学之父」。注意,有「现代」两个字,相较于格兰特、高尔顿的时代,统计学又产生了革命性的进步。

故事发生在1920年代的一个下午。这一天阳光明媚,一群英国绅士和穿着礼服女士正在室外餐桌旁畅谈,当然,餐桌上少不了美味的奶茶。

一位留着胡子、戴着厚厚眼镜的绅士,把一杯泡好的奶茶递给身边的一位女士,她是一位博士。没想到这位女博士摇了摇头,拒绝了这杯茶,她向这位男子解释说:「我只喝先倒奶的茶。一杯奶茶,是先放茶还是先放奶味道完全不一样。」

「这不可能。」这位男子笑着回答。根据他学过的科学知识,红茶和牛奶只要混合在一起,不管先后顺序怎么样,都不会有任何本质上的区别

但这位女士仍然坚持自己的观点,并且强调,一杯茶是把茶倒进奶里,还是把奶倒进茶里,她一下子就能品尝出来。

这时候其他人也聚了过来。这听起来像是随口说笑,大部分人没有当真,便一笑置之,但有几个人开始认真争论起来。

「那为什么不做个实验,当场检测呢?」有人提议。实验应该很简单,就在这位女士看不到的地方准备两种方法泡出的奶茶,让她鉴定不就行了吗?大家都认为这是个好办法。

于是一群热心人士开始帮忙准备实验。他们打算多泡几杯奶茶,有些是先放茶再加奶,有些是先放奶再加茶,然后将这些奶茶端出来,让这位女士一一品尝鉴定。

问题来了!给女士的这一杯茶,不管是怎么泡的,假设这位女士根本辨别不出来,完全靠猜的,她也有 50%的机率猜对。两杯的话,就有 25%的机率猜对。杯数愈多机率愈小,那么到底要给她多少杯茶,才能证明她即使全部判断对了,也不是靠猜的,而是她真的知道这两种泡法确实味道不同呢?

这个实验之所以有名,是因为这是历史上第一次「随机对照实验」。这位戴着厚厚眼镜的男子就是费雪。

▲史上第一个随机对照实验,测试奶茶先倒红茶还是牛奶。(图/时报出版)

1935年,费雪将这个实验写入他的著作实验设计法》。他的答案是 8 杯,其中 4 杯用一种方式混合,另外 4 杯用另一种方式混合,然后把它们随意打乱,端给女博士辨别。注意这里的「随意」两个字,费雪在著作里强调,这不是人为随手决定的顺序,而是使用骰子轮盘等工具来决定的顺序,这样才能确保是真正的「随机」。

还有,泡茶的时候,为了避免许多不相关的因素影响这位女士的辨别,还要严格控制每杯茶的温度、茶和奶量的多少,以及它们充分混合的时间,要确保这些条件都完全一样。

而这位女博士要做的,就是在品尝之后,将8杯茶分成两组,一组是把奶倒进茶里的,一组是把茶倒进奶里的。

这其实又是一个机率的问题。从8杯里任意选出4杯,就有70种可能性,而这70种可能性当中,只有一种可能是8杯全部都分对的情况。也就是说,如果完全靠猜的,她猜对的机率是1/70 ≈1.43%。

费雪又计算了这位女博士猜对 6 杯的可能性,这种情况是,女士在把奶倒进茶里的4杯当中选了3杯,又在把茶倒进奶里的4杯当中选了1杯,这种组合的可能性有:4×4=16种。猜对6杯的机率是16/70 ≈ 22.85%。

但猜对8杯的可能性只有约1.43%,也就是说,如果有8杯茶,女博士仍然可能全部猜对,但可能性非常低。

也许你会问,虽然约1.43%,可能性确实不高,但也的确有可能啊,也许她就有这么好的运气呢?哪怕可能性只有10亿分之一,也是有可能的,要是恰好就中了这10亿分之一呢?如此下去岂不是没完没了,永远无法得出结论。费雪当然不会让这种情况发生,那到底该怎么判断她是不是用猜的呢?费雪的重要贡献之一,是提出了判断一个实验是否有效,必须设定一个机率的上下限,他称之为「显著水准」,他常常把这个水准订为5%。小于5%的,他就认为可能性可以排除、不考虑。

因为 22.85%大于 5%,所以他认为 6 杯不行,要增加到 8 杯,靠猜对的可能性才能下降到显著水准 5%以下。顺便说一下,如果是 10 杯,那么全部猜对的机率只有 1/1024。

▲当场实验先倒红茶还是牛奶,找出打造完美奶茶的SOP。(示意图/Unsplash)

那实验的结果呢?

根据现场的人回忆,这位女博士居然准确地判别了8杯茶!这确实有点神奇,她究竟是如何做到的呢?英国皇家化学协会曾经给过一个答案,泡奶茶最佳的方法是先倒牛奶,因为牛奶蛋白会在摄氏 75 度时发生变化。如果后倒牛奶,那么牛奶就会被高温的红茶包围起来,导致牛奶蛋白发生变化,味道也可能有变化,而将红茶倒入凉牛奶之中,则不会出现这种情况。

连泡茶都如此讲究,这又令人联想到马克思笔下那「道地英国人」。这个奶茶实验成为统计学历史上的一段经典逸事,被后世众多课本引用。

★本文摘自《数商:向阿里巴巴前副总裁学习数据时代的生存商数》,作者涂子沛,大数据先锋思想家,曾在美国学习、工作多年,2014年从矽谷回到中国,出任阿里巴巴集团副总裁。2018年创建数文明科技,同时担任伊斯佳股份董事人民网国地科技独立董事。

►我们的美丽就用白纸黑字写下来