民眾在六個月內不斷計算自己的蛀牙數量 牙膏廠商銷量變更好
如果你不是个特别容易受骗或特别乐观的人,就会发现各品牌的牙膏效果其实都差不多。 示意图/ingimage
一位统计学家曾建议,当你得知一项调查的结果时,你应该问:「在取得这个统计结果之前,你调查了多少样本?」正如先前提到的,具有偏误的样本可以被有心人用来产生想要的统计结果。而如果随机样本的数量极小时,也可以实现这一点。
样本过少,统计不再显著
广告的大字标题写着:「根据用户回报,使用多克斯牌( Doakes)牙膏的用户减少了23%的蛀牙。」你可能觉得减少23%的疼痛是个不错的选择,所以你继续读下去。你在广告内容中发现,此数据来自一个值得信任的独立」实验室,而且这个估值经过了执业会计师的认证。你还能再多要求什么呢?
然而,如果你不是个特别容易受骗或特别乐观的人,你就会回忆起过去的经验,发现各品牌的牙膏效果其实都差不多。那么,多克斯牙膏公司是如何得出此结果的呢?难道他们能够用这样斗大的字眼说谎,又顺利避开法律制裁吗?事实上,他们并没有说谎,也没有必要说谎。他们可以用更简单也更有效率的方式得到这个结果。
本文出自《统计操控的真相与谎言》
让我们回过头来,检视多克斯如何能这么轻易的取得毫无做假又值得成为广告标题的结果,而且还让所有数字都得到认证。
他们的作法是让一小群人在六个月内不断计算自己的蛀牙数量,并改使用多克斯牙膏。这项实验只会有三种结果:蛀牙明显变多、蛀牙明显变少或数量相当。
只要第一种结果和第三种结果出现,多克斯公司就会直接对数据进行调整(在某些我们不容易注意到的地方),然后再实验一次。透过这种「操作偶然」的作法,多克斯迟早会遇到某一个测试组的结果是大幅进步,足以成为醒目标题又值得广告投放。无论这些受试者使用的是多克斯牙膏、苏打粉,还是以前用的旧牙膏,结果都会是一样的。
使用小群体当作样本的重要性在于:在大群体中,因为偶然出现的任何差异可能都只会是微小的差异,不足以引起大篇幅的关注。宣称牙膏能「改善2%」的蛀牙是没办法卖出太多牙膏的。
在纯粹偶然的情况下,如果样本数够小,就可以产生不带有任何意义的结果。但是,样本数要多少才算充足呢?这也是一个很棘手的问题。
决定样本数是否充足的其中一个因素,在于你借由抽样研究的人口规模多大、人口多样性多高。此外,有时候样本中的数字并没有表面上看起来的那么简单。
(本文出自《统计操控的真相与谎言》,作者:德瑞尔.赫夫 译者:闻翊均)
编辑推荐