苏建州/民调支持度差距的抽样误差怎么算?不是6趴或3趴,是另有其趴!
▲ 蓝白合不合的争议,让3%或6%引发双方口水战。(图/记者许靖骐摄)
● 苏建州/世新大学传播管理系特聘教授
蓝白合? 或不合?这是「统计学」x「政治学」问题!只是「三脚督」选战已鸣枪,「政治学」部分就翻页,对比民调(两题目)的「统计学」难题也跳过,选择讨论在选举弃保战场关心的「统计学」:「三脚督(单一题目)民调中两候选人支持度差距的抽样误差」怎么算才合「统计学」的理?当初蓝白合破局元凶就是卡在双方民调统计专家对「抽样误差」的计算与判读没共识,未来蓝白支持者弃保判断「侯康配」和「柯盈配」民调差距是否在统计「抽样误差」范围内的标准可以有共识吗?3趴?6趴?还是另有其趴?
笔者是「统计学」的粉丝,也曾经着迷于「民调」。曾经积极地参与和关注调查程序稳健性、非抽样误差(或称系统偏误)相关研究,虽然脱离「调查方法论(survey methodology)」学术圈甚久,但仍蹭此「全民疯狂补修统计学」风潮,透过恼人的统计学公式和符号在热闹之余,介绍一些基础统计学的门道。
随2024年总统大选日益接近,面对满天飞舞的各家民调,大家除关心三组候选人个别民调支持度变化外,候选人支持度差距的「抽样误差(Margin of Error, MOE)」也会是民调的观盘、解盘重点。为何MOE如此关键? 以统计学术语来说,MOE是最终用来判断检定假设(testing hypothesis,这里的命题是「两候选组合支持度有差距」)是否成立的门槛值(critical value)。
首先,可能是大家最为熟悉、也是最常在统计学教科书上看到的「抽样误差」公式:
这是针对特定候选组合支持度的抽样误差,即指在95%信心水准下支持度的信赖区间估计。当样本数n= 1068、支持度p=0.5时,可计算出「抽样误差」确实是大家所熟悉的3%,其中p=0.5是依据最保守的MOE推估,亦即实际的MOE可能会再更小一些。
如果是「两组候选人支持度差距」的抽样误差? 笔者认为以多项分布(multinomial distribution)和抽样分配来定义此问题更为适当,其中「抽样误差」公式为:
如果是两组候选人选战,而且民调未表态比例甚低,在样本数n= 1068、两组支持度相同p1=p2=0.5时,可计算出「抽样误差」确实是大家熟悉的6%,其中p1=p2=0.5是依据最保守的MOE推估。
回到2024年总统大选有三组候选人的案例,综观近日媒体发布的民调都不是选举预测,其中未表态约约1~3成,另「赖萧配」约3~4成。因此,蓝+白的民调支持度约占5-6成(p1+p2≠1),「两组候选人支持度差距」的抽样误差需再精算。依据是蓝白两组候选人平均支持度为0.3(p1=p2=0.3,是最保守的MOE推估),带入公式后可计算出「抽样误差」为4.6%。亦即只要侯康配和柯盈配双方支持度差距大于4.6%,即可声称双方的差距已达统计显著性。话虽如此,除了锱铢计较几趴的抽样误差计算外,民调程序中潜藏太多严重、难控的系统性「非抽样误差」是动辄十几趴,也因此仍建议在解读这些民调数字时还是应附加警语提醒:保守为宜、审慎为上!
►►►思想可以无限大--喜欢这篇文章? 欢迎加入「云论粉丝团」看更多!
● 以上言论不代表本网立场,欢迎投书《云论》让优质好文被更多人看见,请寄editor88@ettoday.net,本网保有文字删修权。