失业的辛普森诡论

失业的辛普森诡论图╱美联社

2020年各学历失业率

最终统计,常是多组资料加总(或平均)的结果,例如大学录取率,男生录取率高于女生,直观上会认为有性别歧视,但还原加总前各组资料会发现,这并非歧视,而是多数女生选择录取率较低的文学院所致,各学院男女生录取率并无差别,此即辛普森诡论(Simpson’s paradox)。

■辛普森诡论(Simpson's paradox)意指数组资料经综合之后,可能会出现戏剧性变化,例如失业率是综合了各年龄层的失业率而得,录取率是综合了各学院录取率而得,各学院男女生录取率平分秋色,各年龄层高学历深具优势,惟加总后的数字皆出现逆转。

长期以来,台湾一直流行「高学历高失业率」的说法,拿起数据一核对,还真是如此,这样说来,书岂不是白念了,何以念愈多书,失业率却愈高?

不少人的解释是,高学历者找工作比较挑剔,因此失业率自然会高一些,这话虽有点道理,然而再怎么挑,人总得生活,最后还得屈就,不可能一直失业下去,况且以1990年代大学生的身价,哪会找不到工作?如此高学历又怎么会高失业率呢?

高学历高失业率一语流行于1990年代,那时期台湾失业率约2%,而大学学历失业率有时会到达3%,2000年以后情况更严重了,超过4%是家常便饭,自2009年以来年年超过5%,以去年而言,就高达5.5%。

失业率是综合各年龄层

去年其他学历的失业率如何?国中及以下学历者2.8%、专科2.8%、高中职3.5%,皆远低于具有大学学历者,三十年来,高学历高失业的情况依旧,虽然说念大学并非为了找工作,但念书期间所习得的学问、逻辑还是有助于就业才是,怎么会落得失业率居各学历之冠?

事实上,多数人在解读各学历失业率时,都落入了辛普森诡论(Simpson's paradox)了,辛普森于1951年发现,在某些情况下,数组资料合并成一组资料时,可能会得出相反的结论。

各学历失业率是综合各年龄层失业率而得,而各学历的年龄分布大不相同,以大学学历者而言,如今有四成分布在15~29岁的年轻族群,专科、高中职、国中及以下学历者逾七成分布在40岁以上,年轻人不多。

众所周知,青年失业率是一般人的两、三倍,这是因为学子们甫踏入社会需要一些时间磨合,随着年纪增长,失业率才会渐次降低,值得注意的是,观察30岁以上各学历失业率,丝毫没有「高学历高失业率」的情况,非但没有,大学学历失业率反而是最低的。

以去年为例,30~34岁这个年龄层,大学学历失业率低于专科、高中职,以40~44岁而言,大学学历失业率2.5%,专科2.9%、高中职3.1%、国中及以下3.7%,大学学历者深具优势。再看45~64岁,大学学历者1.9%,续居各学历最低,就业优势更上层楼。

社会新鲜人需磨合期

惟有在15~29岁青年族群,大学学历者的失业率较高,这是因为多念四年书,晚出社会所致,一般说来,这个年龄层专科、高职毕业生都已工作了七、八年,磨合期已过,而大学生甫走出校园,能量还在蓄积中,然而,过了而立之年,如前所言,高学历就业优势扶摇直上,失业率居各学历最低。

既是如此,何以各年龄层的失业率一综合,就出现「高学历高失业率」?这是因为大学学历者高达四成人口分布在15~29岁的年轻族群,这么高的比重分布在高失业的年轻族群,加总之后自然就陷入「辛普森诡论」,高学历低失业遂变成高学历高失业。

然而,随着少子化,再过几年当大学学历人口不再那么年轻,那时辛普森诡论就会消失了。