工商社论》政府应公布前1%的薪资分布统计
主计总处日前公布2019年国内上班族的薪资中位数,这项资料告诉我们800万名上班族的薪资分布曲线右偏得愈来愈严重,近七成的人所领的薪水不及于平均薪资,平均薪资已然失去代表性。
遗憾的是,政府每月发布的就是平均薪资,这些年薪资成长主要是来自极端高薪者的拉抬,高薪族群为数可能只有五、六万人,但由于他们的年薪动辄千万元、数百万元,加以年年高成长,使得平均薪资与多数人愈离愈远。
平均薪资与大家离得多远?从两年前行政院副院长施俊吉召开记者会说明台湾薪资现况,却引来网路嘲讽即可明白,平心而论并非施副院长说得不好,而是因为他援引的是平均薪资,从统计上来看,平均数是最佳统计量(statistic),然而在如今母体变异度过大的情况下,平均数已难以反映多数人的感觉,可谓最不接地气的统计。
政府每月公布的薪资都是平均数,在极端高薪者一起平均之下,自然会高估多数人的收入,这也是2018年网路嘲讽政府官员不食人间烟火的原因,改善之道就是以中位数取而代之,中位数不会受极端值影响,更适合观察总体的薪资走势。
主计总处自2011年即着手试编薪资中位数,以让国人知道自己薪资排序,所谓中位数是指一群数字排序居中者,碍于薪资统计来自厂商面,没有个人资料无法据以排序,因此得循「人力运用调查」这份家庭面的调查为基础加以排序,然后依「受雇员工薪资调查」的定义加以校正,才得以估出薪资中位数,主计总处援引此一方法推估了2015年、2016年的薪资中位数。
随后主计总处修正估计方法,自2018年底所发布的薪资中位数改以大数据推估,所谓大数据包括综合所得税档、劳保、劳退及健保档,由于援引大数据,没有抽样的问题,将受雇者资料依薪资定义校正即可排序而得出薪资中位数,这一估计自然比昔日只抽两万户家庭、一万家厂商的推估来得准确,以两份估计重叠的2012~2016年比较,以大数据所估得的中位数比先前调查推估数略低,以2016年而言,原推估年薪中位数48.7万元,经大数据推估仅46.4万元,以2012年而言,原推估46.3万元,大数据推估44.2万元。
主计总处运用大数据原可以产生更细致的薪资分布,揭开前1%,甚至前0.5%极端高薪族群的变化,然而,这些年主计总处所公布的薪资中位数,和昔日抽样推估所公布的内容几无二致,在薪资统计分布上依旧只公布到十等分位组的分界点,这样的分法,最多也只让我们了解第九分位点的薪资,什么是第九分界点?就是赢九成而输一成的那一点,以受雇人数800万人而言,第九分界点就是排名第80万的那个上班族的年薪,以2019年而言第九分界点就是117.9万元,这样的薪资水准是称得上高薪,但离极端高薪仍远。极端高薪应该是前1%,甚至前0.5%,以800万人而言,就是薪资排名居于前八万、前四万的上班族。
以大数据资料莫说要取前1%、前0.5%,就算要估出前0.1%、0.01%金字塔顶端者的薪资变化也易如反掌,美国所公布的所得分配资料就可以细到这个水准,另外,法国经济学者皮凯提(Thomas Piketty)与各国学者近年所建立的全球不均度资料库(WID)也已算到前1%,我们如今有大数据可供运用,明明可以估算至金字塔顶端,却还是只公布到第九分界点,这形同是前20%的中位数而已,与前1%、前0.1%有天壤之别。
主计总处自然是了解分布的全貌,才会说平均薪资的快速成长是受到极端高薪族群的拉抬,然而这句话只是情境的描述,在语境上只能各凭感觉去想像,几年前在没有大数据的情况下,做此推论是不错的,然而如今已有大数据可资运用,还以这么模糊的语言描述其中的变化,那是不及格的,主计总处应该善用大数据,清清楚楚告诉我们前1%、前0.1%薪资分布近几年到底出现了什么变化。
这些年由于大数据的运用,对于传统的抽样推估带来了不小的挑战,过去因为样本数太少不能推估的数字,如今都算得出来,正当各国都在所得分配、薪资分配精进到前1%、前0.1%之际,我们拿着大数据还在推估前20%的变化,大数据在我们手中全变成了小数据,非但可惜,甚且可笑。
诺贝尔经济学奖首届(1969年)得主丁伯根(Jan Tinbergen)曾任职于荷兰统计局,1984年诺贝尔经济学奖得主史东(Richard Stone)也曾服务于英国中央统计局,他们当年能运用的统计不如今日甚远,却能洞析问题,勇于变革而开创新局,所以如此,用心而已,我统计部门如今拥有的资源更胜一筹,自应以此自我期许,尤有甚者,前1%、前0.5%的薪资分布统计宜尽速研编并适时公布。