戳破学测15级分制的国王新衣

(本报系资料照片

109年度学测成绩日前公布,没有鉴别度又是一大问题!尤其是数学级分超多,达到14489人,比率是其他科的2、3倍,使得大考中心的主任辞职负责。对此,大考中心表示,这次数学科难度确实不符预期,未来将设定学测各科满级分人数目标,并加强行政检核,落实试题鉴别度与稳定性

数学科满级分占考生人数11.22%,因此被认为没有鉴别度,但其实从级分人数分布表会发现在国、英、社、自也有好些级分的人数占比是超过11.22%的。例如国文12级分的占比高达17.66%,社会10级分占15.51%。数学除了满级分,其他级分反而都没有超过10%。英文最好,全部级分都低于10%。若超过11.22%就没有鉴别度,那一缸子都有问题。

级分是一种标准化的量尺排序。其实要设计一份有鉴别度的试题,有一定的难度。以为题目难度均匀分布,但最后可能天不从人愿,因为量尺太粗,大部分的学生又差不多,最后当然是鉴别度低落。现在的15级分制就是以该科成绩前1%考生的原始平均得分除以15,作为级距计算的根本。原始分数0分者为0级分。因此数学科6.6分(100/15)就是1个级差距。而五标的制定为「顶标」、「前标」、「均标」、「后标」、「底标」分别是该科成绩位于第88、75、50、25、12百分位数之考生级分。

题目简单,难题甚少,又因级分是分数等距切割,有念书的原始分数都集中在高分端,因此顶标、前标级分就都很高,人数也很多。数学科顶标、前标今年就分别为14及13级分。国文科有几个题目比较难,满分人数少,但整体题目结果对有念书的考生来说是会的大家都会,不会的大家都不会,因此国文顶标、前标均为13级分,这表示前25%的考生都没鉴别度。去年也是如此。

再仔细研究级分人数分布表,会发现一个有趣的现象,就是前面级分集中度很高。例如国文顶标13级分,均标11级分,连底标都有8级分,可见88%的人集中在5个级分(8到13)。自然顶标13级分,均标8,底标5,比较有拉开,但88%也是集中在8个级分。为什么?因为学测是基本能力测验,不能出太难,最后就集中在前面级分。这能反映什么鉴别度?

级分制的用意原本是要模糊化分数,让大家不要每一分都斤斤计较。但一个级分就是上万人,在级分转换边缘的原始分数就很倒楣。以数学而言,93.4以上是15级分,93.3就是14级分。原本只差0.1分,但在级分制下却差了1个级分。而且若有人不小心多错1题,可能差了2、3级分,公平性变得很差。

过去看百分的原始分数计分,大家数学都考不好,可能平均是30、40分,有天纵英才,数学特别好,考了近满分,一看就是奇才,靠这科弥补不擅长的科目,照样「脱颖而出」。如果用这15级分制,就是牛骥同一皂、鸡栖凤凰食。

15级分的问题,这两年屡被检讨,不能更改的原因据悉是违背学测的基本精神。主事者认为基本能力测验,级分只是参考,大学应以更多元面向或资料评估学生的能力与潜力,进行选才,而不是只凭级分数筛选学生。

问题是,立意良善,执行困难。甄试学生就只能填区区6个志愿,解决了重榜,就限制了适性的机会。学生上传的备审资料,大都制式格式的少数几页,口试时间又非常有限,系所如何选才?笔试台大学院就是把报名旗下各系的学生找来,再来一次会考。考什么?题目设计得好不好?有没有鉴别度?也没有人追究。口试要问什么问题?能否获得更多讯息?我在当系主任时参考医学院跑台的考试方法,设计让学生要过4关,由不同的老师群进行「拷问」。我的感想是形式很棒,但多元入学就是多钱入学,对低收入者、社会的弱势家庭相当不利。

教改有理想正当性,但目前的结果就是国王新衣,只是没有人想去戳破。顶尖大学甄选招生比率都早已超过7成、指考分发不到3成。清大、交大为抢学生,不少系所的指考名额甚至剩不到1成,例如交大电机更只有4%。甄试成了最重要的大学入学管道。没有鉴别度的15级分制真该考虑修改。大学入学在台湾一直是社会很重视的关卡,一个有鉴别度的考试,公平公正,才是大家所期待的。(作者为中信金融管理学院讲座教授、国立台湾大学经济系名誉教授