谁是「布什」总统? 中研院「台版GPT」喂入大陆用语

国民党立委叶元之(左)。(叶元之提供)

国民党立委叶元之今(20)日质询中研院时指出,上次中研院开发的「台版GPT」,被发现使用到大陆资料,但今天又被他发现「断词系统」也有不符合台湾语境的「布什总统」,要求中研院立刻改进。

叶元之说,之前中研院开发的小型研究专案「台版GPT」,被人发现出现很多中国大陆使用的语境,比如说询问「我国最高领导人是谁」,「台版GPT」回答习近平;询问「你是谁创造」,台版GPT回答「我是复旦大学创造」。这明显用到大陆的资料Date,当时中研院表示会修正。

不过叶元之发现,中研院同一个实验室制作的另外一个断句系统(输入一整句,系统会帮忙上标点符号),依旧有使用中国大陆语境,一登入使用介面的范例就是「美国总统布什…」,明显不符合台湾人语境,因为台湾人通常是称「布希」总统。

叶元之质疑,在上一个「台版GPT」系统出问题时,就应该做全面的检查,不应该还被发现有一样的状况。

中研院长廖俊智答询表示,看起来这系统的做法,是拿网路上所有繁体中文可以搜寻到的词句作为来源。

资讯所所长廖弘源补充,断词系统是使用繁体字作为样本,来源是英国BBC网站繁体资料。

叶元之认为,一般民众不会在乎资料来源是哪里来的,只会质疑为什么中研院系统会出现「布什总统」这样的大陆用语;尤其这一案比上次「台版GPT」花的经费更贵,花费100~200万元,在上次出问题的时候就应该做一个通盘的检讨,不应该再有类似情况发生。