數位部展示AI評測能量 抓出模型中文用語差異

ChatGPT掀起生成式AI热潮,如何检视讯息正确性成评测重点。数位部AI评测中心今天展示成果,其中在准确性项目,会测试模型能分辨出台湾与中国用语差异,以及能否正确回答台湾在地文化知识等。图/联合报系资料照片

ChatGPT掀起生成式AI热潮,如何检视讯息正确性成评测重点。数位部AI评测中心今天展示成果,其中在准确性项目,会测试模型能分辨出台湾与中国用语差异,以及能否正确回答台湾在地文化知识等。

数位部长唐凤今天下午视察AI产品与系统评测中心,她受访时表示,AI评测中心接轨全球最先进国家包含美国、欧盟与英国等做法,借由接轨与全球共同发展AI评测体系,协助各行业导入生成式AI时,保持安全、又能维护隐私与人权等价值。

AI评测中心团队分享案例,AI评测中心会透过题目来测试语言模型是否可以判断台湾与中国用语差异,例如笔电设备,在台湾称为笔记型电脑,中国则称笔记本电脑,同时,AI评测中心也会透过问题,测试模型能否正确回答台湾在地文化知识与观光景点等。

不过目前部分评测项目涉及社会安全,仍有赖人工审议,还无法自动检测,唐凤表示,将持续搜集外界想法进行测试。

至于未来评测中心是否可能收费,唐凤仅说,由制度推动委员会决定。