工研院首座AI測試實驗室 提供語言模型可信任評測服務

工研院打造台湾首座针对语言模型评测的AI测试实验室,图由左至右为工研院量测技术发展中心业务长吴登峻、国家资通安全研究院总监刘建良、数位发展部数位产业署技正彭成瑜、工研院量测技术发展中心执行长蓝玉屏、工研院资讯与通讯研究所组长王邦杰、工研院量测技术发展中心数位长陈宗杰。图/工研院提供

随着生成式AI应用范围日益拓展,数位科技正在重新塑造我们的生活与商业模式,语言模型作为其重要核心,相关资安、准确性等问题,也是产业关心的重要议题。为确保AI人工智慧更安全的发展,提升人民对AI的信赖,在数位发展部数位产业署支持下,工研院29日宣布打造台湾首座AI测试实验室,全方位确保产业客户的语言模型能安全可靠地在各个领域稳定运行。

语言模型是自然语言处理(Natural Language Processing;NLP)不可或缺的关键,也是AI人工智慧理解文本、生成内容、语音辨识、情感分析等重要依据,经由大规模文本学习来掌握语法、语意、上下文关联性等语言特征,进而产生类似人类的自然语言。然而,模型也可能因为数据偏差或失真,导致产生错误或不当资讯,甚至在处理敏感数据时更有资安风险存在。因此,尽管生成式AI当红,但语言模型的开发和部署还是得小心谨慎,以确保输出结果准确、稳定且可靠。

在数发部数产署支持下,工研院成立台湾首座AI测试实验室,参考国际可信赖AI的相关框架及标准,透过AI产品与系统评测中心(Artificial Intelligence Evaluation Center;AIEC)专家以及技术委员会开发可信任语言模型评测工具,提供包括准确性、公平性、可靠性、隐私及资安等自动化语言模型测试方案,协助国内厂商评估及改善语言模型,以确保语言模型及AI应用能在不同场景下保持稳定及可靠,并满足企业和使用者需求。

工研院量测技术发展中心执行长蓝玉屏表示,随着生成式AI渗透到各个领域,对AI模型进行可信任性的测试与评估至关重要,因此工研院打造针对语言模型提供评测工具开发和导入的AI测试实验室,透过参考国际以及国内专家审议的测试题库,来评估生成内容的可信任性,促进企业在应用AI技术时更具信心。未来,跟随AI应用更进一步拓展,工研院将持续加强对AI技术的测试和把关,并探索新兴技术应用的测试与评估,确保台湾在全球AI技术竞争中的发展。此外,为了强化国际合作,工研院也同时与法国国家计量院(LNE)签署合作协议,针对AI进行国际合作与技术交流,助力台湾AI评测技术接轨国际。

工研院擘画「2035技术策略与蓝图」发展「人工智慧与资安」、「半导体晶片」、「通讯」、「智慧感测」等四大智慧化致能技术,协助我国各产业在AI人工智慧领域持续发展,并推动技术创新,此次AI测试实验室的成立更是重要支柱,透过严谨的测试与评估,为我国AI技术发展提供稳固基石,推动台湾科技向更高层次迈进。