☰

工研院首座「AI測試實驗室」登場提供語言模型可信任評測

首座「AI测试实验室」提供语言模型可信任评测服务。图／工研院提供

随着生成式AI应用范围日益拓展，数位科技正在重新塑造我们的生活与商业模式，语言模型作为其重要核心，相关资安、准确性等问题，也是产业关心的重要议题。为确保AI人工智慧更安全的发展，提升人民对AI的信赖，在数位发展部数位产业署支持下，工研院29日宣布打造台湾首座AI测试实验室，全方位确保产业客户的语言模型能安全可靠地在各个领域稳定运行。

语言模型是自然语言处理（Natural Language Processing；NLP）不可或缺的关键，也是AI人工智慧理解文本、生成内容、语音辨识、情感分析等重要依据，经由大规模文本学习来掌握语法、语意、上下文关联性等语言特征，进而产生类似人类的自然语言。然而，模型也可能因为数据偏差或失真，导致产生错误或不当资讯，甚至在处理敏感数据时更有资安风险存在。因此，尽管生成式AI当红，但语言模型的开发和部署还是得小心谨慎，以确保输出结果准确、稳定且可靠。

在数发部数产署支持下，工研院成立台湾首座AI测试实验室，参考国际可信赖AI的相关框架及标准，透过AI产品与系统评测中心（Artificial Intelligence Evaluation Center；AIEC）专家以及技术委员会开发可信任语言模型评测工具，提供包括准确性、公平性、可靠性、隐私及资安等自动化语言模型测试方案，协助国内厂商评估及改善语言模型，以确保语言模型及AI应用能在不同场景下保持稳定及可靠，并满足企业和使用者需求。

工研院量测技术发展中心执行长蓝玉屏表示，随着生成式AI渗透到各个领域，对AI模型进行可信任性的测试与评估至关重要，因此工研院打造针对语言模型提供评测工具开发和导入的AI测试实验室，透过参考国际以及国内专家审议的测试题库，来评估生成内容的可信任性，促进企业在应用AI技术时更具信心。未来，跟随AI应用更进一步拓展，工研院将持续加强对AI技术的测试和把关，并探索新兴技术应用的测试与评估，确保台湾在全球AI技术竞争中的发展。此外，为了强化国际合作，工研院也同时与法国国家计量院（LNE）签署合作协议，针对AI进行国际合作与技术交流，助力台湾AI评测技术接轨国际。

工研院擘画「2035技术策略与蓝图」发展「人工智慧与资安」、「半导体晶片」、「通讯」、「智慧感测」等四大智慧化致能技术，协助我国各产业在AI人工智慧领域持续发展，并推动技术创新，此次AI测试实验室的成立更是重要支柱，透过严谨的测试与评估，为我国AI技术发展提供稳固基石，推动台湾科技向更高层次迈进。

工研院首座「AI測試實驗室」登場 提供語言模型可信任評測

相关资讯

工研院首座「AI測試實驗室」登場提供語言模型可信任評測