產官學界合作、NVIDIA開發者計畫技術協助的繁體中文專家模型開源專案「Project TAME」問世

由长春集团、和硕联合科技、长庚医院、欣兴电子、科技报橘联合发起,携手台大资工系、台大资管系及律果科技合作,在NVIDIA协助下完成训练的繁体中文专家模型开源专案「TAiwan Mixture of Experts」 (Project TAME),能以在地文化及用语,加上产业专业知识形式运作,将使台湾产业能快速导入自动生成式人工智慧技术应用。

举例来说,一般企业如果要从零开始训练10亿参数模型,通常需耗资新台币3.8亿元,并且耗时长达576小时时间,而借由Project TAME 700亿参数模型,企业导入仅需新台币1600万元成本,同时以短短3.5小时时间即可完成训练企业内部资料,大幅降低导入成本及时间,进而能快速最佳化企业运营管理、人员训练、产品服务、客服等多元人工智慧技术应用。

这次Project TAME繁中专家模型开源计划,由台大资工系副教授陈缊侬带领实验室同仁与企业伙伴开发团队共同合作,透过NVIDIA开发者计划技术协助,让多家垂直产业的企业专家贡献专业领域的资料,预训练近5千亿个字元 (token)开发出繁中大型语言专家模型。

在完全没有签约的约束下,业界跟学界纷纷自发性合作,短短数月推动下,Project TAME 繁体中文模型已有初步具体显著成果,在各项繁中相关指标中领先全球模型,连台湾的「大学学测、律师/中医考试、导游证照、驾照、台湾在地化测验」均取得优异分数,同时在台39项综合评测、近三千个题目的结果中,Project TAME取得分数就超过所有模型,正确率相较第二名的Claude-Opus模型高出6.8%,更比OpenAI的GPT-4o高出9.3%。

Project TAME繁体中文专家模型正式对外发布后,将以开放原始码的形式对外提供。台大资工系副教授陈缊侬指出,在不同的资料间可能有共同交集可以使用, 这对语言模型的发展是更好的,也能让不同产业的专家贡献自己领域的资料。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》