台灣AI引擎TAIDE再升級 國科會釋出8B模型
台版大型繁中语言模型再升级,国科会今天宣布,释出以最新Llama 3为基础的「可信任人工智慧对话引擎」(TAIDE)参数量80亿(8B)模型,且团队仅用4天就完成模型训练,并能马上开放可商用版本供产学研界使用。
为因应国际大型语言模型常产生资讯偏误,或不符台湾文化与价值观的回应,国科会去年4月启动TAIDE计划,在LLaMA(Meta推出的语言模型)原型基础上,由国内学界专家进一步发展及训练调校,先前已推出7B版本。
国科会今天指出,Meta于4月19日公开释出Llama 3新一代的大型语言模型,在各项评比中表现大幅超越前一代Llama 2,再次引爆LLM界的热潮。
为尽快提升以Llama 3为基础、具台湾文化的繁中模型,TAIDE团队第一时间以过去1年开发TAIDE模型所掌握的经验,加上累积整理的繁体中文资料集,基于「Release early, release often」的开发思维,仅以4天时间投入训练,经过基本测试,今天释出Llama 3-TAIDE-LX-8B-Chat-Alpha1模型。
国科会主委吴政忠对于TAIDE团队仅用4天旋即完成模型训练,并能马上开放可商用版本供产学研界使用,表示高度肯定。国科会提到,团队后续也将收集各界回馈意见并滚动调整,持续精进TAIDE系列繁体中文大型语言模型。
国科会进一步说明,自今年4月15日公开释出以Meta提供开放模型Llama2为基础的TAIDE-LX-7B繁中可商用大型语言模型,目前在开放社群平台上,许多高手已提供不少安装与使用指南,也有10余家厂商及多个学研团队及公部门开始导入TAIDE模型开发相关应用系统。
国科会强调,民众现在可以进入TAIDE官方网站,了解模型发展目标与历程,并点入网站上「TAIDE模型」连结,再进入该页面中提供的Huggingface连结下载,就可开始使用并体验具有台湾特色的大型语言模型。