台版ChatGPT TAIDE會寫作翻譯

中研院与国科会等单位合作推台版ChatGPT「TAIDE」,国科会主委吴政忠表示,最快今年四月中释出商用TAIDE-7B开放业者用于研发,届时有望将TAIDE模型内建于电脑、手机等装置内。中研院长廖俊智昨在立院答询时则提到,为丰富繁体中文版ChatGPT资料库,将努力排除法规限制,尽可能开放院内资料提供ChatGPT语言模型训练。

国际大型语言模型(LLM)时常产生偏误或不符本土文化的回应,国科会于去年四月启动TAIDE计划,欲打造台湾专属大型语言模型,目前已开发商用版本TAIDE-7B,以及学研用版本TAIDE-13B模型。

国科会昨提供媒体实测,由TAIDE-13B试写学测国文写作题,进而撰写具备起承转合的文章;现场亦由媒体出题,由TAIDE撰写邀访信。

国科会副执行秘书杨佳玲表示,国际上训练LLM时,中文仍以简体资料库为主,内容便容易偏离台湾文化和价值观,因此台湾必须打造自己的大型语言模型。

杨佳玲说,目前TAIDE-13B在撰写文章、信件、摘要、中翻英以及英翻中时,表现已和ChatGPT3.5相当,且拥有更丰富的在地知识。

廖俊智昨赴立院业务报告时,立委陈秀宝提到,生成式AI需要大量资料做训练,但现阶段繁体中文的资料库远少于简体,加上抖音、小红书,让台湾学子接收大量简体中文,担忧繁体中文未来会沦为弱势,要求中研院协助整合繁体中文的语言资料。另有立委关心台湾AI立法进度。

廖俊智表示,台湾AI立法精神应该是「以人为本」,为丰富繁体中文版ChatGPT的资料库,会在不违智财权法规的限制下,尽量开放中研院资料库训练AI。