聯發科推出BreeXe大型語言模型與「達哥」自動生成式AI平台

联发科在今年释出其对应70亿组参数规模的大型自然语言模型Breeze-7B之后,此次再次推出名为「BreeXe」的大型语言模型,以及相应的自动生成式人工智慧服务平台「MediaTek DaVinci」,更以「达哥」作为暱称。

依照联发创新基地负责人许大山博士说明,「BreeXe」是由联发科位于英国剑桥、伦敦,以及台大创新机第三方合作打造的大型自然语言模型,更强调「BreeXe」是当前繁体中文能力表现最好的模型,并且能以450亿组参数规模超越OpenAI的GPT 3.5表现,单次可处理超过4万字的文字内容,更比Mistral AI提出的客制化模型Mistral对应10倍以上执行能力。

而针对台湾地区使用繁体中文处理能力,联发科强调加入诸多在地化微调训练,甚至也加入理解诸多在地用语设计,例如可以理解「母汤」是台语「不行」意思,而不会像之前会理解成「粤语」内容。

同时,「BreeXe」透过NVIDIA提供的Taipei-1超级电脑DGX GH200进行训练,接下来也计划将「BreeXe」处理能力提升达GPT-4等级。

至于对于自动生成式人工智慧服务平台「MediaTek DaVinci」的看法,联发科以瑞士刀作为比喻,将透过此平台结合不同外挂资源,使其能对应不同应用场景,让更多结合人工智慧的服务可以更快借此服务平台建构。

目前「MediaTek DaVinci」除了收录「BreeXe」,先前也已经收录包含微软旗下人工智慧模型,以及OpenAI的GPT、DALL.E3,更包含Anthropic日前推出的Claude 3,期望能透过此平台协助更多开发者、企业导入自动生成式人工智慧应用资源。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》