AI大战 谷歌Gemini超越OpenAI
谷歌(Google)6日正式推出多模态的大型语言通用模型Gemini。图为2023世界制造业大会9月在大陆安徽省合肥市举行,民众体验智能设备。(中新社)
谷歌(Google)6日正式推出了多模态的大型语言通用模型Gemini。Gemini共推出3种版本,包含性能最强大的Ultra版模型、通用性最广的Pro版,及可以在手机装置上运作的Nano版。其中Nano版本可让安卓(Android)系统的开发人员能借此打造离线使用的人工智慧(AI)应用程式与功能。但目前仅先供谷歌旗下的Pixel系列手机搭载。
Gemini是使用谷歌自行开发的晶片「TPU」训练而成,可以同时支援文字、图片和声音的输入。在32项AI测试中,有30项的评分超越了OpenAI的GPT-4V。谷歌执行长皮查伊(Sundar Pichai)强调,Gemini是谷歌有史以来最强大、也最通用的模型。
三大模型里,Gemini Ultra是专为资料中心和企业应用程式的复杂任务而设计,但谷歌目前正对Ultra版进行信任和安全测试,现仅挑选特定企业用户或开发者进行Ultra版试用,预计2024年初才正式推出。
Gemini Pro则自6日起与谷歌的聊天机器人「Bard」英语版本整合,可在美国、亚洲和非洲等170多个地域使用,可以如同OpenAI的GPT-4,让开发者整合到不同应用当中。谷歌预计从13日开始,开放企业透过旗下GCP Vertex AI或Google AI Studio存取Gemini Pro模型。
Gemini Nano则分为2个版本:分别是18亿个参数的Nano-1和32.5亿个参数的Nano-2,专为终端设备而设计,以优化AI在安卓系统中的性能。谷歌表示,Nano版甚至不需要网路,单靠手机上的TPU晶片也能运作,目前先支援Pixel 8 Pro手机,未来再进一步扩大支援其他手机。
与此同时,七国集团(G7)领袖于6日召开视讯会议时,达成了防止AI滥用的「广岛AI进程」国际规则框架最终协议,成为首份对所有AI开发人员及用户应遵守的全面国际规则。此协议不具法律约束力,具体规定任由各国自行发布。主要规范开发人员及用户应避免AI发布虚假资讯,并要求推进「数位浮水印」等技术开发,从而能识别生成式AI的内容。