Google新AI模型 硬槓ChatGPT

Google发表新生成式AI模型「Gemini」,将首度可直接在手机上运作。图为Alphabet执行长皮伽5月在开发者大会上谈论Google的AI事业资料照片。 (美联社)

Google推出新的生成式AI模型「Gemini」,将首度可直接在手机上运作,这将为该公司与ChatGPT开发商OpenAI等同业的竞争带来突破。

英国金融时报(FT)报导,Google形容Gemini为该公司「最大、最有能力、最通用」的AI系统,可分析影像和声音资讯,并具有复杂的推理和「规划」能力。这套系统6日已用来驱动Google的聊天机器人Bard,明年起将更广泛整合到Google的搜寻引擎上。

Gemini的其中一个版本「nano」,是专门为了在行动装置上运作而设计,并将整合到Google最新的Pixel手机里。Google表示,这个模型将在手机上「原生运作」,并已针对手机做过优化,因此Android开发人员将能轻松打造出可离线使用的AI应用程式(App)与功能,或是使用装置上的个人资讯时,更能保持隐私。」

这项进步将有助解决AI技术带来的经济问题。只用手机的运算能力就能运作生成式AI,而不需透过科技大厂营运的云端伺服器来运作,将大幅降低运作生成式AI的成本。这也将为想把私密资料留在手机的用户提供一层保障。

Google暨Alphabet执行长皮伽在部落格文章表示:「我相信,我们现在看到的AI转型,将是我们一生中最深远的转变,远超过先前迈向手机或迈向网路的转变。」

生成式AI已在矽谷为科技大厂开辟一块新战场。在Google发表这个最新生成式AI系统前,微软出资支持的OpenAI、Meta,以及Anthropic、Mistral等新创公司都发表了AI模型。

Google表示,Gemini是第一款在特定任务上表现超越人类专家的AI模型,在多项测试中超越OpenAI的GPT4模型。特别的是,这个模型能解决数学推理问题、分析科学数据和编写进阶程式码。

Google展示如何用Gemini扫描手写的数学算式,并标出当中错误和解释原因。科技类YouTuber马克.罗伯则使用整合了Gemini的Google聊天机器人Bard,拍摄一段影片,并在影片中测试打造最具空气动力学的纸飞机,这款AI模型为他的实验和设计提供改进建议。