意外現身I/O大會!談及Gemini Google創辦人布林:AI比想像厲害

Google共同创办人布林(Sergey Brin)去年重返Google,为人工智慧(AI)技术操盘。路透

Google共同创办人布林(Sergey Brin)去年重返Google,为人工智慧(AI)技术操盘,他今天意外现身在美国加州山景城举办的Google I/O年度开发者大会,向媒体分享对Google AI模型Gemini的看法,大赞比想像更厉害。

布林原本已经淡出Google营运,鲜少涉足公司业务,去年7月外媒发现布林常出现在Google总部,与AI研究员一起工作,开发Gemini模型,以因应OpenAI公司旗下聊天机器人ChatGPT崛起所带来的挑战。

中央社记者受邀前往I/O大会现场,参加一场禁止拍摄、介绍Gemini 1.5模型功能的闭门小型展演时,一名工作人员开门走进来,定睛一看竟是Google创办人布林,引起现场一阵惊呼。原本议程并没有安排布林参与,事前也没有任何布林会出席I/O大会的消息。

他向现场记者一一握手打招呼,展现十足亲和力,与在场所有人一起合影留念。

布林表示,自己推动Gemini发展时,发现Gemini比想像中更厉害,于是陆续应用到各种领域,进一步拓展Gemini的能力,包括今天展示的视觉辨识与记忆能力。

在Gemini 1.5模型的展演中,工作人员把长颈鹿、鸭子、小狗造型的布偶逐一放在摄影机下方,帮每个布偶取名,然后询问Gemini每个名字的布偶是谁;Gemini回答时除了能分辨每个布偶是什么动物,也能准确把名字连结在一起。

在接下来的展演中,工作人员在触控萤幕上用手指绘图,Gemini可以分辨是小圆圈或人形,还能根据工作人员加上的外星人图案,联想到手绘图可能与电视影集「X档案」有关。

Gemini 1.5 Pro是Google最先进的AI模型,可包含100万个词元的脉络长度(context window),是目前全球其他一般消费者使用的聊天机器人所拥有最高的脉络长度,因此Gemini Advanced服务能理解内容更庞大的文件,像是长达1500页的文件档案,或处理约100封电子邮件的摘要。

不久后,Gemini Advanced还可以处理长达1小时的影片内容,或超过3万行的程式码。

Google同时宣布,在接下来几周内,将为订阅Gemini Advanced服务的使用者推出Gemini Live功能,透过语音技术,使用者能够以直觉自然的方式与Gemini互动,除了跟Gemini互动时可以用自己习惯的语速交谈,也能中途打断Gemini的回应来询问额外问题,进一步厘清资讯,就像任何日常对话一样。