Google I/O開發者大會聚焦AI 3大全新功能令人驚艷

接下来Gemini将融合在各种Google应用中为使用者提供协助。图/Google提供

今年就是AI年!近日登场的Google I/O开发者大会中,罕见地并未特别着墨新的Android系统、也未有新的硬体装置亮相,而是将主轴聚焦在现有服务加入AI应用后的各式神奇功能,以及与让开发者可以轻松运用AI的实用工具,虽然大部分内容一般用户现在还用不到,但透过发表会中的情境示范,应该会让大多数日常工作、生活都离不开Google应用的民众相当期待。以下几个Google I/O中的亮点快跟上!

立基于个人AI助手「Gemini」的帮忙,Google相簿中将加入「Ask Photos」功能,以后找特定相片不用再苦思到底哪时候、在哪里拍的,只要透过自然语音,就能轻松搜寻自己图库里的照片,可以直接描述人物、情境、物件等,新功能就能快速从相簿中捞出可能符合的结果,再也不怕找不到想要的那张照片。

而Gemini的功能也更加进化,最新Gemini 1.5 Pro拥有可理解更长的脉络长度(context window)、全新资料分析能力、整合更多Google应用程式,和更丰富的自订选项。Gemini Advanced的订阅者之后将可以一次将更长的文件档案、更多的电子邮件,甚至是多种档案格式一起丢入,Gemini即可快速取得复杂文件中的疑问解答和深入分析结果,比如租赁合约中关于宠物条款的细节,或是比较2篇冗长研究论文的关键论述。未来,甚至还能够担任你的资料分析师,深入解读试算表等上传资料档案,并产出客制的图表视觉。可以是文字整理,使用者也可以透过语音询问的方式得到想要的解答。

不只是用在工作应用,Gemini Advanced也能对日常生活所需提供更贴心的建议,比如想要安排家庭旅游,直接对Gemini提出时间、地点、旅游目标、饮食等需求,即会得到更客制化的旅游建议。Gemini会考量您的航班时间、饮食偏好以及旅游地点资讯,同时也了解每个地点的位置以及在各活动之间移动所需的时间。它会从你的Gmail捞出航班资讯、利用Google地图推荐饭店附近的餐厅和博物馆,并使用搜寻功能推荐其他活动,像是设计区徒步旅行或海滩时光,来填满您一天的剩余时间。

Gemini 1.5 Pro版也大大提升了对影像的理解能力,如果你在最爱的餐厅吃到喜欢的菜,只要拍张照,就可以请Gemini提供食谱;解不开的数学题目,也只要拍张照,让Gemini透过步骤来帮助你寻找答案。当然,在Android系统上,Gemini也可以发挥强大功能,串连起各种Google应用程式,透过生成式AI来提高创造力和工作效率。

另外一个在发表会中让众人惊呼的功能,则是「Project Astra」,用户只要打开手机镜头,就可以透过对话快速辨别眼前的各种事物、声音等资讯,回复速度超快,且可以理解前后文脉络,不只是一问一答,话题是可以一直延续的,在示范影片中,甚至可以帮使用者找到眼镜放在哪里。

还有一个主打影像创作专业用户,比较像是火力展示的功能,就是「Veo」影片生成模型,只要输入一段文字描述指令,就可以生成1分钟左右、各种不同风格的影片,颇有与OpenAI的Sora模型比拼的意味。

Google I/O开发者大会以AI为核心发表众多应用。图/Google提供

「Veo」影片生成模型,只要输入一段文字描述指令即可自动生成影片。图/Google提供

内建AI的Android作业系统,让使用者与手机的互动方式有无限可能。图/Google提供

Google I/O开发者大会以AI为核心发表众多应用。图/Google提供

Gemini是以成为你的个人AI助手进行设计,可以进行流畅对话、更直觉并为你带来更多帮助。图/Google提供