Google展示名為「Project Astra」的通用人工智慧數位助理 部分功能將率先用於Google服務
在Google I/O 2024开始前,Google曾预告类似Google Lens的应用功能,确定为以「Project Astra」的发展项目,将能结合语音互动、影像识别、环境感知等方式,让人工智慧即时描述、解释以手机镜头拍摄画面内容,甚至也能无缝移转到具备摄影镜头功能的眼镜上继续使用。
「Project Astra」是由Google DeepMind团队构思打造,并且以通用人工智慧数位助理形式为目标,让使用者能透过此服务提高工作效率、简化做事流程,并且以此解决日常生活的疑难杂症。
不过,目前「Project Astra」仍处于相当早期发展阶段,暂时尚未有具体成为正式产品或服务计划,但Google DeepMind团队负责人Demis Hassabis表示「Project Astra」相关功能将会应用在手机或眼镜类智慧穿戴装置,甚至部分功能将会在今年内率先应用于Gemini等Google服务。
从此次Google I/O 2024实际展示来看,「Project Astra」将能透过手机镜头拍摄画面,并且由人工智慧即时地持续描述画面细节,例如描述扩音器可发出声音,甚至指出其中可发出高音频的扩音元件,或是描述以蜡笔为题的创意叠词、辨识程式编码内容,甚至针对白板上画的猫与纸箱联想到「薛丁格的猫」等。
此外,从影片中使用者另外提到是否记得眼镜位置,人工智慧即可快速回答眼镜所在位置,代表其具备资讯记忆能力,同时也能随着使用者从手机切换到使用具备镜头摄影功能的眼镜,更代表「Project Astra」具备一定资料迁移特性,让使用者能在不同装置上持续使用。
而Demis Hassabis表示目前已经可以透过多模设计让「Project Astra」的人工智慧处理诸多讯息,但要能让回应时间缩短至与一般对话相仿,其实是相当困难挑战。
《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》