寻找“超级应用” AI走进“智能体”爆发前夜
本报记者 李晖 上海报道
大模型的下半场正在进入“智能体”批量涌现时间。
在刚刚结束的2024世界人工智能大会(WAIC)上,各大科技厂商都带来了“看家”的AI技术“秀肌肉”。一个比较明确的信号是,在AI技术从实验室走向生产环境和商业化的过程中,服务于普通大众的“智能体”(AI Agent)正在成为行业普遍看好的应用方向。
《中国经营报》记者在2024WAIC上注意到,包括百度、蚂蚁、商汤科技、腾讯等科技公司都带来了以“智能体”为代表的AI应用,并在医疗、教育、金融等领域开始渗透。
能干,正在成为衡量AI价值的新共识。蚂蚁集团首席技术官何征宇在2024WAIC期间接受《中国经营报》等媒体记者采访时就表示,整个社会都需要专业智能体涌现。在他看来,随着AI落地应用的不断探索,AI不仅“有脑有嘴能对话”,未来智能化的用户体验将真正实现“有手有脚能办事”。
最被看好的AI应用方向
结合文本、语音、图像等多模态能力的大模型改变的不仅仅是人机交互方式,也催生了新的“工种”——AI智能体。
业界通常认为,AI智能体是指具有自主性、反应性、交互性等特征的智能“代理”,能够自主理解、规划决策、执行复杂任务等。它的核心在于自主性的增强,即可以独立完成某项工作,不必人类进行过多的审核校正,可以将时间、金钱等成本降到最低。
去年11月,OpenAI曾在发布会现场展示了智能体概念,比如在开会前,通过与GPT助手对话,GPT就可以自行读取日程、添加日程,并设立开会共享的通知。
一位科技公司内部人士向记者表示,当前AI大模型公司想要商业化,发展用户做增长是必然,但一般的AI工具门槛很高,更针对特定的程序员群体,普通人想要“拿来就用”不容易,而智能体则类似一个能帮你干活的助理。
在2024WAIC上,百度创始人、董事长兼首席执行官李彦宏就公开表示:“智能体是我们最看好的AI应用发展方向。”在他看来,要避免掉入“超级应用陷阱”,“超级能干”的应用比只看DAU(日活用户数)的“超级应用”更重要。
同日,蚂蚁集团董事长兼CEO井贤栋也在2024WAIC演讲时提出了“专业智能体”概念。“从我们的实践来看,专业智能体能够破解通用大模型在严谨产业应用的关键难题。”他也披露,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。
腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声则在上述大会期间表示,大模型的研发和应用必须关注、解决具体业务场景,必须关注可用性和性价比。智能体的本质回归了大语言模型的初衷,提供了端对端的解决方法。
在2024WAIC展会现场,记者也近距离体验了大模型加持下走向智能体阶段的AI应用。
商汤科技在WAIC期间发布了国内首个所见即所得模型“日日新5o”。
商汤科技方面向记者透露,该模型交互体验对标GPT-4o,可以实现全新AI交互模式——能听会看更会找话题,可以像真人聊天一样交流对话。据了解,这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。
记者在现场看到,工作人员和“日日新5o”打个招呼,它即可以自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场是世界人工智能大会会场,并表示在这个地方可以“好好学习”。
蚂蚁集团则在此次WAIC期间一连对外展示了三个“AI管家”,分别对应金融、医疗和生活场景。在这些场景下,智能体为用户提供的都是专业服务——不是简单的聊天式对话,而是要在对话交互之后配合理财分析、辅助诊疗、消费预订等一系列服务。
在现场,记者向蚂蚁AI金融助理提出“帮我推荐适合中产家庭的资产配置方案”,它即刻给出了“灵活取用、投资增值、风险管理、宏观经济和政策环境、持续关注市场动态”几大基本资产配置建议,并且推荐了“三笔钱”服务。据了解,该AI金融助理目前已经服务了4300万名用户,问题解决率能达到95%。
在“腾讯元器”展区,基于优图实验室自研算法打造的有智能、有形象、可交互的“数智分身”引发关注,此外参会嘉宾可以通过添加提示词、插件、知识库等自由创建智能体,也可以在智能体商店选择、使用智能体,以满足不同场景下的需求。
发展前提是生态与专业
据不完全统计,在国内大模型厂商中,今年以来,已经有百度基于文心大模型打造的AgentBuilder(文心智能体平台),腾讯基于混元大模型的智能体产品腾讯元器、字节跳动基于豆包大模型打造的智能开发工具豆包MarsCode、蚂蚁基于百灵大模型推出的AI生活助手……“百模大战”已经来到了智能体对决阶段。
百度前首席科学家、现Landing AI创始人兼CEO吴恩达在上半年一个公开场合就展示了在视觉智能体方面的最新进展,他认为,今年AI能做的事情将大幅扩展,这得益于智能体工作流,他也呼吁开发者们关注和参与AI智能体技术的发展。
不过智能体的发展仍受到一些条件制约。前述科技公司内部人士就表示,独立创业型大模型公司在做智能体时有一定困扰,但这对面向C端的平台公司不构成太大问题。平台本身就拥有丰富场景和生态,把智能体嵌入生态时就水到渠成,考验的更多是平台公司内部多业务线如何打通和协同。
对此,何征宇向记者表示,大模型可以理解为一个数据处理软件——把大模型当作软件加上行业数据,变成供消费者可以选择的服务。当用这项技术去帮助企业时,他们可以组装成基于大模型的AI服务甚至变成专业的智能体。蚂蚁本身就有成熟商业机制和商业闭环,智能体可以复用。
而李彦宏在前述演讲时也认为,在医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。
值得注意的是,在走向垂类领域时,尤为考验大模型的专业能力。
蚂蚁集团大模型应用部总经理顾进杰向记者透露,场景生活、医疗、金融背后都有一个共性——“严谨行业的AI应用”。以医疗行业为例,医疗行业的大量知识并没有在互联网上呈现,缺乏领域知识是在这些严谨行业面临的重要问题。此外,这些医疗专家的思维模式都没有形成一个文档或者数字化,因此今天的大模型往往很难做专业领域决策。
针对这些问题,蚂蚁集团尝试通过强化大模型专业认知,据了解,基于蚂蚁百灵大模型开发的支付宝医疗大模型,添加了包含报告、影像、药品等百亿级中英文图文、千亿级医疗文本语料及千万级医疗知识图谱。目前该医疗大模型能提供智能问答、病历结构化和检索、辅助诊断、识别解读药品等。
在顾进杰看来,在移动互联网时代,APP小程序是载体,未来希望能用专业智能体的方式重构今天的服务载体。
(编辑:何莎莎 审核:朱紫云 校对:颜京宁)