速递|智谱携清言视频通话功能亮相 2024 服贸会,开启 AI 新体验

9 月 12 至 16 日,在北京 国家会议中心和首钢园区举办的 2024 年中国国际服务贸易交易会(服贸会) 中, 智谱将 展示多款最新产品,包括 旗下清言 A p p 近期 重磅推出 的 “视频通话”功能 、清影 A I 生成视频功能以及大模型开放平台 big model.cn 等。

清言作为首批上线的 C 端大模型产品,过去一年中以文字和语音形式与用户互动。如今,清言迎来重大升级,解锁了“眼睛”, 这是全球首个面向大众用户开放的视频通话功能,让用户体验到目前最前沿的AI/大模型技术,正式进入视频通话时代。

清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与清言交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行。

即使用户频繁打断,清言也能迅速反应,带来如同真人视频通话的流畅体验。另外可以用右下角小画笔在画面上划重点,清言可以知道你着重让它看的地方是哪。

使用方法也十分简单,只需下载智谱清言APP, 点击右下角的通话按钮,进去之后再切换到视频,就能开启一个全新的世界与小智愉快畅谈。

清言视频通话功能可以成为你生活、学习和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、机器的使用方法、识别场景讲述背景故事。

当大语言模型解锁了“看见”和“说话”的能力,AI 在学习和生活中的应用更广泛了。

首先,清言变身成了一位随身的英语翻译,以及能够随时随地开展情景教学的英语老师。清言不仅能够即时翻译中英文,还能根据用户所处的环境信息进行英语对话,并且协助纠正用户的语音和语法错误。

其次,清言还可以是孩子们的“大眼百科”。孩子们可以用视频拍摄环境,并且让清言解释环境中陌生的物体叫什么、能做什么、英语怎么说等等。此外,清言还可以为孩子们阅读绘本故事、玩你画我猜等游戏,成为孩子们益智启蒙的最佳玩伴。

当然,有了视频通话功能后,清言还可以成为旅游时随时讲解景点故事的导游,也能为视障人士提供识别环境的帮助。还有更多场景和功能,等待大家一同发现。

在工作当中,小智可以提供面试指导、会议中完成纪要和总结、分析复杂的数据图表、实时解读电脑屏幕的代码。

小智还能成为你的学习搭子,为你提供学科作业辅导。

无聊时小智还能是你的知心朋友,与你聊天玩游戏。

见证了视频通话功能的强大之外,智谱近期推出的视频生成模型 CogVideoX 以及在智谱清言 App 上线的“清影”功能也吸引了不少观众驻足打卡。

据了解,清影面向所有用户开放,只需输入文本或上传图片,30 秒内即可生成 6 秒视频。今年 7 月,清影上线清言 App,六天时间用户生成超过 100 万支视频。

实际上最近一段时间以来智谱动作频频,称得上是技术动作最密集的大模型公司:一周前,智谱刚刚在 KDD 上发布了升级版基座大模型 GLM-4-Plus,以及CogView-3-Plus 和 CogVLM 在内的多模态模型,展示智谱对图像、视频等更多模态方面的研究进展,这正是业界公认的大模型的下一步。

同时,类 GPT-4o 的视频通话功能在 C 端产品智谱清言上率先上线。7 月,智谱生视频功能清影 Ying 上线智谱清言,并很快将其背后的生视频模型 CogVideoX 开源。通过大模型链接物理世界亿级用户,智谱致力于为千行百业带来持续创新与变革,加速迈向通用人工智能时代。