智谱AI狂奔!视频通话功能“首秀”,国产大模型解锁新能力|聚焦服贸会
本报(chinatimes.net.cn)记者石飞月 北京报道
“你知道什么是互余角吗?”“不知道。”“互余角是指两个角的和为90度。”9月13日,记者来到2024年中国国际服务贸易交易会(下称“服贸会”)现场,在智谱AI展区看到一个孩子与智谱清言(智谱AI旗下大模型)进行视频通话的这一幕。
作为国内“大模型五虎” 之一,智谱AI今年动作频频,7月其AI生成视频模型清影(Ying)正式上线,近日又推出升级版基座大模型GLM-4-Plus,类GPT-4o的视频通话功能面向所有用户全面放开。
如此快节奏地行进,与智谱AI的强融资能力相辅相成。近日,该公司以“投前200亿元估值”完成新一轮融资,成为大模型创业潮中估值最高的企业之一。而在不久前,也就是今年6月和7月,智谱AI也曾被曝出融资传闻。
首次开放视频通话功能
今年参加服贸会的人工智能企业不多,而智谱AI又带着最新的产品和功能出现,自然受到不少关注。智谱AI展示了多款最新产品,包括旗下智谱清言App近期推出的“视频通话”功能、清影AI生成视频功能,以及大模型开放平台bigmodel.cn等。
智谱AI的 “视频通话”功能,是国内大模型首次开放视频通话功能,也是全球首个面向大众用户开放的视频通话功能,限时免费。
智谱清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与其交流,智谱清言不仅能“看”到用户画面,还能听懂指令并准确执行,即使用户频繁打断,智谱清言也能迅速反应。
记者在现场看到,在智谱AI的演示视频中,一个小孩打开智谱清言视频通话后,将摄像头对准自己正在做的数学题,大模型便开始讲解这道题,中间小孩多次提问,该产品也能应答。
除了满足解题需要,据官方介绍,智谱清言视频通话功能还能即时翻译中英文,根据用户所处的环境信息进行英语对话,并且协助纠正用户的语音和语法错误;成为旅游时随时讲解景点故事的导游;为视障人士提供识别环境的帮助;提供面试指导、会议中完成纪要和总结、分析复杂的数据图表、实时解读电脑屏幕的代码。
“智谱清言视频通话可实现的功能与GPT-4o差不多,但GPT-4o这个能力是闭源的,没有开源任何代码,我们是除OpenAI外头一个研发出来这个功能的厂商,走的是国产、自研、可控的路。”在现场,一位智谱AI的工作人员告诉《华夏时报》记者。
目前,智谱清言视频通话可以实现的场景和可以解决的问题,并不算特别难和深入。这位工作人员表示,如果要解决比较复杂和深入的问题,还需要一定的周期。
深度科技研究院院长张孝荣对《华夏时报》记者表示,大模型视频通话在教育、远程协助、娱乐等多个领域都有潜在的应用价值。“当然,该技术的识别准确度和知识深广度有待进一步提升,能否在商业化落地方面取得成功,还要看实际应用效果。”
国内其他AI公司暂时还未推出类似功能,不过在上个月,字节跳动旗下云服务平台火山引擎宣布,豆包大模型已支持实时语音通话功能。
服贸会期间,智谱AI还展示了视频生成模型CogVideoX以及在智谱清言App上线的“清影”功能。
获新一轮融资估值达200亿元
在几家大模型独角兽中,智谱AI可以算是动作最频繁、技术上新最快的一家企业,这一方面与该公司自己的研发能力有关,另一方面,也得益于其强大的融资能力。
近日,据中关村科学城公司发布的消息,该公司以投前200亿元的估值,领投智谱华章新一轮融资,用于支持智谱华章国产基座大模型的技术创新与生态发展。
今年以来,智谱AI已经公布或被曝出多次融资消息。3月,智谱AI方面向记者确认,该公司于今年年初完成新一轮融资,北京市人工智能产业投资基金参与融资;6月,该公司被曝获4亿美元融资,投资方为中东石油巨头沙特阿美旗下风险投资部门管理的基金Prosperity7;7月,华策影视发布公告称,全资子公司华策投资拟以自有资金出资1亿元,与海南智桥私募基金管理合伙企业(有限合伙)共同设立盐城智华创业投资基金合伙企业(有限合伙),盐城智华将直接或间接投资于智谱AI股权。
频繁的融资,也让智谱AI估值屡创新高。目前,在国内这一波大模型独角兽中,智谱AI和月之暗面的估值是最高的,百川智能也蓄势待发。8月,月之暗面被曝完成了超3亿美元的新一轮融资,这轮融资将这家公司的估值推到了33亿美元的高位。此外,百川智能方面曾在7月向记者透露,该公司已经完成了A轮融资,总融资金额达50亿元,并且将以200亿元估值开启B轮融资。
“这是一个正向反馈的过程。”在文渊智库创始人王超看来,智谱AI在中国这几家独角兽里面做的是比较好的,用更多的钱买更多的芯片,雇更多的人,拿更多的数据,做出更好的AI产品,用户的体验感也会提升,如果融资不到位,在硬件上就不占优势,更不可能在数据和人力上占优势。
当然,无论是融资还是技术的更新,最终还是要实现商业化落地。《华夏时报》记者就今年的商业化落地情况采访了智谱AI方面,截至发稿未收到回复。
今年3月,智谱AI曾公布一份ChatGLM发布一周年之际的商业化成绩单:收获超2000家生态合作伙伴,实现超1000个大模型规模化应用,与超200家企业进行深度共创,多个领域的头部公司,涵盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景,均已成为智谱AI的代表客户。
而智谱AI上线的文生视频模型,或将应用于影视行业。今年7月,华策影视曾发公告称,该公司与智谱AI签约战略合作,联合开发影视内容生成智能体以及影视内容审查垂直模型,联合打造国内影视领域AI领军研究平台,共同推动双方联合推出的文生视频标准成为行业应用的标准。
值得一提的是,除了智谱AI,在服贸会现场,记者看到,参会的人工智能公司并不多,还有一家是科大讯飞,而科大讯飞今年的侧重点在教育领域。来自其它行业的企业,倒是或多或少沾上了人工智能的概念。
人工智能落地的另一个场景—具身智能,也在今年的服贸会上有所体现,北京具身智能机器人创新中心、优必选、宇树科技等企业也带着旗下的机器人来到了这次展会。
北京具身智能机器人创新中心的工作人员现场为记者演示了“天工1.0 LITE”,这款人形机器人举着右手向人群打招呼,可原地转圈,也可绕大圈走路,还会摆动手臂跳舞。“天工1.0 LITE” 是全国首个通用机器人母平台,实现了全球首例纯电驱全尺寸人形机器人的拟人奔跑。
责任编辑:黄兴利 主编:寒丰