相信数字的力量:被 AI 改写的视频生产与消费的故事
在一家电商企业,一个 5 人团队每天可以制作分发 3000-5000 条高质量的个性化视频,快速精准触达潜在客群。这是怎么做到的?
这是一家 AIGC 内容营销平台——筷子科技服务过的真实案例。用 AI 工具生产视频,这事本身可能不稀奇,毕竟 AI 这个噱头已经听麻了。但现实中,企业用 AI 能帮自己干多少活,却颠覆想象。
筷子科技 CEO 陈万锋如是说:
「商业视频的生产跟做采访一样,需要编导的过程。我们解构了大量视频数据,通过对商业视频的分析,喂给多模态大模型,能够训练出一个理解商业视频的,有点像 AI 编导的模型。我们一个产品叫灵感三件套,比如说你看到我的竞争品牌有一个视频挺好的,那它为什么好?你可以上传到 AI 上,它可能几秒钟时间就帮你分析出来,这个视频的每个段落到底在讲什么,里面到底画面是怎么展现的,甚至他是怎么拍的,口播在讲什么,同时也帮你分析说他为什么好、为什么不好。通过这样,你就可以把编导能力赋能给所有的团队。」
近日,在由腾讯云发起的面向科技企业技术决策者群体的高端知识分享与技术探索平台 CTO100 清远站活动现场,我们听到了生动的案例分享。
极客公园:筷子科技作为一家 SaaS 创业公司,如何能拥有这么厉害的 AI 能力?
筷子科技 CEO 陈万锋:那天我跟一个客户去做 demo 的时候,他说你们的平台优化的非常好。因为我们完全是在浏览器里面,比如视频内容的生产,包括剪辑、AI 的生成,线上分发,都集合在一起,其实是非常重底层的一个平台。
通过把我们整个 AIGC 内容工作流搬到腾讯云上面,实现了整个工作流的客户方面的体感的提效达到了 240%。能够优化到这种程度,而且用户其实体感上能够感受到,我们也觉得非常开心。」
极客公园:如何像筷子科技一样快速做好大模型时代的转型呢?
筷子科技 CEO 陈万锋:我们是做视频类型(业务的),那它其实每一次这个调用要用到非常大的这个数据量。我们希望云服务厂商能跟我们一起能够往前去推进更多创新的能力。
跟腾讯云合作,说实话不是一夜之间就决定的,这是一个非常重要的决定。因为引入新的云供应商来做我们主云的架构,客户的体验我们希望是提升很多的。
这个过程中其实考虑了几个点,第一腾讯云已经经过了多年打磨,在很多行业有成功案例,综合能力很强。
第二腾讯云的确在 AI 时代储备了很多的算力资源,能够较长期跟我们探索模型的成长,包括模型的部署的需求。
第三,腾讯有全球化的能力,能够用全球化的云部署把我们这个工具或者应用平台能伸向更多的市场。
如果说筷子科技的 AIGC 转型,切中了 AI 重塑视频生产的脉搏,在另一端,视频的呈现也正在润物无声地变化。
乐播投屏是一家在投屏领域做了十年的公司。随着大家身边带屏幕的设备越来越多,投屏的场景也越来越丰富,家庭、酒店、商旅,办公,车机等等这些地方,几乎都有乐播投屏的存在。就是这个让你熟悉到感觉不到存在的场景——投屏,正在迎来 AI 变革。ChatGPT 用自然语言交互(LUI)的方式惊艳了全世界,GPT-4o 进一步让大家观察到了自然语言对话,唤醒屏幕及其应用的便捷和惊奇。
极客公园:ChatGPT 让我们看到从图形交互界面到自然语言交互的发展趋势,重塑所有软硬件。今年乐播科技的产品有哪些 AI 计划?在这方面会跟腾讯云有哪些合作?
乐播投屏 CTO 谭振林:我们希望以后用户可以在手机上直接通过语音交互形成他的诉求,然后这个诉求经过大模型的处理,就会被理解成计算机要去执行的一些任务。这些任务的结果我们可以让它在大屏端去完成展示。
因为其实大量需要新的交互方式的人,往往是一些使用计算机,使用传统的手机交互不太方便的人,可能是老人、小孩,他可能需要用方言,更自然、更自在。那么腾讯云的语音方案比较有优势,它在方言的知识上相对领先。第二,用户的指令要经过大模型的处理,然后再形成结果,这个过程中也可以和腾讯云做更多的合作。
腾讯云混元大模型采取高效的 MOE 架构,更进一步,乐播投屏可以根据不同的端侧、不同场景灵活选择 lite、standard、pro 等不同版本的大模型,再结合腾讯云大模型知识引擎做进一步开发,形成原生的语音助手。就像电影《Her》中展现的一样,一个越来越像人类的语音助手,不仅可以帮你完成投屏这样的任务,甚至可以沉浸式地跟你聊上一会投屏内容。
极客公园:乐播使用了腾讯云不少产品。对乐播科技业务特性来说,最有用、好用的产品/服务是什么?
乐播投屏 CTO 谭振林:乐播解决的是很多的设备互相连通的问题,所以在产品过程中需要解决大量兼容性的问题,从芯片、从硬件平台、操作系统、各个应用场景去解决设备之间连通的兼容问题和它的效果的这种一致性。
当我们有大量的用户,他们都需要接入到一个有投屏的会议场景中来,能不能够非常清晰地把他的声音,把他的画面传输过来,它有可能是在微信小程序里,也可能是在一个安卓的手机端,我们要能够很好地去糅合到一个流畅的会议过程,这里面其实是有比较多技术要去解决的。
比如说跨网络远端的投屏,就会要用到 RTC 的技术来实现这样的一个效果。大量的用户加入的过程中,我们能够有一个非常稳定的声音的传输和响应,这个其实是有一个 RTC 的技术积累在里面。
极客公园:在 IT 资源降本增效上,腾讯云的服务和产品如何帮助到乐播科技?效果如何?
乐播投屏 CTO 谭振林:除了像 TRTC 这样强大的技术基础,腾讯云也以更优性价比的云产品,帮助乐播在智能化升级的过程中,降低单位成本。我们在前一段时间的合作中完成了我们优化整个供应商结构的目标,同时也实现了将我们的 IT 成本下降超过 20% 的目标。
在和腾讯云的这个合作过程中,我们也使用到了 COS 等这些日志的工具。通过这个日志服务我们能够非常清晰的去跟踪每一个用户,使用我们服务过程中他有没有碰到问题、他有没有成功地完成他的目标,这其实也给了我们产品质量一个非常大的一个帮助。