智见丨火山引擎总裁谭待:大模型不会一家独大,未来将是“多云多模型”时代
出品|本站科技《智见访谈》
作者|赵芙瑶
编辑|丁广胜
如今,众多企业正加速云计算的应用,尤其是大型行业,从创新业务向云迁移逐渐发展到核心系统上云。云原生已经成为共识,所有与数据、资源和云相关的技术都建立在云原生基础上,已是大势所趋。随着云计算的技术变革在数字世界的价值凸显,云原生也已成为数字化转型的新技术方向。
云原生概念的提出者Matt Stine在2017年将云原生归纳为六大特性:模块化、可观察、可部署、可测试、可替换和可处理。云原生中的“云”意味着应用存在于云中,而非传统的本地部署。“原生”代表应用从设计阶段就考虑云环境因素,专为云设计并在云上运行。
火山引擎瞄准了云市场的巨大潜力,它从字节跳动的内部技术中台演化而来,目前其作为字节跳动的独立BU(Business Unit,业务单元),希望通过云和云原生技术,以及来自抖音的技术优势,帮助企业实现敏捷迭代,数据驱动和体验创新,更好地利用数字化技术实现业务增长。
数字经济时代,企业面临着降本增效、精细化运营、混合办公等诸多现实需求。火山引擎如何助力企业降本增效?字节跳动以内容业务为主,火山引擎如何用算法赋能内容创作?云计算厂商群雄割据的红海之下,火山引擎是否有信心成为“第四朵云”?带着这些疑问,本站科技智见对火山引擎总裁谭待进行了专访。
混合部署与弹性业务并行 数据驱动助力降本增效
“降本增效”近年来一直被企业反复提及,那么具体应该如何降本增效?谭待指出,火山引擎通过混合部署和弹性服务来提高企业在线业务(如网站、应用等)和一线业务(如门店、生产线等)的资源利用率和运行效率,降低成本,应对高峰时期的挑战。
具体而言,火山引擎还会提供函数计算等应用和弹性实例等服务,函数计算是一种无服务器计算服务,允许用户在无需管理服务器的情况下运行代码。弹性实例是一种可以根据业务需求自动扩展或缩小的计算资源。这些服务都可以帮助客户更简单的上手,更好的利用云计算资源。
谭待举例称:“客户在对业务进行改造时,一些不需要24小时运转的业务负载可以通过弹性方案进行调整,弹性方案允许客户根据业务需求动态调整资源使用,从而降低不必要的成本。”例如,在业务需求较低的时候,可以减少资源使用;在需求高峰时,可以迅速扩展资源以应对。在高峰时期,也可以通过弹性服务应对,弹性服务可以帮助企业在面临突然的业务高峰时迅速扩展计算、存储和网络资源,确保业务的稳定运行。
“我们致力于帮助客户降本,但更重要的是提高效率以获得更多收入和用户。要做好这个事情,数据非常重要,我们提倡体验创新、数据驱动和敏捷迭代。通过数据驱动做决策,敏捷迭代以快速实现好的方法。数据驱动是关键,需要从底层数据仓库到数据应用层面去实现。”谭待强调了降本增效目标的实现、数据的核心作用,以及提倡的理念。
谭待还提到,以数据驱动为基础,火山引擎可以在营销、内容、个性化体验等领域应用。例如,在营销领域,通过CDP客户数据中台和联邦学习(隐私计算核心技术)等技术提升客户私域运营和广告投放效率;在内容领域,通过算法和AI平台帮助创作更优质内容;在内部运营方面,通过数据平台优化供应链和库存管理。
“不同行业有不同的应用场景,如汽车行业需提供沉浸式、娱乐化的体验;零售行业需实现公域与私域互动,通过直播电商和工具进行画像分析和话术诊断;游戏行业需优化投放和风控等方面。”谭待总结称,降低成本重要,但提高效率和实现个性化体验更为关键。
与大模型厂商合作 发力内容领域垂直运用
字节跳动在内容板块已经处于头部位置,而火山引擎对于内容制作和云支撑的影响也非常大。
在谭待看来,内容的丰富度、沉浸度,真实度是吸引观众的关键,清晰度也不可忽视。想提升沉浸度,就得设法与用户进行交互。火山引擎用AI的方式做出窄带高清,对视频进行针对性的优化,这样既能够提升视频制作效率,又能够去降低带宽。
直播层面,也可以帮助直播间做到一秒之内的延迟,并且通过基于大数据的画质评测算法进行端到端的检测和优化。“去年卡塔尔世界杯直播是一个很好的例子,大家都说在抖音追世界杯又快又流畅。在此过程中,我们进行了许多优化,如延迟优化、画质提升以及互动体验的完善,包括弹幕和交互等。”谭待说道。
在抖音追世界杯具体是如何做到又快又流畅的?具体而言,视频的解码要运用边缘计算。“我们是构建了一套1~40毫秒的边缘计算,而不是笼统的几毫秒、几十毫秒、甚至几百毫秒。我们从整个技术架构上把边缘构建的非常好,这样能够首先在地理位置上保证这件视频的顺畅播放。播放、解码、互动都将放到边缘。”谭待解释称。
基础设施包括视频承接和计算,编解码技术非常关键,与带宽有密切关系。有时,优化过度可能导致带宽问题和延迟。那应该如何解决呢?谭待道出了火山引擎的“制胜法宝”:“因此我们在这方面做了很多折中。我们采用了编解码应用和窄带高清应用,起到了重要作用。有很多细节需要注意,我们有大量数据作为基础,知道如何优化。通过算法进行局部调整,使画面感知更高清。”
谭待指出,未来大模型也会像云市场的多云趋势一样,呈现多模型的趋势。火山引擎要服务好那些立志做好大模型的公司,为其提供基础算力支持和技术平台。“如何在工程上帮它们优化,提高效率,稳定性,都是我们关注的重点。像自动驾驶领域,也在往大模型转变,很多自动驾驶客户也转到了我们这边,我们要在云和平台上支持他们,帮助他们取得成功。目前客户数量也在不断增长。”
他举例表示火山引擎可以提高大模型公司的效率:“像智谱和MiniMax这样的公司都是我们的客户。我们主要在基础算力和技术平台两方面为他们提供支持。大模型训练时间长,消耗大,我们要在工程上帮它们优化,提高效率,包括算力、网络的优化和稳定性提升。由于我们内外统一的平台,在工程能力上做得很好,能大幅提升客户的效率。”
事实上,火山引擎通过内外统一的方式,能复用很多已有的东西,效率可能更高。在软硬件层面,谭待表示火山引擎会投入资源提升竞争力。“另外,我们要把数据搞好,提供A/B测试等,让企业里的每个员工都能更好地利用数据,这需要强大的技术平台支持。”
谭待还表达了火山引擎将致力于发展云服务的决心。“这个行业本身是非常好的生意,但需要坚持。我们要做好云、公有云,通过技术实现降本增效。我们要明确自己的定位和发展方向,维持合理的毛利水平。”谭待说道。
“三朵云”之外的云厂商仍有机会 “多云”避免企业被绑定
Gartner发布的2021年全球云计算IaaS市场数据份额数据则显示,2021年排名前五的云计算IaaS厂商分别是亚马逊、微软、阿里云、谷歌云和华为云。中国企业阿里云全球市场份额第三,市场份额达到9.55%;华为云位居第五,市场份额4.61%。
根据中商产业研究院的数据,2022年中国大陆前四大云计算厂商分别为阿里云、华为云、腾讯云和百度智能云。阿里云在2022年仍然排在第一位,占据36%的份额,华为云以19%的市场份额排名第二;腾讯云排名第三,市场份额为16%。百度智能云则在2022年占据了中国云计算市场的9%。也就是说,这四家云厂商已经占据了80%左右的市场份额,那么留给其他云厂商的机会还有多少呢?
对于此问题,谭待有着不同的见解。在他看来,云市场的确很大,因为越来越多的场景会通过数字化来实现,而云则是数字化的基础。全球云市场在未来几年可能会超过广告市场,虽然中国会慢一些,但仍是一个万亿或数万亿的大市场。现在中国的云市场规模只有几千亿,未来的增量空间还有十倍左右。“云市场一定会是多云的趋势,现在大家平均用4~5朵云,多云有利于客户避免被绑定,可以有更好的价格选择,并能利用不同厂商的优势。”也就是说,多云策略有助于客户实现更高效的资源配置和业务运营。
于此同时,谭待还指出了火山引擎的现有战略,并认为稳扎稳打才是长久之计。“规模实际上就是市场份额,我们希望保持稳定的增长。云市场的增长可能相对较慢,我们需要做好服务,客户迁移也需要时间。我们当前最重要的是给我们定下一个大目标,稳扎稳打,与有潜力的行业企业建立持续合作。这些企业可能规模不一,有大有小,但都具有成长性。”
最终,谭待满怀信心地展望火山引擎的未来前景:“云市场规模大且多云,所以实际上空间的问题并不是问题。关键是要有规模,这样才能在降本、增效和产品创新上有优势。火山引擎深信云市场潜力,我们的目标是成为头部云厂商之一。我们整合内外部资源,借力抖音规模,形成规模优势,确保长期竞争力。”