揭秘理想汽车“端到端”背后的商业「迷局」

“整改”半年后,理想在智驾的舞台上正在试着找回自己的主角光环。

7月5日,就在理想汽车 2024 智驾夏季发布会上,理想汽车用了「上下半场」的直播完成了对现有智驾的全面升级,并开启由端到端模型、VLM视觉语言模型和世界模型的共同构建,一项所谓「启动端到端+视觉语言模型」的早鸟计划,

早鸟,顾名思义「早起的鸟儿有虫吃。」

或许这个美好预期,让理想成了目前国内首个公开「端到端」技术方案的汽车企业。即便“理想在借鉴特斯拉”这种显得有说服力的理论是外界普遍信服理想的技术方案会成为反超对手的原因。可人们还是忽略了2个月前还在对智驾团队“动刀”的理想,究竟为什么会在短时间内快速拿出规划这样的基本常识。

因此,在相比于上半场的务实,关注者更希望通过务虚的“下半场”来识别:理想重金买下的端到端期货,到底受益几何?

这一切,都与理想汽车在有关技术切换的空隙说起。

文|锅斯傅

编辑|李佳琪

图片来源|视觉中国

1

从“慢”到“快”的理想「端到端」

结合这场「目的性极强」的发布会来看,不难看出理想将发布内容围绕“应用”与“愿景”两个基本环节作为基本分层来做的上下半场阐述:上半场介绍新方案融合视觉语言模型、世界模型,帮智驾解决复杂的城市道路挑战;下半场则针对端到端的方案涉及的测试、验证等问题。

只是很多人却没关注到,上半场的逻辑或许恰恰与理想智驾团队自去年将智驾分成「算法研发」+「量产研发」两个职能团队的组织架构调整有一定关系。

事实上,就在今年2月和4月,华为、小鹏分别上线了乾崑ADS3.0和AI天玑,而这两套系统都是行业内目前,典型的分段式端到端大模型的代表。不同的是,当时双方在具体架构的细节上都没有做“太明确”的阐述。

反倒是在发布节点比华为、小鹏“慢”了半拍的理想,在端到端的技术路线上比华为、小鹏的分段式端到端都更激进。

从技术架构看,华为提出的端到端有感知大网和预决策规划大网;小鹏分为神经网络感知 XNet、规控大模型 XPlanner+ 大语言模型 XBrain 三段端到端方案。而理想的“One Model”设想,则提出“输入传感器信息,输出行驶轨迹”让自动驾驶能接近人的行为能力的一种端到端结构”。

按照理想的设想,这套端到端模型在信息传递、推理计算、模型迭代都更有优势,能具备更强大的通用障碍物理解能力、超视距导航能力、道路结构理解,以及更拟人的路径规划能力。

然而从技术特点上看,眼下端到端的自动驾驶技术行业基本还处在相近的竞争维度。真正实现量变需要数据量足够多、工程化团队能力强以及大算力作为「三个必要条件」且达到一定数量的基础上。而在这三点中,理想已经在深度布局且快速解决的一个问题正是「算力」。据了解,理想在年初还落友商的算力问题再经历2季度的储备后,理想的智算中心算力水平达1200 PFLOPS。截止到今年6月底,理想储备的算力超过小鹏接近2倍。

超算背后则是巨大的资金投入,一位不具名的专家介绍“理想在将赚到利润的现金都用于购买算力,因此在第二季度理想的应收账款的天数很有可能是“0”,尽管这一数字与特斯拉Dojo智算中心的100000 PFLOPS相比,还明显差距,但重金押宝“算力”,才让理想有了能超过小鹏位列国内公司进入「头部算力」品牌的阵营。

算力的提升阶段性确保理想系统2也就是区别其他路线最大不同之处呈现出特点,据了解。VLM 视觉语言模型的算法架构是由一个统一的 Transformer 模型组成,而目前理想的 VLM 模型参数量目前达到 22 亿,VLM 模型在车端的推理时间也已经从 4.1 秒优化至 0.3秒。

2

「一场有“目的”的智驾发布会」

如果只是为了阐述清楚理想围绕端到端的这套技术路线,理想远没有必要在当下这个节点去召开一次发布会,通过一些详实的技术解读足以让少数人了解智驾团队的整体思考。

这场看似受众较窄的技术解析会也暴露出理想在实际运营过程的几个诉求。

根据规划,理想的端到端自动驾驶技术已经完成模型的原型验证和实车的部署,3季度可向测试用户推送基于300万clips训练出的端到端+VLM自动驾驶体系。最早在今年年底,最晚在明年上半年,真正有监督的 L3 自动驾驶也可以批量向用户交付。

为了实现这一时间表,还有两件事需要做:一件事是当前端到端模型学了100多万公里的数据,到年底可能要超过500公里;另一件事则是模型训练,端到端模型的目的是学习形式轨迹,所以在训练时通过在训练过程中会加入强化学习,让模型知道什么事错的。而这些事情如果想要按照预期完成,就需要关键性人才的参与包括云端模型工程师、算法专家类等人才。

但国内真正能满足这块能力要求的人确凤毛麟角。据了解,理想对自动驾驶人才的要求非常之高,比如AI算法专家,不仅需要具备将最新自动驾驶技术的科技成果应用于项目中的实践经验和能力,还需要在学术方面有顶级会议或期刊发展过相关领域的研究论文。

发布会结束后,很多自动驾驶相关的专业人士和技术爱好者对理想的端对端自动驾驶技术进行激烈讨论,人们纷纷将这场发布会评价为:“可以类比苹果的WWDC与特斯拉 AI Day”,而这无形中为理想圈一波有关端到端的自动驾驶“技术粉”,这让发布会本身更多起到了一场人才招聘的“宣讲会”作用。

通过高薪招聘的方式,作为理想主动筛选符合要求的人才外。以企业技术路线作为宣传点,或许对于技术性人才的筛选起到吸引作用,这种方式无形中为理想扩大行业声量的同时,也间接缩减招聘成本,为企业和团队起到了人才吸附性作用。

此前在组建理想智驾部门时,理想给出过超过50%的薪酬涨幅去从各企业高薪挖来人才,也意味着理想的筛选人才的成本非常之高。根据公开招聘显示,理想一直在关注着高阶的自动驾驶经验的相关人才,包含自动驾驶云端模型工程师、大模型算法专家、AI算法专家等,这些人才几乎都在年薪百万以上。整个的招人和用人成本很高。

端午节假期期间,理想汽车零售门店开启无图NOA试驾,门店智能驾驶NOA的试驾率进一步提升,从之前的20%以上的水平提升至近40%。

3

「理想的下半年:稳住规模向质过渡」

据普华永道发布《2023年数字化汽车报告》显示,中国受访者对L4级自动驾驶汽车持质疑态度的比例仅15%,对于能支持使用自动驾驶功能的车型更容易受到消费者的选择。

因此强化技术传播,影响理想潜在用户介于Pro和Max的选择问题从而优化产品毛利结构,不排除成为理想召开这场发布会另一个不可明说的目的。

结合目前的产品销售结构看,尽管没有公司2季度业务数据,但基本可以确认理想在2季度形成了以L6作为「主销产品」带动L7、L8、L9微增的业务基本面。根据官方发布的信息,L6在上市2个月的时间里单月交付已经突破2万辆,其中作为单一车型的L6占到整体销量的40%以上。

结合这一基本面来看,理想冲击全年80万的总目标虽然压力不小,但对于守住50万销底线,理想现有的产品攻势已经显露出了十足的“侵略性”。

尤其在终端配合品牌对展位调整后,「新带老」的业务特点开始十分鲜明。数据显示,今年5、6月理想L7\8\9的订单量较去年12月提升16%,同期的试驾人效已经较去年同时提升30%。基于理想汽车短期内产品格局看,这样的情况大概率是可以在下半年得以延续的。

不过L6的上量,除了策略影响,背后逃不开理想刻意“拉低”产品价格的因素。据了解,官方曾提及L6上市价格较此前立项配置上降低的2万元并不是通过减配实现。因此有不少行业人士猜测,理想L6基本坐实品牌现有产品中毛利率最低的车型。

根据今年4月发布的《理想 L6 大定车主调研报告》显示,用户在购车版本方面,Pro 版本因其性价比而广受欢迎,用户选择率最高,占比高达到 73%。Max 版本用户比例仅占 27%。

「老带新」虽然在规模上对理想汽车提供了帮助,但却并不能对理想汽车当前的经营质量得到有效。今年第一季度 理想汽车单车毛利已经下降至为6.6万元,相比去年的同期下降0.74万元,降幅达10%左右。意味前序产品在今年的溢价能力已经处在逐渐减弱状态。

如果单纯靠毛利率更低的L6去拉高规模,显然与李想希望理想汽车未来能通过技术变现的商业目标「渐行渐远」。

如今「两套方案」并行,理想既能确保在产品上更具性价比的L6吸引客户,同时也能引导用户向L9、L8、L7和L6 AD Max用户,已控制住企业单车毛利进一步下降带来的经营风险,更好的与L6作为流量产品与L7、L8、L9完成收割的商业闭环中形成补充关系。

这或许是理想这家企业在整个经营过程所显现的一种经营风格与特点。不一味求量,而是通过智驾技术与方案参与到「质与量」的平衡分配中来,为企业的到阶段性运转快速提供帮助成了这场略显「晦涩」的夏日发布会上线的另一个原因。