马斯克全自动驾驶野心背后的芯片战:数据和算力芯片国内全面落后 只能寄望华为?
(文章来源:芯辰大海)
2024年10月11日,特斯拉首席执行官马斯克搭乘着没有方向盘和踏板的无人驾驶出租车Cybercab上了热搜,也拉开了特斯拉“We, Robot(我们,机器人)”活动的序幕。
没有方向盘和踏板,马斯克的“野心”已经昭然若揭。随后的发布会也证实了大家的猜想,马斯克表示将在2026年推出全自动驾驶系统无人驾驶出租车Cybercab。而其背后的核心——完全体“FSD(全自动驾驶)”系统,将在2025年推出。
也就是说,明年特斯拉就会推出完全不依赖人工干预和高精地图的完全自动驾驶功能。目前特斯拉自动驾驶系统FSD系统最新版本是V12版本,在体验特斯拉的FSD V12后,小鹏汽车董事长何小鹏表示,“很多路况处理的很丝滑……相信2025会是完全体自动驾驶的Chat GPT时刻。”
那么特斯拉的FSD为何能有如此优异的表现?这里就不得不提两种芯片了:算力芯片和自动驾驶芯片。这两种芯片在特斯拉FSD的形成过程中发挥了关键作用——用算力芯片训练出一套完全不依赖人工介入的自动驾驶系统,用自动驾驶芯片运行这套系统。
根据现有公开资料显示,国产在算力方面与特斯拉差距很大,自动驾驶芯片无代差。
FSD是怎样炼成的:数据和AI算力芯片是关键
华为奋力追赶
特斯拉FSD虽好,但它也不是一天炼成的。和所有的人工智能系统一样,需要大量的原始数据,以及足够的算力对数据进行训练,最终形成一套无人驾驶系统。
所以,特斯拉有信心能够率先实现完全自动驾驶,与其在数据和算力方面的积累是分不开的。别看它们只是基础,但却是我国自动驾驶企业和特斯拉差距最大的地方。因为只要拥足够的数据和算力,就可以通过不断的改进,优化算法,但如果数据和算力不足,那就是巧妇难为无米之炊。
数据方面,特斯拉可谓是遥遥领先。2024年4月,特斯拉宣布全自动驾驶里程已突破10亿英里(约合16亿公里),目前已经超过20亿英里。
作为对比,国内自动驾驶领域的头部玩家之一的华为正在加速追赶。截至2024年5月,华为的智驾总里程为2.2亿公里。截至2024年8月的自动驾驶总里程已经达到4.6亿公里。10月15日,已经追赶到7.36亿公里。
那么,要实现完全自动驾驶需要多少数据呢?在《总体规划 Part Deux》中,马斯克预计,自动驾驶系统要获得全球监管机构的批准,可能需要行驶 60 亿英里左右。
积累到数据后,接下来就是对数据进行训练,这就有赖于算力了。特斯拉10月份已经达到了100EFLOPS(FLOPS是每秒浮点运算次数,E FLOPS中的E是“Exa”,代表10的18次方。)的算力规模,约30万张A100的水平。
国内相关企业的算力如何呢?今年 4 月,华为宣布,到 6 月训练算力将达到 3.5 EFLOPS。今年7月,余承东在智界r7发布会透露,华为车BU储备算力达到7.5E。另有消息称,理想智驾训练算力为5.39E,小鹏大约为2.5E。
需要特别指出的是,较之国内企业,特斯拉不仅能够购买英伟达旗下最先进的GPU,还有自己的自动驾驶训练芯片D1。D1芯片采用台积电7nm工艺。每25个D1芯片构成一个训练模组(tiles),每6个训练模组构成一层托盘(Tray),两层托盘构成一个机柜(Cabinets),10个机柜构成训练集群Dojo ExaPOD,整个训练集群提供1.1 E Flops的算力。
但目前除了华为,国内其他自动驾驶企业在增加算力方面,都需要克服一定困难。
目前,业内广泛采用英伟达GPU芯片进行AI训练。但首先,英伟达的算力芯片供不应求,据摩根士丹利最新透露的消息,NVIDIA未来一年内Blackwell的订单已被全部预订。其次是,由于美国限制了先进算力芯片的出口,目前国内企业只能买到性能不及A100、H100的H20芯片。
不过,华为有自己的算力芯片,目前华为的旗舰产品是昇腾910 Pro B,AI 算力为280 T FLOPS(FP16)。不过华为的产品较行业领先的英伟达尚有一定差距,英伟达旗舰产品A100 的FP16算力可达 312 T FLOPS,并且英伟达在软件生态方面也拥有优势。
自动驾驶芯片: 百花齐放 比肩国际先进水平
先进的自动驾驶系统是实现完全自动驾驶的一个方面,另一个方面是,汽车需要搭载一颗性能强劲的自动驾驶芯片,以运行自动驾驶系统。
值得欣慰的是,在这一领域,至少在自动驾驶芯片的算力方面,国内汽车产业与特斯拉并没有本质差距。
还是从特斯拉说起,特斯拉硬件平台(Hardware Platform,简称HW)指的是特斯拉在电动汽车中用于自动驾驶功能的计算和传感器系统,目前特斯拉最新产品是今年推出的HW4.0,总算力为720TOPS,搭载了第二代FSD自动驾驶芯片,但该芯片具体参数未知。所以还是以第一代FSD 芯片为参考,单颗 FSD 芯片的最大算力为 72 TOPs。
国内自动驾驶解决方案方面,目前大致可以分为三个阵营:自研汽车自动驾驶芯片的汽车厂商、研发自动驾驶芯片的第三方平台、集成自动驾驶芯片的第三方平台。
自研汽车自动驾驶芯片和解决方案的汽车厂商,以蔚来、小鹏、理想为代表,另外有消息称,比亚迪、吉利也都在朝着软硬一体的方向努力,开始自研自动驾驶芯片和自动驾驶解决方案。
蔚来:今年7月,蔚来宣布其5nm神玑NX9031自动驾驶芯片成功流片,包含超过500亿个晶体管,单个芯片可实现四款行业领先芯片的性能,提供高性能计算支持。
小鹏:何小鹏在发布会上提到,1 颗图灵芯片相当于 3 颗小鹏汽车当前使用的芯片的性能。
理想:据业内消息人士透露,理想汽车的智能驾驶SoC芯片名为“Shu Ma Ke”,公司已投入大量资源优化芯片架构,并在Chiplet和RISC-V技术方面进行深入研究。
值得注意的是,目前蔚来、小鹏都没有透露公司自动驾驶芯片的具体性能,但蔚来表示“单个芯片可实现四款行业领先芯片的性能”,小鹏表示“1 颗图灵芯片相当于 3 颗小鹏汽车当前使用的芯片的性能”。
目前,行业算力领先、使用广泛的的芯片是英伟达的OrinX(英伟达仅出售自动驾驶芯片,不出售自动驾驶解决方案),最大可以提供254TOPs 的算力。不过英伟达也没有停滞不前,Drive Thor是英伟达的下一代车载芯片,根据规划,这颗芯片单颗芯片算力达到2000 TOPS水平。
研发自动驾驶芯片的第三方平台,代表企业有华为、地平线等,不过不管是华为还是地平线,都不单独售卖自动驾驶芯片,对外出售的是自动驾驶解决方案。
华为:目前华为最先进的自动驾驶平台是是华为在2020年10月底发布MDC810,算力为400TOPS。
地平线:地平线官网显示,目前公司算力最大的产品是征程6P,算力为560TOPS。
最后一类则是集成自动驾驶芯片的第三方平台,比较知名的有在A股上市的德赛西威等。德赛西威联手芯片厂商、算法厂商共同开发软件平台。比如搭载在小鹏P7上的德赛西威自动驾驶域控制器,搭载的是英伟达的的自动驾驶芯片。
由于英伟达 Xavier 自动驾驶芯片首度量产时,德赛西威是其挑选的唯一一家中国授权合作方。所以此后一段时间,中国相关企业想用英伟达的芯片做智驾,普遍会与德赛西威进行合作。
需要指出的是,汽车厂商在与集成自动驾驶芯片的第三方平台进行合作时,有可能出现磨合问题,比如底层操作系统与芯片的配合问题,这时候可能需要请国外工程师到现场解决问题。