苹果承认:AI模型使用谷歌定制芯片训练

7月30日消息,美国时间周一,苹果公司表示,其人工智能系统的核心模型在谷歌设计的处理器上完成预训练。这一迹象表明,在训练尖端人工智能方面,大型科技公司正在探索除英伟达GPU以外的其他替代方案。

苹果在最新发表的技术论文中承认,该公司采用了谷歌张量处理单元(TPU)训练其人工智能模型。另外,苹果于周一推出了面向部分用户的苹果智能(Apple Intelligence)预览版。

长期以来,英伟达的高性能GPU在高端人工智能模型训练市场占据主导地位,包括OpenAI、微软、Anthropic在内的多家科技公司纷纷采用其GPU来加速模型训练。但在过去几年里,英伟达GPU始终供不应求,为此谷歌、Meta、甲骨文及特斯拉等企业都在自研芯片,以满足各自人工智能系统与产品开发的需求。

Meta首席执行官马克·扎克伯格(Mark Zuckerberg)和Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)上周均发表见解,暗示他们的公司和业界其他公司在人工智能基础设施上可能存在过度投资的现象,但同时也强调,不如此做则面临极高的商业风险。扎克伯格特别指出,若在这方面落后,将可能在未来10至15年内于关键技术领域失去竞争优势。

在47页技术论文中,苹果公司虽未直接提及谷歌或英伟达,但明确表示其Attentional Factorization Machines(AFM)模型及AFM服务器均是在“云TPU集群”环境下完成训练的,这间接表明苹果采用了云服务商提供的资源来进行计算任务。

论文中,苹果强调:“该系统的应用使我们能够高效且可扩展地训练AFM模型,涵盖从设备端AFM到服务器端AFM,乃至更大规模的模型。”

截至目前,苹果与谷歌的官方代表尚未对置评请求作出回应。

苹果相较于众多同行,较晚揭晓了其人工智能战略蓝图,而在OpenAI于2022年底推出ChatGPT后,其他公司就已经迅速掀起了对生成式人工智能技术的热烈追捧。本周一,苹果正式推出了苹果智能,该系统携带着一系列创新功能亮相,如Siri的全新界面设计、显著提升的自然语言处理能力以及文本域内的人工智能自动摘要功能。

未来一年内,苹果计划推出基于生成式人工智能的更多功能,包括图像与表情的自动生成,以及Siri的强化版,该版本将能利用用户的个性化信息,在各类应用中执行更为复杂和个性化的任务。

在周一发布的技术论文中,苹果透露了其设备上AFM模型训练的具体细节,即该模型是在一个包含2048个最新TPU v5p芯片的独立“切片”上完成的。TPU v5p是当前最先进的张量处理单元,于去年12月首次面世。而AFM服务器的训练则更为庞大,它利用了8192个TPU v4芯片,这些芯片被精心配置为八个切片,通过网络协同工作在数据中心内,共同支撑起服务器的强大计算需求。

据谷歌官方信息,其最新TPU的运行成本每小时不足2美元,但客户需提前三年预订以确保使用。自2015年专为内部工作负载设计的TPU问世以来,谷歌于2017年将其向公众开放,如今,TPU已成为人工智能领域最为成熟和先进的定制芯片之一。

值得注意的是,尽管拥有自主研发的TPU,谷歌仍保持着英伟达顶级客户的地位,同时使用英伟达的GPU与自家TPU训练人工智能系统,并在其云平台上提供英伟达技术的使用权。

苹果此前则表示,推理过程(利用预训练的人工智能模型进行内容生成或预测)将部分在其自有数据中心的芯片上执行。

这是苹果近期发布的第二篇关于其人工智能系统的技术论文,继6月份更广泛概述的版本后,进一步确认了公司在开发过程中采用了TPU。(小小)