天数智芯CTO吕坚平:通用GPU之路怎么走?

集微网报道 在9月1日举行的2022世界人工智能大会芯片主题论坛上,天数智芯CTO吕坚平博士发表题为《创新通用GPU,深耕应用与生态,开启算力新时代》的主题演讲。吕坚平博士表示,未来通用GPU必须要走的路线,一定是图形、AI跟通用计算达到融合。天数智芯也将以量产的天垓100为坚实基础,凭借量产成功的经验,支持云原生渲染,最终达成元宇宙/数字孪生。

在吕坚平看来,GPU事实上正在引领进入万物皆可算的时代。

无所不在的AI利用GPU,在任何行业任何应用,只要有大数据,AI都可以发挥作用。图形渲染也是GPU的应有之义,引领元宇宙以及数字孪生,带来逼真虚拟世界,可以影响甚至改进现实世界。而在科学计算方面,也能够借由GPU能够解开大自然的奥秘,借由万亿级别的原子及分子的模拟,开发新药,发现新材料,做更精准的气象预测,以及海洋资源勘探。

为什么万物皆可由GPU来算?吕坚平表示,简单而言无论是AI推理,渲染还是科学计算,事实上最后都是大量并行的乘加计算为主,而GPU凭借自身成千上万级的单子粒多线程的计算单元,能够快速实现。

吕坚平指出,通用GPU包含两个意义:一是在图形之外运用GPU的方式,二是不具备图形硬件的GPU(通用GPU加入图形加速功能之后,即成为GPU)。而GPU又包含“三重人格”:图形、AI和通用计算。其中,图形的趋势是持续走向通用,通用计算在追赶图形的效率,AI则是推动通用计算的最大动力。

吕坚平表示,通用GPU是目前架构赢家。AI算法创新等同于软件进步,没有适当配置的通用算力将穷于应付层出不穷的崭新算法,通用GPU是唯一被广泛采用开发新AI算法的软硬件平台,因此,下一个AI架构赢家必定坚持通用。

在吕坚平看来,AI训练芯片必定为通用,目前非通用GPU的AI训练芯片无法满足研发前沿AI算法的需求,无法顺利跑通AI学术大会最新出炉的NN模型甚至基准测试,非通用GPU的AI训练芯片落地出现困境。

此外,AI推理芯片也需要通用。后摩尔时代,制作芯片耗时,耗资金,风险高,而为特定AI算法优化的专用推理芯片无法服务各行各业的细分领域,不适用于算法多元的复杂场景(安防、自动驾驶),无法支持非AI算法。

吕坚平认为,基于行业发展的趋势,因为芯片设计的困难,还存在种种问题,如功耗、摩尔定律的限制等,相信未来通用GPU必须要走的路线,一定是图形、AI跟通用计算达到融合。天数智芯也将以量产的天垓100为坚实基础,量产成功的经验,支持云原生渲染,最终达成元宇宙/数字孪生。

对此,天数智芯构建了完整的产品路线图,在天垓100的基础上,在规模集群,通用架构、AI应用以及AI渲染方面已经达到可以产品化的程度,天垓200是基于天垓100的技术,继续强大通用的算力,同时加上软件的渲染,天垓200也是为天垓300铺路,最终会加入硬件渲染。

据吕坚平介绍,天数智芯是国内唯一量产的通用GPU厂商,过去一年,是天垓100丰收的一年,累计触达用户超过300家,意向签约客户超过200家,业务覆盖行业超过20个,累计订单额度超2亿元。

“天数智芯会基于既有的产品路线规划,希望能够创新通用GPU,深耕应用与生态,开启算力新时代。”吕坚平说。

(校对/张轶群)