CEVA推出边缘设备新款AI推理处理器架构

CEVA,用于更智慧和互连设备讯号处理平台和人工智慧处理器的全球领先授权许可厂商,在比利时布鲁塞尔的AutoSens展会中发表了用于边缘深度神经网路推理的第二代AI处理器架构NeuPro-S。配合NeuPro-S的发表,CEVA今天还推出了CDNN-Invite API,这是业界第一款深度神经网路编译器技术,可在一个可最佳化运行时间韧体统一的神经网路中,支援结合NeuPro-S核心客制化神经网路引擎异质协同处理。

NeuPro-S以及CDNN-Invite API是任何基于视觉且需要边缘人工智慧处理的设备的理想选择,包括自动驾驶车、智慧手机监控摄影机消费用摄影机以及在AR/VR耳机机器人和工业应用中新兴的使用案例

为最佳化处理神经网路,以便对边缘设备中的视讯影像中的对象进行分段检测分类设计的NeuPro-S,包括有系统感知增强功能,可显著提高性能。这些包括了多级记忆体系统支援,可减少使用外部SDRAM的高成本传输;多重权重的(multiple weight)压缩选项;异质的可扩展性,可在单一的统一架构中实现CEVA-XM6视觉DSP、NeuPro-S核心和客制化AI引擎的各种组合。平均而言,这使NeuPro-S在与CEVA的第一代AI处理器相比时,性能提高了50%,记忆体频宽降低40%,功耗降低30%。

NeuPro-S系列包括NPS1000、NPS2000和NPS4000,预配置的处理器每一周期分别有1000、2000和4000个8位元MAC。NPS4000可提供每一核心最高的CNN性能,在1.5GHz时可达到12.5 TOPS(Tera Operations Per Second,每秒万亿次运算)且是可完全扩展的,最高可达100 TOPS。

针对日益多样化的特定应用神经网路和处理器,CDNN-Invite API可以让客户设计的神经网路引擎无缝地整合到CEVA屡获殊荣的深度神经网路(CDNN)框架中。然后,CDNN将全面最佳化和增强网路和层,以充分利用每个CEVA-XM6视觉DSP、NeuPro-S和客制化神经网路处理器的卓越性能。CDNN-Invite API已经获得主要客户的采用,他们与CEVA工程师密切合作,将其部署商用产品中。

CEVA视觉业务部副总裁兼总经理Ilan Yona表示,在为边缘设备扩展深度神经网路处理器和最佳化技术方面,CEVA持续保持领先,为业界树立新的典范。边缘设备中资料频宽和功耗所带来的挑战越来越严峻,NeuPro-S架构解决了这些挑战的根本原因。借由CDNN-Invite API,我们为不断增长的神经网路创新者社群降低进入障碍,使他们能够从我们的CDNN编译器技术所提供的广泛支援和易用性中获益,进一步扩展了我们在神经网路编译器技术方面不容置疑的竞争优势

CEVA在整合处理、加速、软体工具方面所拥有的丰富经验整体策略,可为深度学习提供一个兼具开放、节能和可编程的平台。除了AI运行时间处理之外,NeuPro-S架构中的完全可编程CEVA-XM6视觉DSP还可以同时处理成像、计算机视觉和一般的DSP工作负载。这也使得客户和演算法开发人员能够利用CEVA广泛的成像和视觉软体和程式库,包括用于3D映射的CEVA-SLAM软体开发套件、用于计算机视觉开发的CEVA-CV和CEVA-VX软体库,以及最近收购的广角成像软体套件,包括消除弯曲技术(dewarp)、视讯拼接(video stitching)和图像资料(Data-in-Picture)感测器融合技术。

NeuPro-S提供满足安全要求的解决方案,包括品质保证标准IATF 16949和汽车标准(包括ISO 26262和A-Spice),进一步巩固了CEVA在汽车使用案例中的成功地位