《产业》AMD推最新AMD ROCm 6.2开源堆叠软体 助功HPC及AI效能

AMD ROCm 6开源软体平台经过优化,可从AMD Instinct MI300加速器中提取最佳的高效能计算(HPC)和人工智慧(AI)工作负载效能,同时保持与业界软体框架的相容性。ROCm包括一系列驱动程式、开发工具和API,从低阶核心到最终使用者应用程式的GPU程式设计均可实现,并且可以根据您的具体需求进行自订。在这个免费、开源且整合的软体生态系统中开发、协作、测试和部署应用程式。设计完成后,软体具有可移植性,可在不同厂商的加速器之间或在不同的GPU连接架构之间移动,所有这些都是在设备无关的情况下实现的。ROCm特别适合于GPU加速的高效能计算、人工智慧、科学计算和计算机辅助设计(CAD)。

AMD ROCm 6.2该版本的新增功能与优势,包括:扩展vLLM支援:提升Instinct加速器的人工智慧推论能力;全新Bitsandbytes功能:通过提高记忆体效率与效能,增强AI训练和推论;全新离线安装程式建立器:简化ROCm的安装体验;全新Omnitrace与Omniperf分析工具:通过效能分析和精简的开发工作流程,革新AI和高效能运算的开发。更广泛的FP8支援:在使用更少记忆体的情况下进行更高效的训练,从而增强AI推论能力。