腾讯发布AI基础设施品牌“腾讯云智算”,从上架到训练只需1天

新京报贝壳财经讯(记者 白金蕾)9月5日,在腾讯全球数字生态大会上,腾讯云正式发布AI infra(人工智能基础设施)品牌“腾讯云智算”。腾讯集团副总裁、云与智慧产业事业群COO、腾讯云总裁邱跃鹏介绍,腾讯云智算集群从机器上架到开始训练可以做到只需1天,相比业界以月为单位大为缩短。

邱跃鹏表示,在稳定性和性能上,腾讯云的集群千卡单日故障数已经刷新到0.16,是行业水平的三分之一;1分钟就能完成万卡checkpoint(指在训练过程中保存模型当前状态的快照写入),数据读写效率是业界10倍;千卡集群的通信时间缩短到6%,是业界一半。

腾讯云智算是一个集算存网一体的高性能智算底座,整合了腾讯云高性能计算HCC、高性能网络IHN星脉、高性能云存储、加速框架、容器、向量数据库、智算套件等腾讯云优势产品,能够为AI创新输出多芯兼容、灵活部署的智算产品能力。通过整合软硬件技术能力,目前,腾讯云智算也能灵活地支持公有云、私有云以及分布式云的输出。

编辑 丁爽

校对 陈荻雁