【独家】字节发布文生图开放模型SDXL-Lightning

界面新闻从知情人士处获悉,字节发布文生图开放模型SDXL-Lightning。

从AI开源社区Hugging Face的最新榜单上,界面新闻查询到了该模型。SDXL-Lightning 跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。

与SDXL-Lightning一同上榜的,是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

在图像生成领域,先进模型的生成技术依赖于扩散过程,就是把噪声逐步转化为图像样本的迭代。这个过程通常需要20到40次调用神经网络,不仅会耗费巨大的计算资源,生成速度也比较慢。生成一张高质量图像,大约需要5秒。

据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。

一位分析人士表示,对于需要快速图像生成的应用场景,如实时广告创意、游戏角色设计等,SDXL-Lightning模型表现出一些应用潜力。这项技术也可以被运用于快速且高质量生成视频、音频以及其他多模态内容。

字节跳动智能创作团队对界面新闻回应称,开源开放的浪潮已成为推动人工智能迅猛发展的关键力量,SDXL-Lightning模型基于已有繁荣生态的文生图开放模型SDXL,设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。