知名生成式AI独角兽企业Stability AI周四宣布推出SDXL 0.9,称其是Stable Diffusion文生图模型套件中最先进的开发。继4月份的Stable Diffusion XL beta版成功发布之后,SDXL 0.9在图像和构图细节上都大大改进,可在消费级GPU上运行。该模型现在可以通过ClipDrop访问,API很快就会发布,SDXL 1.0预计将于7月中旬开源。
SDXL 0.9是所有开源图像模型中参数数量最多的模型之一,拥有一个35亿参数基础模型和一个66亿参数模型集成pipeline(通过在两个模型上运行并聚合结果创建最终输出)。pipeline的第二阶段模型用于向第一阶段生成的输出添加更精细的细节。
相比之下,测试版运行在3.1亿个参数上,只使用一个模型。SDXL 0.9在两个CLIP模型上运行,其中包括迄今为止训练过的最大的OpenCLIP模型之一OpenCLIP vitg /14,它增强了SDXL 0.9的处理能力和创建具有更大深度和1024×1024更高分辨率的逼真图像的能力。SDXL团队将很快发布一篇研究博客,详细介绍该模型的规范和测试。