在今日的2023 WAIC(世界人工智能大会)阿里云论坛“MaaS:以模型为中心的AI开发新范式”上,通义大模型家族新成员AI绘画创作模型通义万相发布,通义万相有文生图、风格迁移、相似图生成三大能力。
其中,文生图能力中,通义万相通过先验数据提升训练稳定性,保证结果合理性,并采用多语言预料增强训练,以提升语义理解能力,基于信噪比指标优化高扩散过程,提高生成图片的细节丰富性。
风格迁移能力的应用场景是当用户对图片语义很满意,对风格有特殊要求,通义万相能自动实现图片风格的一系列迁移。
相似图生成针对的是用户想要获取多种类似图片结果的情况。通义万相可以利用鲁棒视觉表征,固定图片的语义与风格,然后基于扩散生成,实现结果多样性。