根据微软官网,近日,微软Azure认知服务研究团队与北卡罗来纳大学教堂山分校合作开发名为“可组合扩散(CoDi)”的AI模型,它能够同时处理和生成任意模态组合的内容。
据悉,CoDi采用了一种新颖的可组合生成策略,该策略涉及通过在扩散过程中桥接对齐来构建共享的多模态空间,从而能够同步生成相互交织的模态,例如将视频和音频的时间对齐。