MobileDiffusion是什么?
MobileDiffusion是谷歌推出的专为移动设备设计的轻量级潜在扩散模型,可以在0.5秒内根据文本提示生成512x512高质量图像。相较于其他文本到图像模型,它更小巧(仅520M参数),非常适合在手机上部署使用。
MobileDiffusion采用 DiffusionGAN 在推理过程中实现一步采样,它微调了预训练的扩散模型,同时利用 GAN 对去噪步骤进行建模,可以为各种领域生成高质量的多样化图像。
论文地址:https://arxiv.org/abs/2311.16567
官方博客:https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
MobileDiffusion的演示demo:
下面是使用MobileDiffusion生成的效果:
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。