解读Google新绘画AI,会如何影响你的工作?——“google MUSE A

MUSE
介绍
Muse是一种文本到图像生成模型(Google新绘画模型),其利用离散令牌作为图像生成的基本单位,使得生成过程变得高效。
优势
Muse这种是对创作者更合适的工具。
自己得有能力,判断,审美,整合,取其精华去其糟粕。
- 生成速度更快。
- 图像的质量和语义理解不会有所损失。
- 数量和空间关系正确
- 生成图片上的文字更准确
- 可以修改图像。通过基于mask的训练,实现了雾-shot图像编辑能力
- 零-shot
- 文本指导修复、扩展
- 无遮罩编辑
论文
- 论文地址:https://arxiv.org/abs/2301.00704
- 参数量和stable diffusion的UNET差不多,900M左右。
- 引入mask来guide空间
- 把UNET替换成了纯transformer