【李宏毅】Stable Diffusion、DALL-E、Imagen 背后共同的套路
from: https://www.bilibili.com/video/BV1zm4y167b1/


3个模组




1. Text Encoder

文字编码器 对结果 非常重要
来源:Imagen

评价指标:FID


3. Decoder



2. Generation Model



生成图片

from: https://www.bilibili.com/video/BV1zm4y167b1/
3个模组
1. Text Encoder
文字编码器 对结果 非常重要
来源:Imagen
评价指标:FID
3. Decoder
2. Generation Model
生成图片