GAN,VAE,Diffusion对比

对比下三种主流图片生成模型的优缺点：

模型	优点	缺点
GAN	生成的图片逼真	由于要同时训练判别器和生成器这两个网络，训练不稳定 GAN主要优化目标是使图片逼真，导致图片多样性不足 GAN的生成是隐式的，由网络完成，不遵循概率分布，可解释性不强
VAE	学习的概率分布，可解释性强，图片多样性足	图片生成质量差
Diffusion	生成的图片逼真数学可解释性强	训练和推理成本高昂、速度慢，需要多步采样

参考

DALL·E 2（内含扩散模型介绍）
- 该视频讲到了GAN、VAE、DVAE、VQ-VAE、Diffusion、DDPM、Improved DDPM、classifier-(free) guidance
从VAE到扩散模型：一文解读以文生图新范式