GAN,VAE,Diffusion对比
Swift Lv6

对比下三种主流图片生成模型的优缺点:

模型 优点 缺点
GAN
  • 生成的图片逼真
  • 由于要同时训练判别器和生成器这两个网络,训练不稳定
  • GAN主要优化目标是使图片逼真,导致图片多样性不足
  • GAN的生成是隐式的,由网络完成,不遵循概率分布,可解释性不强
VAE
  • 学习的概率分布,可解释性强,图片多样性足
  • 图片生成质量差
Diffusion
  • 生成的图片逼真
  • 数学可解释性强
  • 训练和推理成本高昂、速度慢,需要多步采样

参考

Powered by Hexo & Theme Keep
Unique Visitor Page View