小波扩散模型是快速和可扩展的图像生成器

1,402次阅读
没有评论

Wavelet Diffusion Models are fast and scalable Image Generators

Hao Phung, Quan Dao, Anh Tran

[VinAI:在 Hung Bui 博士(前Google DeepMind)的领导下,VinAI 是世界排名前 25 位的人工智能研究公司之一,开发世界一流的产品和服务。拥有 200 多名敬业和称职的人员,其中近 180 名是 AI 科学家、SW 工程师、嵌入式工程师]

  1. 扩散模型作为高保真图像生成的强大解决方案正在崛起,它在许多情况下的质量超过了GANs。然而,其缓慢的训练和推理速度是一个巨大的瓶颈,阻碍了它们在实时应用中的使用。最近的一种DiffusionGAN方法通过将采样步骤的数量从数千个减少到数个,大大减少了模型的运行时间,但其速度仍然在很大程度上落后于GAN的对应方法。
  2. 本文旨在通过提出一种新的基于小波的扩散结构来减少速度上的差距。通过小波分解从图像和特征层面上提取低频和高频成分,并自适应地处理这些成分,以加快处理速度,同时保持良好的生成质量。此外,我们建议使用重建项,这有效地提高了模型训练的收敛性。
  3. 在CelebA-HQ、CIFAR-10、LSUN-Church和STL-10数据集上的实验结果证明我们的解决方案是提供实时和高保真扩散模型的垫脚石。

 

https://arxiv.org/pdf/2211.16152.pdf

小波扩散模型是快速和可扩展的图像生成器

小波扩散模型是快速和可扩展的图像生成器

 

 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy