OpenAI|一致性模型训练的改进技术

1,307次阅读
没有评论

Improved Techniques for Training Consistency Models

Y Song, P Dhariwal
[OpenAI]

一致性模型训练的改进技术

  • 一致性模型是一种新的生成模型族,可以在一个步骤内生成高质量的样本,而无需进行对抗训练。
  • 当前的一致性模型依赖于从预训练的扩散模型中进行知识蒸馏,并使用像LPIPS这样的学习指标,这限制了它们的性能。
  • 本文提出在无需蒸馏的情况下直接从数据训练一致性模型的改进技术。
  • 主要改进:
  • 根据理论分析从一致性训练的教师网络中移除EMA。
  • 采用Pseudo-Huber损失代替LPIPS以避免评估中的偏差。
  • 使用更关注较低噪声水平的对数正态噪声时间表。
  • 指数增加总离散化步数作为课表。
  • 调优权重函数、噪声嵌入和dropout等超参数。
  • 通过这些改变,一致性训练在CIFAR-10和ImageNet 64×64上取得了SOTA的样本质量,超过了一致性蒸馏。
  • 一步生成的样本FID达到CIFAR-10上的2.51和ImageNet 64×64上的3.25,超过了顶级的扩散模型和GAN。
  • 两步采样进一步将FID改善到CIFAR-10上的2.24和ImageNet 64×64上的2.77。
  • 建立了一致性模型作为一个有前景的独立的生成模型族,而无需蒸馏。
  • 动机:改进一步生成高质量样本的一致性模型的训练方法,以提高样本质量并消除对学习度量的依赖。
    方法:通过改进一致性训练技术,直接从数据中学习一致性模型,而不需要预训练扩散模型或学习度量。采用伪Huber损失替代学习度量,并引入对数正态噪声规划和离散步骤翻倍的技术。
    优势:改进的一致性模型在单个采样步骤中实现了CIFAR-10和ImageNet 64×64的FID分数为2.51和3.25,相比之前的方法提升了3.5倍和4倍。通过两步采样,进一步降低了FID分数,表现超过了扩散模型的结果。

    通过改进一致性模型的训练方法,直接从数据中学习,消除对学习度量的依赖,实现了在单个采样步骤中生成高质量样本,表现超过了扩散模型的结果。

    该论文介绍了一种新兴的生成模型家族——一致性模型,它可以在一步中采样高质量数据而不需要对抗训练。当前的一致性模型通过从预训练扩散模型中提炼信息并采用学习度量(如LPIPS)来实现最佳的采样质量。然而,提炼限制了一致性模型的质量为预训练扩散模型的质量,并且LPIPS在评估中引入了不可取的偏见。为了解决这些问题,该论文提出了改进的一致性训练技术,其中一致性模型直接从数据中学习而不需要提炼。

    该论文深入研究了一致性训练的理论,并发现了一个之前被忽视的缺陷,通过消除教师一致性模型中的指数移动平均来解决该缺陷。为了替代LPIPS等学习度量,该论文采用了健壮统计中的伪Huber损失。此外,该论文引入了对数正态噪声调度用于一致性训练目标,并提议每一定训练迭代次数加倍离散步数总数。这些修改加上更好的超参数调整使得一致性模型在单步采样中在CIFAR-10和ImageNet 64×64上分别实现了FID得分2.51和3.25。与先前的一致性训练方法相比,这些得分分别提高了3.5倍和4倍。通过两步采样,该论文进一步将这两个数据集上的FID得分降低到2.24和2.77,超过了通过提炼得到的一步和两步设置的结果,同时缩小了一致性模型与其他最先进生成模型之间的差距。

    https://arxiv.org/abs/2310.14189 

    OpenAI|一致性模型训练的改进技术
    OpenAI|一致性模型训练的改进技术
    OpenAI|一致性模型训练的改进技术

     

    Read More 

    正文完
    可以使用微信扫码关注公众号(ID:xzluomor)
    post-qrcode
     0
    评论(没有评论)

    文心AIGC

    2023 年 10 月
     1
    2345678
    9101112131415
    16171819202122
    23242526272829
    3031  
    文心AIGC
    文心AIGC
    人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
    文章搜索
    热门文章
    潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

    潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

    潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
    “昆山杯”第二十七届清华大学创业大赛决赛举行

    “昆山杯”第二十七届清华大学创业大赛决赛举行

    “昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
    MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

    MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

    MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
    天下苦SaaS已久,企业级AI得靠「结果」说话

    天下苦SaaS已久,企业级AI得靠「结果」说话

    天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
    最新评论
    ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
    tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
    ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
    ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
    ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
    ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
    Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
    ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
    ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
    ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
    热评文章
    库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

    库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

    库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
    清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

    清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

    清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
    奥迪+华为=油车智能天花板?

    奥迪+华为=油车智能天花板?

    Failed to fetch content Read More 
    LeCun离职前的吐槽太猛了

    LeCun离职前的吐槽太猛了

    LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
    自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

    自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

    自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...