今天看啥  ›  专栏  ›  深度图学习与大模型LLM

扩散模型的原理及实现(Pytorch)

深度图学习与大模型LLM  · 公众号  ·  · 2024-02-23 11:20
上文我们介绍了OpenAI Sora文生视频模型再次震撼了AI 圈,并提到了Sora模型实际上是一个扩散模型+Transformer,本文继续讲述扩散模型的发展、原理及代码实践。扩散模型的导火索,是始于2020 年所提出的DDPM(Denoising Diffusion Probabilistic Model)。在深入研究去噪扩散概率模型(DDPM)如何工作的细节之前,让我们先看看现有生成式人工智能的一些发展,也就是DDPM的一些基础研究:VAEVAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进行采样,并将其传递到解码器中,其中输入的图像预计与输出的图像相似。这个过程包括使用KL Divergence来计算损失。VAEs的一个显著优势在于它们能够生成各种各样的图像。在采样阶段简单地从高斯分布中采样,解码器创建一个新的图像。GAN在变分自编码器(VA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照