扩散模型理论总结

2025年3月12日 164点热度

生成模型

image-20250311170050038

image-20250311170111350

基本思路是使用一个简单分布作为桥梁,将观测数据分布映射到简单分布中,再从简单分布映射观测数据分布。

image-20250311170142209

使用高斯分布是因为高斯函数的运算性质很方便,也比较简单。多个高斯分布可以拟合一个复杂的分布。

image-20250311170223962

扩散过程人为定义,反向生成过程引入参数$\theta$,根据最大似然估计方法,转化为求下界的上限。

DDPM

image-20250311170248576

前向扩散过程

image-20250311170316337

扩散模型的话通过超参数$\beta$将清晰图片和噪声图片加权求和,达到添加噪声的目的。

image-20250311170912194

对于加权求和的结果,根据重参数采样,依然符合高斯分布。

image-20250311172217268

对于超参数$\beta$,原始论文中设置为随着时间步$t$线性增长。

image-20250311172413369

每一个时间步中随机生成的高斯分布相互独立,他们的加权求和依然是高斯分布,超参数更改为用$\alpha$表示。

image-20250311172501866

反向生成过程

image-20250311172648982

现在希望从高斯分布中采样生成$x_0$清晰图像。假设采样过程逐步进行,最终由噪声图像$x_t$生成清晰图像$x_0$分布由每一时间步的分布累乘。

定义每一时间步的反向生成过程符合高斯分布,则整个反向生成过程也符合高斯分布。

image-20250311173233191

image-20250311173324125

image-20250311173708428

反向生成过程的均值和方差如上。已知$x_0$和$x_t$时,整个分布已知确定。

优化目标

image-20250311173831753

image-20250311173949228

image-20250311174340973

image-20250311174429899

对于优化目标和扩散过程类似,目的是求去下界的上限。在原论文中,作者假设扩散生成两个过程方差不变,loss结果如下。

训练推理算法

image-20250311180330836

image-20250312170710091

image-20250312170820480

image-20250311180635062

推理过程中增加高斯随机变量$z$, 保证整体符合高斯分布。

image-20250311180706877

image-20250311180926375

时间嵌入采用标准的位置编码。

总结

image-20250311181519810

xxs9331

这个人很懒,什么都没留下

文章评论