李宏毅扩散模型(六)

2025年3月8日 120点热度

image-20250308212116864

对于推理步骤,每进行一次推理需要添加一个高斯变量。

image-20250308212235450

image-20250308212307112

对于文字生成模型来讲,如果每一次输出的都是可能性最大,那么生成结果只会输出那些使用频率最高的一些词汇,忽略了文字本身的含义。

image-20250308212841175

image-20250308213027123

一些其他的论文主张在词汇嵌入之后添加高斯噪声。

image-20250308213107786

image-20250308213123764

或者通过掩码预测的方式,来实现逐步预测的效果。

image-20250308213247019

xxs9331

这个人很懒,什么都没留下

文章评论