而要被视作为扩散模型提供早期贡献的,还要属被NeurIPS 2019接收并做口头报告的工作《Generative Modeling by Estimating Gradients of the Data Distribution》。
当时,GAN还在以逼真生成风格席卷全球,但众多科学家仍受困于很难训练、无法完整采样等难题。
斯坦福大学博士后Sohl-Dickstein受物理学启发,利用扩散原理开发了生成建模算法——
类似于从一滴墨水变成漫射淡蓝色的水,首先将训练数据集中的复杂图像转化为简单的噪声,然后教系统如何反转这个过程,将噪声转化为图像。
如此一来就能实现对整个分布进行采样。
但当时,这样做会让训练过程太慢,性能效果也远远落后于GAN。
这时候,宋飏和他的导师Stefano Ermon出现了。
他们提出了一种新方法,不估计数据的概率分布,而是估计分布的梯度,最终效果实现了对GAN的超越。