[최석준] DDPM (Diffusion model)

DDPM (Diffusion model) 논문

<Denoising Diffusion Probabilistic Models> 리뷰

학회 : NeurIPS 2020

저자 : Jonathan Ho, Ajay Jain, Pieter Abbeel

소속 : UC Berkeley

링크 : https://arxiv.org/pdf/2006.11239

참고하면 좋은 리뷰 : https://xoft.tistory.com/32

[개념 정리] Diffusion Model

GAN, VAE 와 같은 생성 모델(Generative Model) 중 하나로써, 2022년에 이슈가 되었던 text-to-image 모델인 Stable-Diffusion, DALL-E-2, Imagen의 기반이 되는 모델입니다. 많은 논문에서 Diffusion Model이 인용되지만 수

xoft.tistory.com

https://kimjy99.github.io/%EB%85%BC%EB%AC%B8%EB%A6%AC%EB%B7%B0/ddpm/

[논문리뷰] Denoising Diffusion Probabilistic Models (DDPM)

DDPM 논문 리뷰 (NeurIPS 2020)

kimjy99.github.io

https://jungsoo-ai-study.tistory.com/47

DDPM: Denoising Diffusion Probabilistic Models

NeurIPS 2020Denoising Diffusion Probabilistic ModelsJonathan Ho, Ajay Jain, and Pieter Abbeel본 논문은 이미지 생성 분야에서 최초로 Diffusion 방식을 제안한 연구로, 생성형 인공지능 연구에 있어 중요한 전환점을 제

jungsoo-ai-study.tistory.com

1. Abstract & Introduction

Diffusion model을 발전시킨 논문이다. Diffusion model은 Forward Process에서는 Markov Chain이 점진적으로 noise를 추가하여 최종적으로는 완전한 노이즈인 가우시안 noise를 만든다. 반대로 reverse process에서는 가우시안 noise를 제거하여 원하는 데이터에 맞는 샘플을 만든다. 즉, 데이터를 노이즈로 한 번에 만들고 한 번에 생성하는 것이 아닌 점차적으로 노이즈를 추가하고 빼는 과정을 수행하여서 선명한 결과를 얻고자 하는 생성 모델이다.

- Markov Chain : 현재 상태는 (t) 이전 상태(t-1)에만 의존한다는 특성

2. Background

Diffusion 모델에서는

과 같이 정의한다. x1, x2, x_T는 데이터 x0 ~ q(x0)와 같은 크기이고 다음 P를 구하는 과정을 reverse process라고 하며 최종적으로 Pt는 완전히 가우시안 분포를 따른다.

- diffusion에서 reverse process의 한 스텝에서의 분포를 '가우시안으로 가정하여서' 모델링한 결과이다. 만약 noisy한 상태 xt가 주어졌을 때 바로 이전 단계는 평균이 mu 이고 분산이 sigma인 정규 분포에서 샘플링 된다는 것을 보여준다.

- 다음은 Forward 과정에서의 노이즈를 추가하는 방식이다. beta의 크기에 노이즈를 얼마나 추가할 지가 결정되며, beta의 값이 커질 수록 노이즈 값이 많이 추가되는 것을 알 수 있다. (beta 값은 주어진 상수)

- 확률 분포 q가 주어졌을 때 이 확룰 분포를 가장 잘 모델링하는 확률 분포 P를 찾는 문제로 변환됨.

- likelihood 정리 : http://data-scientist-brian-kim.tistory.com/91#google_vignette

- MLE 정리 : https://xoft.tistory.com/31

- 즉, 확률 분포 q에서 관측한 값으로 확률 분포 p의 likelihood를 구하였을 때, 그 likelihood 값이 최대가 되는 확률 분포를 찾는 MLE(Maximum Likelihood Estimation) 문제이다. 이때 -log를 붙이면 최소화하는 방향으로 loss를 설계할 수 있다. (NLL)