LayoutDiffuse: Adapting Foundational Diffusion Models for Layout-to-Image Generation

해당 논문은 Layout-to-image task에서 보다 리얼하고 다양하면서 align이 잘 맞는 이미지를 생성하기 위해 Diffusion을 사용한 논문으로써 간단하게 정리합니다. CVPR 얼마 안남아서 점점 간략하게 정리하게 될 수도 있습니다. ㅎㅎ;; Summary layout-to-image + Diffusion layout attention을 통해 인스턴스가 존재하는 위치에서만 attention을 강력하게 주입하고 반대로 존재하지 않는 부분(background)에 대해서도 고려하여 DM이 두 가지를 잘 고려한 global feature를 받아서 훈련할 수 있게하였음 arXiv 논문 Introduction 기존의 제시되어있던 LDM, DM 방법들은 다양한 테스크에 사용됩니다. 이는 Layout 내에 이미지를 생성하는 Layout-to-image 도 마찬가지였는데 해당 논문에서는 이러한 LDM, DM 들을 활용해서 생성하는 이미지들이 성능이 좋으면서도 layout이 복잡해지는 ...

#arXiv #QKV #selfattention #TaskAdaptive #TaskPrompt #Unet #디퓨전 #레이아웃이미지 #리뷰 #Paper리뷰 #Layouttoimage #Layoutgen #attention #diff #Diffusion #generation #image #ImageGen #Layout #layoutattention #이미지생성

원문링크 : LayoutDiffuse: Adapting Foundational Diffusion Models for Layout-to-Image Generation