[기술동향] 이미지 생성을 위한 스테이블 디퓨전 모델에 대한 알기 쉬운 설명

최근 유행하고 있는 생성 AI(generative AI)의 두 가지 조류를 보면 하나는 언어 모델이고 다른 하나는 이미지 생성 모델이다. 오픈 AI의 챗GPT가 언어 모델을 이끌고 있다면, 이미지 생성 모델은 역시 챗GPT로 유명한 오픈AI의 DALL-E와 최근 급부상하고 있는 미드저니(Midjourney)가 이끌고 있다. 먼저 이미지 생성 서비스를 최종 사용자 관점에서 살펴보고, 다음으로 실제 어떻게 이런 마법이 일어나는지 스테이블 디퓨전 기술에 대해 알아보겠다. DALL-E와 미드저니는 모두 사용자의 프롬프트를 입력받아 이미지를 생성하는 방식을 사용하고 있다. 챗GPT를 사용할 때 사용자는 대답을 이끌어내기 위한 발화로서 프롬프트를 적절하게 만들어야 하는데, DALL-E와 같은 이미지 생성 서비스를 사용할 때도 역시 프롬프트를 어느 정도 정교하게 만들어내느냐에 따라 최종 결과물의 품질이 완전히 달라지게 된다. DALL-E는 사진으로 찍은 듯한 사실적인 그림을 만들어내는 반면에 미...

#AI동작원리 #소프트웨어로봇 #생성AI #미드저니 #레인보우브레인 #기술동향 #Midjourney #GPT #DALLE #스테이블디퓨전

원문링크 : [기술동향] 이미지 생성을 위한 스테이블 디퓨전 모델에 대한 알기 쉬운 설명