OpenAI의 이미지 생성 기능 이해

완료됨

이미지 생성 모델은 프롬프트, 기본 이미지 또는 둘 다를 사용하여 새로운 것을 만들 수 있습니다. 이러한 생성 AI 모델은 실제 이미지와 꾸밈 이미지를 모두 만들고, 이미지의 레이아웃 또는 스타일을 변경하고, 제공된 이미지에 변형을 만들 수 있습니다.

DALL-E

생성형 AI 모델은 자연어 기능 외에도 이미지를 편집하고 만들 수 있습니다. 이미지와 함께 작동하는 모델을 DALL-E라고 합니다. GPT 모델과 마찬가지로 DALL-E의 후속 버전이 DALL-E 2와 같은 이름에 추가됩니다. 이미지 기능은 일반적으로 이미지 만들기, 이미지 편집, 이미지 변형 만들기의 세 가지 범주로 나뉩니다.

이미지 세대

원본 이미지는 이미지를 원하는 텍스트 프롬프트를 제공하여 생성할 수 있습니다. 프롬프트가 자세할수록 모델이 원하는 결과를 제공할 가능성이 높아집니다.

DALL-E를 사용하면 “빈센트 반 고흐 스타일의 개”와 같은 특정 스타일의 이미지를 요청할 수도 있습니다. 스타일은 편집 및 변형에도 사용할 수 있습니다.

예를 들어 “맨 위에 햄버거를 들고 서 있는 코끼리 스타일 디지털 아트”라는 프롬프트가 표시되면 모델은 요구되는 내용을 정확하게 묘사하는 디지털 아트 이미지를 생성합니다.

Four AI generated art depictions of an elephant with a burger on top of it.

“분홍색 여우”와 같이 좀 더 일반적인 것을 요구할 때 생성된 이미지는 요구되는 것을 충족시키면서 더 다양하고 단순합니다.

Four AI generated art depictions of different pink foxes.

그러나 “모네 스타일의 들판을 달리는 분홍색 여우”와 같이 프롬프트를 보다 구체적으로 만들면 모델은 훨씬 더 유사한 세부 이미지를 만듭니다.

Four AI generated art depictions of a pink fox in the style of Monet.

이미지 편집

이미지가 제공되면 DALL-E는 스타일을 변경하거나, 항목을 추가 또는 제거하거나, 추가할 새 콘텐츠를 생성하여 요청된 대로 이미지를 편집할 수 있습니다. 편집은 원본 이미지를 업로드하고 편집할 이미지의 영역을 나타내는 투명 마스크를 지정하여 수행됩니다. 이미지 및 마스크와 함께 편집할 내용을 나타내는 프롬프트는 모델에 영역을 채우기 위한 적절한 콘텐츠를 생성하도록 지시합니다.

위의 분홍색 여우 이미지 중 하나, 여우를 덮고 있는 마스크 및 “들판에서 책을 읽는 파란색 고릴라”라는 프롬프트가 표시되면 모델은 제공된 입력을 기반으로 이미지 편집을 만듭니다.

Four AI generated art depictions of a blue gorilla in a field.

이미지 변형

이미지를 제공하고 원하는 이미지의 변형 수를 지정하여 이미지 변형을 만들 수 있습니다. 이미지의 일반 콘텐츠는 동일하게 유지되지만 주체의 위치 또는 보이는 위치, 배경 장면, 색이 변경될 수 있는 등의 측면이 조정됩니다.

예를 들어 햄버거를 모자로 쓰고 있는 코끼리의 이미지 중 하나를 업로드하면 동일한 주체의 변형된 이미지를 얻게 됩니다.

Four AI generated art variations of an elephant with a burger on its head.

참고 항목

DALL-E에 대한 액세스 권한은 현재 초대 기준으로만 부여됩니다.