요약
비고
자세한 내용은 텍스트 및 이미지 탭을 참조하세요.
이 모듈에서는 Microsoft Foundry의 비전 지원 모델과 이를 사용하여 이미지를 분석하고 원본 이미지 및 비디오를 생성하는 방법을 살펴보했습니다.
모듈은 이미지 분석을 지원하는 다중 모달 모델을 다루었습니다. 또한 Foundry 도구 및 API를 사용하여 프롬프트에서 이미지를 만들고 편집하기 위해 GPT-Image 제품군의 이미지 생성 모델과 같은 이미지 생성 모델을 다루었습니다. 마지막으로, 대화형 플레이그라운드와 프로그래밍 방식의 비동기 REST 워크플로를 통해 텍스트-비디오 및 이미지-비디오 생성을 가능하게 하는 Sora 모델을 사용하여 비디오 생성을 도입했습니다.
전반적으로 Microsoft Foundry의 시각적 AI 모델은 시각적 데이터와 언어 기반 AI 간의 격차를 해소하는 데 도움이 됩니다. 문서 및 이미지 분석, 시각적 도우미, 접근성 도구 및 다중 모드 AI 에이전트와 같은 시나리오를 가능하게 함으로써, 이미지 이해를 최신 AI 애플리케이션의 자연스러운 확장으로 만듭니다.
자세한 내용은 다음 링크를 확인하세요.
- 설명서에서 이미지 분석 빠른 시작을 사용해 보세요.
- 비전 지원 채팅 모델에 대해 자세히 알아봅니다.
- Azure OpenAI 이미지 생성 모델에 대해 자세히 알아봅니다.
- Sora를 사용한 비디오 생성에 대해 자세히 알아보세요.