요약

1분

비고

자세한 내용은 텍스트 및 이미지 탭을 참조하세요.

이 모듈에서는 Microsoft Foundry의 비전 지원 모델과 이를 사용하여 이미지를 분석하고 원본 이미지 및 비디오를 생성하는 방법을 살펴보했습니다.

모듈은 이미지 분석을 지원하는 다중 모달 모델을 다루었습니다. 또한 Foundry 도구 및 API를 사용하여 프롬프트에서 이미지를 만들고 편집하기 위해 GPT-Image 제품군의 이미지 생성 모델과 같은 이미지 생성 모델을 다루었습니다. 마지막으로, 대화형 플레이그라운드와 프로그래밍 방식의 비동기 REST 워크플로를 통해 텍스트-비디오 및 이미지-비디오 생성을 가능하게 하는 Sora 모델을 사용하여 비디오 생성을 도입했습니다.

전반적으로 Microsoft Foundry의 시각적 AI 모델은 시각적 데이터와 언어 기반 AI 간의 격차를 해소하는 데 도움이 됩니다. 문서 및 이미지 분석, 시각적 도우미, 접근성 도구 및 다중 모드 AI 에이전트와 같은 시나리오를 가능하게 함으로써, 이미지 이해를 최신 AI 애플리케이션의 자연스러운 확장으로 만듭니다.

자세한 내용은 다음 링크를 확인하세요.

설명서에서 이미지 분석 빠른 시작을 사용해 보세요.
비전 지원 채팅 모델에 대해 자세히 알아봅니다.
Azure OpenAI 이미지 생성 모델에 대해 자세히 알아봅니다.
Sora를 사용한 비디오 생성에 대해 자세히 알아보세요.

피드백

이 페이지가 도움이 되었나요?