Microsoft Foundry 포털에서 비전 지원 모델 사용

완료됨

팁 (조언)

자세한 내용은 텍스트 및 이미지 탭을 참조하세요.

이미지를 포함하는 프롬프트를 처리하려면 다중 모델 생성 AI 모델을 배포해야 합니다. 즉, 텍스트 기반 입력뿐만 아니라 이미지 기반(그리고 경우에 따라 오디오 기반) 입력도 지원하는 모델을 배포해야 합니다. Microsoft Foundry에서 사용할 수 있는 멀티모달 모델에는 다음이 포함됩니다.

  • Microsoft Phi-4-multimodal-instruct
  • OpenAI gpt-4.1
  • OpenAI gpt-4.1-mini

팁 (조언)

Microsoft Foundry에서 사용 가능한 모델에 대한 자세한 내용은 Microsoft Foundry 설명서의 Microsoft Foundry 모델 개요 문서를 참조하세요.

이미지 기반 프롬프트를 사용하여 멀티모달 모델 테스트

멀티모달 모델을 배포한 후 Microsoft Foundry 포털의 채팅 플레이그라운드에서 테스트할 수 있습니다.

이미지 기반 프롬프트가 있는 채팅 플레이그라운드의 스크린샷

채팅 플레이그라운드에서 로컬 파일에서 이미지를 업로드하고 메시지에 텍스트를 추가하여 멀티모달 모델의 응답을 유도할 수 있습니다.