다음을 통해 공유


Azure AI 스튜디오를 사용하여 Azure OpenAI 모델을 배포하는 방법

Important

이 문서에 설명된 기능 중 일부는 미리 보기로만 제공될 수 있습니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.

이 문서에서는 Azure AI 스튜디오에서 Azure OpenAI 모델 배포를 만드는 방법을 알아봅니다.

Azure OpenAI Service는 다양한 기능과 가격대를 갖춘 다양한 모델 집합을 제공합니다. Azure AI 스튜디오에서 Azure OpenAI 모델을 배포하는 경우 프롬프트 흐름 또는 다른 도구를 사용하여 배포를 사용할 수 있습니다. 모델 가용성은 지역에 따라 다릅니다. 각 모델의 세부 정보에 대한 자세한 내용은 Azure OpenAI Service 모델을 참조하세요.

Azure AI 스튜디오 플레이그라운드에서 Azure OpenAI 모델을 수정하고 상호 작용하려면 먼저 기본 Azure OpenAI 모델을 프로젝트에 배포해야 합니다. 모델이 배포되고 프로젝트에서 사용할 수 있게 되면 REST API 엔드포인트를 있는 그대로 사용하거나 자체 데이터 및 기타 구성 요소(포함, 인덱스 등)를 사용하여 추가로 사용자 지정할 수 있습니다.

모델 카탈로그에서 Azure OpenAI 모델 배포

아래 단계에 따라 AI 스튜디오 모델 카탈로그에서 실시간 엔드포인트에 gpt-4 같은 Azure OpenAI 모델을 배포합니다.

  1. AI 스튜디오에 로그인하고 페이지로 이동합니다.

  2. 왼쪽 사이드바에서 모델 카탈로그를 선택합니다.

  3. 컬렉션 필터에서 Azure OpenAI를 선택합니다.

    카탈로그에서 Azure OpenAI 모델로 필터링하는 방법을 보여 주는 스크린샷.

  4. Azure OpenAI 컬렉션에서 gpt-4 같은 모델을 선택합니다.

  5. 배포를 선택하여 배포 창을 엽니다.

  6. 모델을 배포할 허브를 선택합니다. 허브가 없는 경우 허브를 만들 수 있습니다.

  7. 배포 이름을 지정하고 요구 사항에 따라 다른 기본 설정을 수정합니다.

  8. 배포를 선택합니다.

  9. 배포 세부 정보 페이지로 이동됩니다. 플레이그라운드에서 열기를 선택합니다.

  10. 코드 보기를 선택하여 배포된 모델을 애플리케이션에서 사용하는 데 사용할 수 있는 코드 샘플을 가져옵니다.

프로젝트에서 Azure OpenAI 모델 배포

또는 AI Studio의 프로젝트에서 시작하여 배포를 시작할 수 있습니다.

  1. AI 스튜디오에서 프로젝트로 이동합니다.
  2. 구성 요소>배포를 선택합니다.
  3. +배포 만들기를 선택합니다.
  4. 컬렉션 필터에서 Azure OpenAI를 선택합니다.
  5. Azure OpenAI 컬렉션에서 gpt-4 같은 모델을 선택합니다.
  6. 확인을 선택하여 배포 창을 엽니다.
  7. 배포 이름을 지정하고 요구 사항에 따라 다른 기본 설정을 수정합니다.
  8. 배포를 선택합니다.
  9. 배포 세부 정보 페이지로 이동됩니다. 플레이그라운드에서 열기를 선택합니다.
  10. 코드 보기를 선택하여 배포된 모델을 애플리케이션에서 사용하는 데 사용할 수 있는 코드 샘플을 가져옵니다.

Azure OpenAI 모델 유추

배포된 모델에서 유추를 수행하려면 플레이그라운드 또는 코드 샘플을 사용할 수 있습니다. 플레이그라운드는 실시간으로 모델과 상호 작용할 수 있는 웹 기반 인터페이스입니다. 플레이그라운드를 사용하여 다양한 프롬프트로 모델을 테스트하고 모델의 응답을 볼 수 있습니다.

애플리케이션에서 배포된 모델을 사용하는 방법에 대한 자세한 예제는 다음 Azure OpenAI 빠른 시작을 참조하세요.

모델의 지역별 가용성 및 할당량 한도

Azure OpenAI 모델의 기본 할당량은 모델 및 지역에 따라 다릅니다. 특정 모델은 일부 지역에서만 사용할 수 있습니다. 가용성 및 할당량 한도에 대한 자세한 내용은 Azure OpenAI Service 할당량 및 한도를 참조하세요.

모델 배포 및 유추를 위한 할당량

Azure OpenAI 모델의 경우 배포 및 유추는 TPM(Tokens-per-Minutes) 단위로 모델별로 지역별 구독에 할당된 할당량을 사용합니다. Azure AI 스튜디오에 가입하면 사용 가능한 대부분의 모델에 대한 기본 할당량이 제공됩니다. 그런 다음 배포가 만들어질 때 각 배포에 TPM을 할당하면 할당한 양만큼 해당 모델에 사용할 수 있는 할당량이 줄어듭니다. 할당량 한도에 도달할 때까지 계속해서 배포를 만들고 TPM을 할당할 수 있습니다.

할당량 한도에 도달하면 해당 모델의 새 배포를 만드는 유일한 방법은 다음과 같습니다.

  • 할당량 증가 양식을 제출하여 더 많은 할당량을 요청합니다.
  • Azure OpenAI Portal에서 다른 모델 배포에 할당된 할당량을 조정하여 새 배포를 위한 토큰을 확보합니다.

할당량에 대해 자세히 알아보려면 Azure AI 스튜디오 할당량Azure OpenAI Service 할당량 관리를 참조하세요.