Azure OpenAI Service 모델

Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역에 따라 다릅니다. 2024년 7월에 만료되는 GPT-3 및 기타 모델에 대해서는 Azure OpenAI 서비스 레거시 모델을 참조하세요.

모델 설명
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
GPT-3.5 GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
포함 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다.
DALL-E 자연어에서 원본 이미지를 생성할 수 있는 일련의 모델입니다.
위스퍼 음성을 텍스트로 기록하고 번역할 수 있는 일련의 미리 보기 모델입니다.
텍스트 음성 변환(미리 보기) 텍스트 음성 변환을 합성할 수 있는 일련의 미리 보기 모델입니다.

GPT-4 및 GPT-4 Turbo 미리 보기

GPT-4는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있는 큰 멀티모달 모델(텍스트 또는 이미지 입력 허용 및 텍스트 생성)입니다. GPT-3.5 Turbo와 마찬가지로 GPT-4는 채팅에 최적화되어 있고 기존 완료 작업에 적합합니다. GPT-4를 사용하려면 채팅 Completions API를 사용합니다. GPT-4 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

GPT-4 Turbo with Vision은 이미지 입력을 허용하는 GPT-4 버전입니다. gpt-4vision-preview 모델로 사용할 수 있습니다.

  • gpt-4
  • gpt-4-32k

모델 요약 표에서 각 모델이 지원하는 토큰 컨텍스트 길이를 확인할 수 있습니다.

GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 완료 작업에도 잘 작동합니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct에는 채팅 완료 API 대신 완료 API를 사용하는 text-davinci-003과 유사한 기능이 있습니다. 레거시 GPT-3.5 및 GPT-3 모델보다는 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

모델 요약 표에서 각 모델이 지원하는 토큰 컨텍스트 길이를 확인할 수 있습니다.

GPT-3.5 Turbo 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

포함

text-embedding-3-large(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함된 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002 사용에서 text-embedding-3-large(으)로 이동하려면 새 포함을 생성해야 합니다.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

테스트에서 OpenAI는 MTEB 벤치마크를 사용하여 영어 작업에 대한 성능을 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 임베딩 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.

평가 벤치마크 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 평균 31.4 44.0 54.9
MTEB 평균 61.0 62.3 64.6

3세대 포함 모델은 새 dimensions 매개 변수를 통해 포함 크기를 줄일 수 있습니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. dimensions 매개 변수는 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전인 pip install openai --upgrade(으)로 업그레이드하는 것이 좋습니다.

OpenAI의 MTEB 벤치마크 테스트에 따르면 3세대 모델의 차원이 text-embeddings-ada-002 1,536차원 미만으로 감소하더라도 성능은 약간 향상됩니다.

DALL-E

DALL-E 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다. DALL-E 3은 일반적으로 REST API와 함께 사용할 수 있습니다. 클라이언트 SDK를 사용하는 DALL-E 2 및 DALL-E 3은 미리 보기로 제공됩니다.

위스퍼

현재 미리 보기 중인 위스퍼 모델은 음성 텍스트 변환에 사용할 수 있습니다.

Azure AI 음성 일괄 처리 대화 기록 API를 통해 Whisper 모델을 사용할 수도 있습니다. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

텍스트 음성 변환(미리 보기)

현재 미리 보기로 제공되는 OpenAI 텍스트 음성 변환 모델은 텍스트 음성 변환을 합성하는 데 사용할 수 있습니다.

Azure AI Speech를 통해 OpenAI 텍스트 음성 변환 음성을 사용할 수도 있습니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 변환 음성 가이드를 참조하세요.

모델 요약 테이블 및 지역 가용성

참고 항목

이 문서에서는 배포 유형이 표준에 있는 모든 Azure OpenAI 고객에게 적용되는 모델/지역 가용성에 대해서만 설명합니다. 일부 선택 고객은 아래 통합 테이블에 나열되지 않은 모델/지역 조합에 액세스할 수 있습니다. 또한 이러한 테이블은 고유한 모델/지역 가용성 매트릭스가 있는 프로비전된 배포 유형만 사용하는 고객에게는 적용되지 않습니다. 프로비전된 배포에 대한 자세한 내용은 프로비전된 지침참조하세요.

표준 배포 모델 가용성

지역 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, vision-미리 보기 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
스웨덴 중부 - - - - - -
스위스 북부 - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

이 표에는 지역별 가용성 세부 튜닝이 포함되어 있지 않습니다. 이 정보는 전용 미세 조정 섹션을 참조하세요.

표준 배포 모델 할당량

모델의 기본 할당량은 모델 및 지역에 따라 다릅니다. 기본 할당량 한도는 변경될 수 있습니다.

표준 배포에 대한 할당량은 TPM(분당 토큰) 기준으로 설명됩니다.

지역 GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - 미세 조정 Davinci-002 Davinci-002 - 미세 조정 GPT-35-Turbo - 미세 조정 GPT-35-Turbo-1106 - 미세 조정 GPT-35-Turbo-0125 - 미세 조정
australiaeast 40K 80K 80K 30K 300K - 350K - - - - - - - - -
brazilsouth - - - - - - 350K - - - - - - - - -
canadaeast 40K 80K 80K - 300K - 350K 350K 350K - - - - - - -
eastus - - 80K - 240K 240K 240K 350K 350K - - - - - - -
eastus2 - - 80K - 300K - 350K 350K 350K - - - - 250 K 250 K 250 K
francecentral 20K 60K 80K - 240K - 240K - - - - - - - - -
japaneast - - - 30K 300K - 350K - - - - - - - - -
northcentralus - - 80K - 300K - 350K - - 240K 250 K 240K 250 K 250 K 250 K 250 K
norwayeast - - 150K - - - 350K - - - - - - - - -
southafricanorth - - - - - - 350K - - - - - - - - -
southcentralus - - 80K - 240K - 240K - - - - - - - - -
southindia - - 150K - 300K - 350K - - - - - - - - -
스웨덴 중부 40K 80K 150K 30K 300K 240K 350K - - 240K 250 K 240K 250 K 250 K 250 K 250 K
스위스 북부 40K 80K - 30K 300K - 350K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80K - 240K - 350K - - - - - - - - -
westeurope - - - - 240K - 240K - - - - - - - - -
westus - - 80K 30K 300K - 350K - - - - - - - - -
westus3 - - - - - - 350K - - - - - - - - -

1K = TPM(분당 토큰 1,000개) TPM과 RPM(분당 요청 수) 간의 관계는 현재 1000TPM당 6 RPM으로 정의 됩니다.

GPT-4 및 GPT-4 Turbo 미리 보기 모델

이제 모든 Azure OpenAI 서비스 고객이 GPT-4, GPT-4-32k 및 GPT-4 Turbo with Vision을 사용할 수 있습니다. 가용성은 지역에 따라 다릅니다. 해당 하위 지역에 GPT-4가 표시되지 않을 경우, 나중에 다시 확인합니다.

이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

GPT-4 버전 0314는 릴리스된 모델의 첫 번째 버전입니다. 버전 0613은 모델의 두 번째 버전이며 함수 호출 지원을 추가합니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

참고 항목

gpt-4gpt-4-32k의 버전 0314는 2024년 7월 5일 이후에 사용 중지됩니다. gpt-4gpt-4-32k의 버전 0613는 2024년 9월 30일 이후에 사용 중지됩니다. 모델 업그레이드 동작은 모델 업데이트를 참조하세요.

GPT-4 버전 0125-preview는 이전에 버전 1106-preview로 릴리스된 GPT-4 Turbo 미리 보기의 업데이트된 버전입니다. GPT-4 버전 0125-preview는 gpt-4-1106-preview에 비해 코드 생성과 같은 작업을 완전히 완료합니다. 이때문에 태스크에 따라 고객은 GPT-4-0125-preview가 gpt-4-1106-preview에 비해 더 많은 출력을 생성한다는 것을 알 수 있습니다. 고객은 새 모델의 출력을 비교하는 것이 좋습니다. GPT-4-0125-preview는 영어가 아닌 언어에 대해 UTF-8 처리를 사용하여 gpt-4-1106-preview의 버그도 해결합니다.

Important

  • gpt-4 버전 1106-미리 보기 및 0125-미리 보기는 향후 안정적인 버전의 gpt-4(으)로 업그레이드될 예정입니다. 2024년 3월 8일로 예정된 gpt-4 1106-미리 보기를 gpt-4 0125-미리 보기로의 배포 업그레이드는 더 이상 진행되지 않습니다. 안정적인 버전이 릴리스된 후 gpt-4 버전 1106-미리 보기 및 0125-미리 보기가 "기본값으로 자동 업데이트" 및 "만료된 경우 업그레이드"로 설정된 배포가 업그레이드되기 시작합니다. 각 배포에 대해 모델 버전 업그레이드는 API 호출에 대한 서비스 중단 없이 발생합니다. 업그레이드는 지역별로 준비되며 전체 업그레이드 프로세스는 2주가 걸릴 것으로 예상됩니다. "자동 업그레이드 안 함"으로 설정된 gpt-4 버전 1106-미리 보기 및 0125-미리 보기의 배포는 업그레이드되지 않으며 지역에서 미리 보기 버전이 업그레이드되면 작동이 중지됩니다.
Model ID 최대 요청(토큰) 학습 데이터(최대)
gpt-4(0314) 8,192 2021년 9월
gpt-4-32k(0314) 32,768 2021년 9월
gpt-4(0613) 8,192 2021년 9월
gpt-4-32k(0613) 32,768 2021년 9월
gpt-4 (1106-미리 보기)1
GPT-4 Turbo 미리 보기
입력: 128,000
출력: 4,096
2023년 4월
gpt-4 (0125-미리 보기)1
GPT-4 Turbo 미리 보기
입력: 128,000
출력: 4,096
2023년 12월
gpt-4(vision-preview)2
GPT-4 Turbo with Vision 미리 보기
입력: 128,000
출력: 4,096
2023년 4월

1 GPT-4 Turbo 미리 보기 = gpt-4 (0125-미리 보기) or gpt-4 (1106-미리 보기). 이 모델을 배포하려면 배포에서 모델 gpt-4를 선택합니다. 버전에서 (0125-미리 보기) 또는 (1106-미리 보기) 선택.

2 GPT-4 Turbo with Vision 미리 보기 = gpt-4(vision-preview). 이 모델을 배포하려면 배포에서 모델 gpt-4를 선택합니다. 모델 버전경우 vision-preview를 선택합니다.

주의

프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 및 안정적인 버전으로 업그레이드할 예정입니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

참고 항목

GPT-4(0314) 및 (0613)가 사용 가능한 것으로 나열된 지역은 8K 및 32K 버전의 모델에 모두 액세스할 수 있습니다.

GPT-4 및 GPT-4 Turbo Preview 모델 가용성

퍼블릭 클라우드 지역

지역 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, vision-미리 보기 gpt-4-32k, 0613
australiaeast -
canadaeast - -
eastus - - - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - - -
norwayeast - - - -
southcentralus - - - -
southindia - - - -
스웨덴 중부 -
스위스 북부 - -
uksouth - - -
westus - - -

고객 액세스 선택

모든 Azure OpenAI 고객이 사용할 수 있는 위의 지역 외에도 일부 기존 고객은 추가 지역에서 GPT-4 버전에 대한 액세스 권한을 부여했습니다.

모델 지역
gpt-4(0314) 미국 동부
프랑스 중부
미국 중남부
영국 남부
gpt-4(0613) 미국 동부
미국 동부 2
일본 동부
영국 남부

Azure Government 지역

Azure Government에서 사용할 수 있는 GPT-4 모델은 다음과 같습니다.

Model ID 모델 가용성
gpt-4 (1106-미리 보기) US Gov 버지니아
US Gov 애리조나

GPT-3.5 모델

Important

NEW gpt-35-turbo (0125) 모델에는 요청된 형식의 응답 정확도 향상 및 영어 이외의 언어 함수 호출에 대한 텍스트 인코딩 문제를 발생시킨 버그 수정 등 다양한 개선 사항이 있습니다.

GPT-3.5 Turbo는 채팅 완료 API와 함께 사용됩니다. GPT-3.5 Turbo 버전 0301은 Completions API와 함께 사용할 수도 있지만 권장되지는 않습니다. GPT-3.5 Turbo 버전 0613 및 1106은 채팅 완료 API만 지원합니다.

GPT-3.5 Turbo 버전 0301은 릴리스된 모델의 첫 번째 버전입니다. 버전 0613은 모델의 두 번째 버전이며 함수 호출 지원을 추가합니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

참고 항목

gpt-35-turbogpt-35-turbo-16k의 버전 0613(은)는 2024년 8월 1일 이전에 사용 중지됩니다. gpt-35-turbo의 버전 0301(은)는 2024년 8월 1일 이전에 사용 중지됩니다. 모델 업그레이드 동작은 모델 업데이트를 참조하세요.

Model ID 최대 요청(토큰) 학습 데이터(최대)
gpt-35-turbo1(0301) 4,096 2021년 9월
gpt-35-turbo(0613) 4,096 2021년 9월
gpt-35-turbo-16k(0613) 16,384 2021년 9월
gpt-35-turbo-instruct(0914) 4,097 2021년 9월
gpt-35-turbo(1106) 입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo (0125) 신규 입력: 16,385
출력: 4,096
2021년 9월

GPT-3.5-Turbo 모델 가용성

퍼블릭 클라우드 지역

지역 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
스웨덴 중부 - -
스위스 북부 - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 이 모델은 4,096개의 > 토큰 요청을 수락합니다. 최신 버전의 모델이 4,096개의 토큰으로 제한되므로 4,096개의 입력 토큰 제한을 초과하지 않는 것이 좋습니다. 이 모델에서 4,096개의 입력 토큰을 초과할 때 문제가 발생하는 경우 이 구성은 공식적으로 지원되지 않습니다.

Azure Government 지역

다음 GPT-3.5 터보 모델은 Azure Government와 사용할 수 있습니다.

Model ID 모델 가용성
gpt-35-turbo (1106-미리 보기) US Gov 버지니아

임베딩 모델

이러한 모델은 포함 API 요청에만 사용할 수 있습니다.

참고 항목

text-embedding-3-large(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002(을)를 사용하여 text-embedding-3-large(으)로 마이그레이션하려면 새 포함을 생성해야 합니다.

Model ID 최대 요청(토큰) 출력 크기 학습 데이터(최대)
text-embedding-ada-002(버전 2) 8,191 1,536 2021년 9월
text-embedding-ada-002(버전 1) 2,046 1,536 2021년 9월
text-embedding-3-large 8,191 3,072 2021년 9월
text-embedding-3-small 8,191 1,536 2021년 9월

참고 항목

포함을 위한 입력 배열을 보낼 때 포함 엔드포인트에 대한 호출당 배열의 최대 입력 항목 수는 2048입니다.

퍼블릭 클라우드 지역

지역 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
스웨덴 중부 - - -
스위스 북부 - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government 지역

Azure Government에서 사용할 수 있는 포함 모델은 다음과 같습니다.

Model ID 모델 가용성
text-embedding-ada-002(버전 2) US Gov 버지니아
US Gov 애리조나

DALL-E 모델

Model ID 기능 가용성 최대 요청(문자)
dalle2(미리 보기) 미국 동부 1,000
dall-e-3 미국 동부, 오스트레일리아 동부, 스웨덴 중부 4,000

모델 미세 조정

babbage-002davinci-002는 지침을 따르도록 학습되지 않았습니다. 이러한 기본 모델 쿼리는 학습 진행률을 평가하기 위해 미세 조정된 버전에 대한 참조 지점으로만 수행해야 합니다.

gpt-35-turbo - 이 모델의 미세 조정은 하위 지역 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서 사용할 수 있는 것은 아닙니다.

Model ID 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
babbage-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
davinci-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
gpt-35-turbo(0613) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
4,096 2021년 9월
gpt-35-turbo(1106) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo (0125) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
16,385 2021년 9월

Whisper 모델

Model ID 모델 가용성 최대 요청(오디오 파일 크기)
whisper 미국 동부 2
미국 중북부
노르웨이 동부
인도 남부
스웨덴 중부
서유럽
25MB

텍스트 음성 변환 모델(미리 보기)

Model ID 모델 가용성
tts-1 미국 중북부
스웨덴 중부
tts-1-hd 미국 중북부
스웨덴 중부

도우미(미리 보기)

도우미의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 다음 모델은 Assistants API, SDK, Azure AI Studio 및 Azure OpenAI Studio에서 사용할 수 있습니다. 다음 표는 종량제에 대한 것입니다. 프로비전된 처리량 단위(PTU) 가용성에 대한 자세한 내용은 프로비전된 처리량을 참조하세요.

지역 gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
오스트레일리아 동부
미국 동부
미국 동부 2
프랑스 중부
노르웨이 동부
스웨덴 중부
영국 남부

다음 단계