Azure OpenAI Service 모델

Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역에 따라 다릅니다. 2024년 7월에 만료되는 GPT-3 및 기타 모델에 대해서는 Azure OpenAI 서비스 레거시 모델을 참조하세요.

모델 설명
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
GPT-3.5 GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
포함 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다.
DALL-E(미리 보기) 자연어에서 원본 이미지를 생성할 수 있는 일련의 미리 보기 모델입니다.
Whisper(미리 보기) 음성을 텍스트로 기록하고 번역할 수 있는 일련의 미리 보기 모델입니다.
텍스트 음성 변환(미리 보기) 텍스트 음성 변환을 합성할 수 있는 미리 보기의 일련의 모델입니다.

GPT-4 및 GPT-4 터보 미리 보기

GPT-4는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있습니다. GPT-3.5 Turbo와 마찬가지로 GPT-4는 채팅에 최적화되어 있고 기존 완료 작업에 적합합니다. GPT-4를 사용하려면 채팅 Completions API를 사용합니다. GPT-4 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

  • gpt-4
  • gpt-4-32k
  • gpt-4-vision

모델 요약 테이블의 각 모델에서 지원하는 토큰 컨텍스트 길이를 볼 수 있습니다.

GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 완료 작업에도 잘 작동합니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct에는 채팅 완료 API 대신 완료 API를 사용하는 text-davinci-003과 유사한 기능이 있습니다. 레거시 GPT-3.5 및 GPT-3 모델보다는 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

모델 요약 테이블의 각 모델에서 지원하는 토큰 컨텍스트 길이를 볼 수 있습니다.

GPT-3.5 Turbo 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

포함

Important

text-embedding-ada-002 (Version 2)를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.

이전 포함 모델은 다음과 같은 새로운 교체 모델로 통합되었습니다.

text-embedding-ada-002

DALL-E(미리 보기)

현재 미리 보기 중인 DALL-E 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다.

Whisper(미리 보기)

현재 미리 보기 중인 Whisper 모델은 음성을 텍스트로 변환하는 데 사용할 수 있습니다.

Azure AI 음성 일괄 처리 대화 기록 API를 통해 Whisper 모델을 사용할 수도 있습니다. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

텍스트 음성 변환(미리 보기)

현재 미리 보기 상태인 OpenAI 텍스트 음성 변환 모델을 사용하여 텍스트 음성 변환을 합성할 수 있습니다.

OpenAI 텍스트를 사용하여 Azure AI Speech를 통해 음성을 음성으로 변환할 수도 있습니다. 자세한 내용은 Azure OpenAI 서비스 또는 Azure AI Speech 가이드를 통해 OpenAI 텍스트 음성 변환 음성을 참조하세요.

모델 요약 테이블 및 지역 가용성

GPT-4 및 GPT-4 터보 미리 보기 모델

이제 모든 Azure OpenAI 서비스 고객이 GPT-4, GPT-4-32k 및 GPT-4 Turbo with Vision을 사용할 수 있습니다. 가용성은 지역에 따라 다릅니다. 해당 하위 지역에 GPT-4가 표시되지 않을 경우, 나중에 다시 확인합니다.

이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

GPT-4 버전 0314는 릴리스된 모델의 첫 번째 버전입니다. 버전 0613은 모델의 두 번째 버전이며 함수 호출 지원을 추가합니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법과 모델을 사용하여 GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

참고 항목

gpt-4 2024년 7월 5일 이전 버전 0314gpt-4-32k 사용 중지됩니다. gpt-4 2024년 9월 30일 이전 버전 0613gpt-4-32k 사용 중지됩니다. 모델 업그레이드 동작은 모델 업데이트를 참조하세요.

GPT-4 버전 0125-preview는 이전에 버전 1106-preview로 릴리스된 GPT-4 Turbo 미리 보기의 업데이트된 버전입니다. GPT-4 버전 0125-preview는 gpt-4-1106-preview에 비해 코드 생성과 같은 작업을 완전히 완료합니다. 이 때문에 작업에 따라 고객은 GPT-4-0125-preview가 gpt-4-1106-preview에 비해 더 많은 출력을 생성한다는 것을 알 수 있습니다. 고객은 새 모델의 출력을 비교하는 것이 좋습니다. GPT-4-0125-preview는 영어가 아닌 언어에 대한 UTF-8 처리를 사용하여 gpt-4-1106-preview의 버그도 해결합니다.

Important

  • gpt-4 버전 0125-preview는 버전 1106-preview를 대체합니다. 버전 1106 미리 보기가 gpt-4 "기본값으로 자동 업데이트" 및 "만료된 경우 업그레이드"로 설정된 배포는 2024년 2월 20일에 업그레이드되기 시작하고 2주 이내에 업그레이드를 완료합니다. gpt-4"자동 업데이트 없음"으로 설정된 버전 1106 미리 보기 배포는 2024년 2월 20일부터 작동이 중지됩니다. 버전 1106 미리 보기 배포가 있는 경우 아래의 gpt-4 사용 가능한 지역에서 버전을 0125-preview 테스트할 수 있습니다.
Model ID 최대 요청(토큰) 학습 데이터(최대)
gpt-4 (0314) 8,192 2021년 9월
gpt-4-32k(0314) 32,768 2021년 9월
gpt-4(0613) 8,192 2021년 9월
gpt-4-32k(0613) 32,768 2021년 9월
gpt-4 (1106-preview)1
GPT-4 Turbo Preview
입력: 128,000
출력: 4,096
2023년 4월
gpt-4 (0125-preview)1
GPT-4 Turbo Preview
입력: 128,000
출력: 4,096
2023년 4월
gpt-4 (vision-preview)2
GPT-4 Turbo with Vision Preview
입력: 128,000
출력: 4,096
2023년 4월

1 GPT-4 Turbo Preview = gpt-4 (0125-preview). 이 모델을 배포하려면 배포에서 모델 gpt-4를 선택합니다. 모델 버전의 경우 0125-preview를 선택합니다.

2 GPT-4 Turbo with Vision Preview = gpt-4 (vision-preview). 이 모델을 배포하려면 배포에서 모델 gpt-4를 선택합니다. 모델 버전의 경우 vision-preview를 선택합니다.

주의

프로덕션 환경에서 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 및 안정적인 버전으로 업그레이드할 예정입니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

참고 항목

GPT-4(0314) 및 (0613)가 사용 가능한 것으로 나열된 지역은 8K 및 32K 버전의 모델에 모두 액세스할 수 있습니다.

GPT-4 및 GPT-4 Turbo Preview 모델 가용성

퍼블릭 클라우드 지역

모델 Azure OpenAI 액세스 권한이 있는 모든 구독에서 모델을 사용할 수 있는 지역 해당 모델/지역에 대한 이전 액세스 권한이 있는 구독에서만 모델을 사용할 수 있는 지역
gpt-4 (0314) 미국 동부
프랑스 중부
미국 중남부
영국 남부
gpt-4 (0613) 오스트레일리아 동부
캐나다 동부
프랑스 중부
스웨덴 중부
스위스 북부
미국 동부
미국 동부 2
일본 동부
영국 남부
gpt-4(1106-preview) 오스트레일리아 동부
캐나다 동부
미국 동부 2
프랑스 중부
노르웨이 동부
인도 남부
스웨덴 중부
영국 남부
미국 서부
gpt-4(0125-preview) 미국 동부
미국 중북부
미국 중남부
gpt-4(vision-preview) 스웨덴 중부
미국 서부
일본 동부
스위스 북부
오스트레일리아 동부

Azure Government 지역

Azure Government에서 사용할 수 있는 GPT-4 모델은 다음과 같습니다.

Model ID 모델 가용성
gpt-4 (1106-preview) US Gov 버지니아
US Gov 애리조나

GPT-3.5 모델

GPT-3.5 Turbo는 채팅 완료 API와 함께 사용됩니다. GPT-3.5 Turbo 버전 0301은 Completions API와 함께 사용할 수도 있습니다. GPT-3.5 Turbo 버전 0613 및 1106은 채팅 완료 API만 지원합니다.

GPT-3.5 Turbo 버전 0301은 릴리스된 모델의 첫 번째 버전입니다. 버전 0613은 모델의 두 번째 버전이며 함수 호출 지원을 추가합니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법과 모델 작업을 통해 GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

참고 항목

gpt-35-turbo 2024년 6월 13일 이전 버전 0613gpt-35-turbo-16k 사용 중지됩니다. 버전은 0301gpt-35-turbo 2024년 7월 5일 이전에 사용 중지됩니다. 모델 업그레이드 동작은 모델 업데이트를 참조하세요.

GPT-3.5-Turbo 모델 가용성

퍼블릭 클라우드 지역

Model ID 모델 가용성 최대 요청(토큰) 학습 데이터(최대)
gpt-35-turbo1(0301) 미국 동부
프랑스 중부
미국 중남부
영국 남부
서유럽
4,096 2021년 9월
gpt-35-turbo(0613) 오스트레일리아 동부
캐나다 동부
미국 동부
미국 동부 2
프랑스 중부
일본 동부
미국 중북부
스웨덴 중부
스위스 북부
영국 남부
4,096 2021년 9월
gpt-35-turbo-16k(0613) 오스트레일리아 동부
캐나다 동부
미국 동부
미국 동부 2
프랑스 중부
일본 동부
미국 중북부
스웨덴 중부
스위스 북부
영국 남부
16,384 2021년 9월
gpt-35-turbo-instruct(0914) 미국 동부
스웨덴 중부
4,097 2021년 9월
gpt-35-turbo (1106) 오스트레일리아 동부
캐나다 동부
프랑스 중부
인도 남부
스웨덴 중부
영국 남부
미국 서부
입력: 16,385
출력: 4,096
2021년 9월

1 이 모델은 4,096개의 > 토큰 요청을 수락합니다. 최신 버전의 모델이 4,096개의 토큰으로 제한되므로 4,096개의 입력 토큰 제한을 초과하지 않는 것이 좋습니다. 이 모델을 사용하여 4,096개의 입력 토큰을 초과할 때 문제가 발생하는 경우 이 구성은 공식적으로 지원되지 않습니다.

임베딩 모델

이러한 모델은 API 요청 포함에만 사용할 수 있습니다.

참고 항목

text-embedding-ada-002 (Version 2)를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.

Model ID 모델 가용성 최대 요청(토큰) 학습 데이터(최대) 출력 차원
text-embedding-ada-002 (버전 2) 오스트레일리아 동부
캐나다 동부
미국 동부
미국 동부 2
프랑스 중부
일본 동부
미국 중북부
노르웨이 동부
미국 중남부
스웨덴 중부
스위스 북부
영국 남부
서유럽
미국 서부
8,191 2021년 9월 1,536
text-embedding-ada-002 (버전 1) 미국 동부
미국 중남부
서유럽
2,046 2021년 9월 1,536

참고 항목

포함을 위해 입력 배열을 보낼 때 포함 엔드포인트에 대한 호출당 배열의 최대 입력 항목 수는 2048입니다.

Azure Government 지역

다음 Embeddings 모델은 Azure Government에서 사용할 수 있습니다.

Model ID 모델 가용성
text-embedding-ada-002 (버전 2) US Gov 버지니아
US Gov 애리조나

DALL-E 모델(미리 보기)

Model ID 기능 가용성 최대 요청(문자)
dalle2 미국 동부 1,000
dalle3 스웨덴 중부 4,000

모델 미세 조정

babbage-002 지침을 davinci-002 따르도록 학습되지 않습니다. 이러한 기본 모델 쿼리는 학습 진행률을 평가하기 위해 미세 조정된 버전에 대한 참조 지점으로만 수행해야 합니다.

gpt-35-turbo-0613 - 이 모델의 미세 조정은 하위 지역 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서는 사용할 수 없습니다.

Model ID 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
babbage-002 미국 중북부
스웨덴 중부
16,384 2021년 9월
davinci-002 미국 중북부
스웨덴 중부
16,384 2021년 9월
gpt-35-turbo(0613) 미국 중북부
스웨덴 중부
4,096 2021년 9월
gpt-35-turbo (1106) 미국 중북부
스웨덴 중부
입력: 16,385
출력: 4,096
2021년 9월

Whisper 모델(미리 보기)

Model ID 모델 가용성 최대 요청(오디오 파일 크기)
whisper 미국 중북부
서유럽
25MB

텍스트 음성 변환 모델(미리 보기)

Model ID 모델 가용성
tts-1 미국 중북부
스웨덴 중부
tts-1-hd 미국 중북부
스웨덴 중부

도우미(미리 보기)

Assistants의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 예를 들어 병렬 함수 호출에는 최신 1106 모델이 필요합니다.

지역 gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106)
오스트레일리아 동부
미국 동부 2
스웨덴 중부

다음 단계