다음을 통해 공유


Azure OpenAI Service 모델

Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역 및 클라우드에 따라 다릅니다. Azure Government 모델 가용성은 Azure Government OpenAI Service를 참조하세요.

모델 설명
o1-preview 및 o1-mini 제한된 액세스 모델, 특히 향상된 포커스와 기능으로 추론 및 문제 해결 작업을 해결하도록 설계되었습니다.
GPT-4o 및 GPT-4o mini 및 GPT-4 Turbo 텍스트와 이미지를 모두 입력으로 허용할 수 있는 다중 모달 버전을 갖춘 가장 유능한 최신 Azure OpenAI 모델입니다.
GPT-4o 오디오 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원하는 GPT-4o 모델입니다.
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
GPT-3.5 GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
포함 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다.
DALL-E 자연어에서 원본 이미지를 생성할 수 있는 일련의 모델입니다.
위스퍼 음성을 텍스트로 기록하고 번역할 수 있는 일련의 미리 보기 모델입니다.
텍스트 음성 변환(미리 보기) 텍스트 음성 변환을 합성할 수 있는 일련의 미리 보기 모델입니다.

o1-preview 및 o1-mini 모델 제한된 액세스

Azure OpenAI o1-previewo1-mini 모델은 포커스 및 기능 향상을 통해 추론 및 문제 해결 작업을 해결하도록 특별히 설계되었습니다. 이러한 모델은 사용자의 요청을 처리하고 이해하는 데 더 많은 시간을 할애하여 이전 반복에 비해 과학, 코딩, 수학과 같은 영역에서 매우 강력한 성능을 보입니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
o1-preview (2024-09-12) 향상된 추론 능력을 제공하는 o1 시리즈에서 가장 유능한 모델입니다. 입력: 128,000
출력: 32,768
2023년 10월
o1-mini (2024-09-12) o1 시리즈의 더 빠르고 비용 효율적인 옵션으로, 속도와 리소스 사용량이 낮은 코딩 작업에 적합합니다. 입력: 128,000
출력: 65,536
2023년 10월

가용성

이제 API o1-preview 액세스 및 o1-mini 모델 배포에 모델 및 모델을 사용할 수 있습니다. 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다.

액세스 요청: 모델에 대한 제한된 액세스 신청서

액세스 권한이 부여되면 각 모델에 대한 배포를 만들어야 합니다.

API 지원

o1 시리즈 모델에 대한 지원이 API 버전2024-09-01-preview에 추가되었습니다.

매개 변수가 max_tokens 더 이상 사용되지 않으며 새 max_completion_tokens 매개 변수로 대체되었습니다. o1 시리즈 모델은 매개 변수에서 max_completion_tokens 만 작동합니다.

사용

이러한 모델은 현재 채팅 완료 API를 사용하는 다른 모델과 동일한 매개 변수 집합을 지원하지 않습니다. 현재 매우 제한된 하위 집합만 지원되므로 , top_p같은 temperature일반적인 매개 변수는 사용할 수 없으며 포함하면 요청이 실패합니다. o1-preview 또한 o1-mini 모델은 메시지 배열의 일부로 시스템 메시지 역할을 수락하지 않습니다.

max_completion_tokens 매개 변수를 활용하려면 OpenAI Python 라이브러리 버전을 업그레이드해야 할 수 있습니다.

pip install openai --upgrade

인증에 Microsoft Entra ID를 사용하는 경우 Microsoft Entra ID 인증을 사용하여 Azure OpenAI 서비스를 구성하는 방법을 참조하세요.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

사용 가능 지역

승인된 고객을 위해 미국 동부 2 및 스웨덴 중부의 표준 및 글로벌 표준 배포에 사용할 수 있습니다.

GPT-4o 오디오

gpt-4o-realtime-preview 모델은 GPT-4o 모델 제품군의 일부이며 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원합니다. GPT-4o 오디오는 실시간 대기 시간이 짧은 대화형 상호 작용을 처리하도록 설계되어 사용자와의 응답성이 높은 지원 에이전트, 도우미, 번역기 및 기타 사용 사례에 적합합니다.

GPT-4o 오디오는 미국 동부 2() 및 스웨덴 중부(eastus2swedencentral) 지역에서 사용할 수 있습니다. GPT-4o 오디오 를 사용하려면 지원되는 지역 중 하나에서 기존 리소스를 만들 거나 사용해야 합니다.

리소스를 만들 때 GPT-4o 오디오 모델을 배포할 수 있습니다. 프로그래밍 방식 배포 를 수행하는 경우 모델 이름은 .입니다 gpt-4o-realtime-preview. GPT-4o 오디오를 사용하는 방법에 대한 자세한 내용은 GPT-4o 오디오 설명서를 참조 하세요.

최대 요청 토큰 및 학습 데이터에 대한 자세한 내용은 다음 표에서 확인할 수 있습니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-4o-realtime-preview (2024-10-01-preview)
GPT-4o 오디오
실시간 오디오 처리를 위한 오디오 모델 입력: 128,000
출력: 4,096
2023년 10월

GPT-4o 및 GPT-4 Turbo

GPT-4o는 텍스트와 이미지를 단일 모델에 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다. GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

GPT-4o 및 GPT-4o mini 모델에 어떻게 액세스할 수 있나요?

GPT-4o 및 GPT-4o mini는 표준글로벌 표준 모델 배포에 사용할 수 있습니다.

모델을 사용할 수 있는 지원 표준 또는 글로벌 표준 지역에서 기존 리소스를 만들거나 사용해야 합니다.

리소스가 만들어지면 GPT-4o 모델을 배포할 수 있습니다. 프로그래밍 방식으로 배포하는 경우 모델 이름은 다음과 같습니다.

  • gpt-4o 버전 2024-08-06
  • gpt-4o, 버전 2024-05-13
  • gpt-4o-mini 버전 2024-07-18

GPT-4 Turbo

GPT-4 Turbo는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있는 큰 멀티모달 모델(텍스트 또는 이미지 입력 허용 및 텍스트 생성)입니다. GPT-3.5 Turbo와 마찬가지로 이전 GPT-4 모델 GPT-4 Turbo는 채팅에 최적화되어 있으며 기존 완료 작업에 적합합니다.

GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.

  • gpt-4 버전: turbo-2024-04-09

이는 다음 미리 보기 모델을 대체합니다.

  • gpt-4 버전: 1106-Preview
  • gpt-4 버전: 0125-Preview
  • gpt-4 버전: vision-preview

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

  • OpenAI의 최신 0409 터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다.
  • Azure OpenAI의 최신 turbo-2024-04-09 버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url 및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.

gpt-4 vision-preview와의 차이점

  • GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은 gpt-4 버전: turbo-2024-04-09에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.

GPT-4 Turbo 프로비전된 관리 가용성

  • gpt-4 버전: turbo-2024-04-09은(는) 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.

GPT-4 Turbo with Vision GA 배포

Studio UI에서 GA 모델을 배포하려면 GPT-4를 선택한 다음 드롭다운 메뉴에서 turbo-2024-04-09 버전을 선택합니다. gpt-4-turbo-2024-04-09 모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.

GPT-4

GPT-4는 GPT-4 Turbo의 선행 버전입니다. GPT-4 및 GPT-4 Turbo 모델 모두 기본 모델 이름은 gpt-4입니다. 모델 버전을 검사하여 GPT-4와 Turbo 모델을 구분할 수 있습니다.

  • gpt-4 버전 0314
  • gpt-4 버전 0613
  • gpt-4-32k 버전 0613

모델 요약 표에서 각 모델이 지원하는 토큰 컨텍스트 길이를 확인할 수 있습니다.

GPT-4 및 GPT-4 Turbo 모델

  • 이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-4o(2024-08-06)
GPT-4o(Omni)
최신 대규모 GA 모델
- 구조적 출력
- 텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
- 정확도와 반응성 향상
- GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티
- 영어 이외의 언어 및 비전 작업에서 뛰어난 성능
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o-mini(2024-07-18)
GPT-4o mini
최신 소규모 GA 모델
- GPT-3.5 Turbo 시리즈 모델을 대체하는 데 이상적인 빠르고 저렴하며 성능이 좋은 모델입니다.
- 텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o(2024-05-13)
GPT-4o(Omni)
텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
- 정확도와 반응성 향상
- GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티
- 영어 이외의 언어 및 비전 작업에서 뛰어난 성능
입력: 128,000
출력: 4,096
2023년 10월
gpt-4(turbo-2024-04-09)
비전 포함 GPT-4 Turbo
새 GA 모델
- 이전의 모든 GPT-4 미리 보기 모델(vision-preview, 1106-Preview, 0125-Preview)을 바꿉니다.
- 기능 제공 여부는 현재 입력 방법 및 배포 유형에 따라 다릅니다.
입력: 128,000
출력: 4,096
2023년 12월
gpt-4(0125-Preview)*
GPT-4 Turbo 미리 보기
미리 보기 모델
- 1106-Preview 대체
- 코드 생성 성능 향상
- 모델이 작업을 완료하지 않는 경우 감소
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 12월
gpt-4(vision-preview)
GPT-4 Turbo with Vision 미리 보기
미리 보기 모델
- 텍스트 및 이미지 입력 허용
- 강화 지원
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 4월
gpt-4 (1106-미리 보기)
GPT-4 Turbo 미리 보기
미리 보기 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 4월
gpt-4-32k(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
32,768 2021년 9월
gpt-4(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
8,192 2021년 9월
gpt-4-32k(0314) 이전 GA 모델
- 사용 중지 정보
32,768 2021년 9월
gpt-4(0314) 이전 GA 모델
- 사용 중지 정보
8,192 2021년 9월

주의

프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적인 최신 GA 버전으로 업그레이드합니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

  • GPT-4 버전 0125-preview는 이전에 버전 1106-preview로 릴리스된 GPT-4 Turbo 미리 보기의 업데이트된 버전입니다.
  • GPT-4 버전 0125-preview는 gpt-4-1106-preview에 비해 코드 생성과 같은 작업을 완전히 완료합니다. 이때문에 태스크에 따라 고객은 GPT-4-0125-preview가 gpt-4-1106-preview에 비해 더 많은 출력을 생성한다는 것을 알 수 있습니다. 고객은 새 모델의 출력을 비교하는 것이 좋습니다. GPT-4-0125-preview는 영어가 아닌 언어에 대해 UTF-8 처리를 사용하여 gpt-4-1106-preview의 버그도 해결합니다.
  • GPT-4 버전 turbo-2024-04-09(은)는 최신 GA 릴리스이며 0125-Preview, 1106-previewvision-preview(을)를 대체합니다.

Important

GPT-4(gpt-4) 버전1106-Preview0125-Preview이며vision-preview, 향후 안정적인 버전 gpt-4 으로 업그레이드될 예정입니다.

  • gpt-4 버전 1106-Preview0125-Preview배포 및 vision-preview "기본값으로 자동 업데이트" 및 "만료되면 업그레이드"로 설정하면 안정적인 버전이 릴리스된 후 업그레이드가 시작됩니다. 각 배포에 대해 모델 버전 업그레이드는 API 호출에 대한 서비스 중단 없이 발생합니다. 업그레이드는 지역별로 준비되며 전체 업그레이드 프로세스는 2주가 걸릴 것으로 예상됩니다.
  • gpt-4"자동 업데이트 없음"으로 설정된 버전의 1106-Preview0125-Previewvision-preview 배포는 업그레이드되지 않으며 지역에서 미리 보기 버전이 업그레이드될 때 작동이 중지됩니다. 업그레이드 시기에 대한 자세한 내용은 Azure OpenAI 모델 사용 중지 및 사용 중단을 참조하세요.

GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 완료 작업에도 잘 작동합니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct에는 채팅 완료 API 대신 완료 API를 사용하는 text-davinci-003과 유사한 기능이 있습니다. 레거시 GPT-3.5 및 GPT-3 모델보다는 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-35-turbo (0125) 신규 최신 GA 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
- 요청된 형식으로 응답할 때 높아지는 정확도
- 영어 이외의 언어 함수 호출에서 텍스트 인코딩 문제를 발생시킨 버그 수정
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo(1106) 이전 GA 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo-instruct(0914) 완성 엔드포인트만
- 레거시 완료 모델 대체
4,097 2021년 9월
gpt-35-turbo-16k(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
16,384 2021년 9월
gpt-35-turbo(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
4,096 2021년 9월
gpt-35-turbo1(0301) 이전 GA 모델
- 사용 중지 정보
4,096 2021년 9월

GPT-3.5 Turbo 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

1 이 모델은 4,096개의 > 토큰 요청을 수락합니다. 최신 버전의 모델이 4,096개의 토큰으로 제한되므로 4,096개의 입력 토큰 제한을 초과하지 않는 것이 좋습니다. 이 모델에서 4,096개의 입력 토큰을 초과할 때 문제가 발생하는 경우 이 구성은 공식적으로 지원되지 않습니다.

포함

text-embedding-3-large(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함된 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002 사용에서 text-embedding-3-large(으)로 이동하려면 새 포함을 생성해야 합니다.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

테스트에서 OpenAI는 MTEB 벤치마크를 사용하여 영어 작업에 대한 성능을 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 임베딩 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.

평가 벤치마크 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 평균 31.4 44.0 54.9
MTEB 평균 61.0 62.3 64.6

3세대 포함 모델은 새 dimensions 매개 변수를 통해 포함 크기를 줄일 수 있습니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. dimensions 매개 변수는 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전인 pip install openai --upgrade(으)로 업그레이드하는 것이 좋습니다.

OpenAI의 MTEB 벤치마크 테스트에 따르면 3세대 모델의 차원이 text-embeddings-ada-002 1,536차원 미만으로 감소하더라도 성능은 약간 향상됩니다.

DALL-E

DALL-E 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다. DALL-E 3은 일반적으로 REST API와 함께 사용할 수 있습니다. 클라이언트 SDK를 사용하는 DALL-E 2 및 DALL-E 3은 미리 보기로 제공됩니다.

위스퍼

현재 미리 보기 중인 위스퍼 모델은 음성 텍스트 변환에 사용할 수 있습니다.

Azure AI 음성 일괄 처리 대화 기록 API를 통해 Whisper 모델을 사용할 수도 있습니다. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

텍스트 음성 변환(미리 보기)

현재 미리 보기로 제공되는 OpenAI 텍스트 음성 변환 모델은 텍스트 음성 변환을 합성하는 데 사용할 수 있습니다.

Azure AI Speech를 통해 OpenAI 텍스트 음성 변환 음성을 사용할 수도 있습니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 변환 음성 가이드를 참조하세요.

모델 요약 테이블 및 지역 가용성

참고 항목

이 문서에서는 주로 표준 배포 유형을 사용하는 모든 Azure OpenAI 고객에게 적용되는 모델/지역 가용성을 다룹니다. 일부 선택 고객은 아래 통합 테이블에 나열되지 않은 모델/지역 조합에 액세스할 수 있습니다. 프로비전된 배포에 대한 자세한 내용은 프로비전된 지침을 참조하세요.

표준 배포 모델 가용성

지역 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, vision-미리 보기 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - - - - -
스웨덴 중부 - - - - - -
스위스 북부 - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

이 표에는 지역별 가용성 정보 미세 조정이 포함되어 있지 않습니다. 이 정보는 미세 조정 섹션을 참조하세요.

기본 할당량에 대한 자세한 내용은 할당량 및 제한 문서를 참조 하세요.

프로비전된 배포 모델 가용성

지역 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
brazilsouth - - -
canadacentral - - - - - - -
canadaeast - - - -
eastus
eastus2
francecentral - - -
germanywestcentral - - -
japaneast - - - -
koreacentral - - - -
northcentralus
norwayeast - - - - - - -
polandcentral - -
southafricanorth - - - - -
southcentralus - -
southindia - -
스웨덴 중부
스위스 북부 -
switzerlandwest - - - - - - - - -
uksouth - -
westus -
westus3 - -

참고 항목

gpt-4 버전: turbo-2024-04-09의 프로비전된 버전은 현재 텍스트로만 제한됩니다.

프로비전된 배포에 대한 자세한 내용은 프로비전된 지침을 참조하세요.

글로벌 표준 모델 가용성

지역 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01
australiaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus - - -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus - - -
norwayeast - - - -
polandcentral - - - -
southafricanorth - - - -
southcentralus - - -
southindia - - - -
스페인 중부 - - - -
스웨덴 중부
스위스 북부 - - - -
uksouth - - - -
westeurope - - - -
westus - - -
westus3 - - -

전역 프로비전된 관리형 모델 가용성

지역 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18
australiaeast
brazilsouth
canadacentral
canadaeast
eastus
eastus2
francecentral
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
polandcentral
southafricanorth
southcentralus
southindia
스페인 중부
스웨덴 중부
스위스 북부
switzerlandwest
uksouth
westeurope
westus
westus3

글로벌 일괄 처리 모델 가용성

지역 gpt-4, 0613 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
eastus
스웨덴 중부
westus

GPT-4 및 GPT-4 Turbo 모델 가용성

퍼블릭 클라우드 지역

지역 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, vision-미리 보기 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
australiaeast - - - - -
canadaeast - - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - -
northcentralus - - - -
norwayeast - - - - - - - -
southcentralus - - - -
southindia - - - - - - - -
스웨덴 중부 -
스위스 북부 - - - - - -
uksouth - - - - - - -
westus - - -
westus3 - - - -

고객 액세스 선택

모든 Azure OpenAI 고객이 사용할 수 있는 위의 지역 외에도 일부 기존 고객은 추가 지역에서 GPT-4 버전에 대한 액세스 권한을 부여했습니다.

모델 지역
gpt-4(0314)
gpt-4-32k(0314)
미국 동부
프랑스 중부
미국 중남부
영국 남부
gpt-4 (0613)
gpt-4-32k(0613)
미국 동부
미국 동부 2
일본 동부
영국 남부

GPT-3.5 모델

Important

NEW gpt-35-turbo (0125) 모델에는 요청된 형식의 응답 정확도 향상 및 영어 이외의 언어 함수 호출에 대한 텍스트 인코딩 문제를 발생시킨 버그 수정 등 다양한 개선 사항이 있습니다.

GPT-3.5 Turbo는 채팅 완료 API와 함께 사용됩니다. GPT-3.5 Turbo 버전 0301은 Completions API와 함께 사용할 수도 있지만 권장되지는 않습니다. GPT-3.5 Turbo 버전 0613 및 1106은 채팅 완료 API만 지원합니다.

GPT-3.5 Turbo 버전 0301은 릴리스된 모델의 첫 번째 버전입니다. 버전 0613은 모델의 두 번째 버전이며 함수 호출 지원을 추가합니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

GPT-3.5-Turbo 모델 가용성

퍼블릭 클라우드 지역

지역 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus -
eastus2 - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
스웨덴 중부 - -
스위스 북부 - - - -
uksouth - -
westeurope - - - - -
westus - - - -
westus3 - - - - -

임베딩 모델

이러한 모델은 포함 API 요청에만 사용할 수 있습니다.

참고 항목

text-embedding-3-large(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002(을)를 사용하여 text-embedding-3-large(으)로 마이그레이션하려면 새 포함을 생성해야 합니다.

Model ID 최대 요청(토큰) 출력 크기 학습 데이터(최대)
text-embedding-ada-002(버전 2) 8,191 1,536 2021년 9월
text-embedding-ada-002(버전 1) 2,046 1,536 2021년 9월
text-embedding-3-large 8,191 3,072 2021년 9월
text-embedding-3-small 8,191 1,536 2021년 9월

참고 항목

포함을 위한 입력 배열을 보낼 때 포함 엔드포인트에 대한 호출당 배열의 최대 입력 항목 수는 2048입니다.

퍼블릭 클라우드 지역

지역 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
norwayeast - -
southafricanorth - - -
southcentralus - -
southindia - -
스웨덴 중부 - -
스위스 북부 - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

DALL-E 모델

Model ID 기능 가용성 최대 요청(문자)
dalle2(미리 보기) 미국 동부 1,000
dall-e-3 미국 동부, 오스트레일리아 동부, 스웨덴 중부 4,000

모델 미세 조정

babbage-002davinci-002는 지침을 따르도록 학습되지 않았습니다. 이러한 기본 모델 쿼리는 학습 진행률을 평가하기 위해 미세 조정된 버전에 대한 참조 지점으로만 수행해야 합니다.

gpt-35-turbo - 이 모델의 미세 조정은 하위 지역 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서 사용할 수 있는 것은 아닙니다.

Model ID 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
babbage-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
davinci-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
gpt-35-turbo(0613) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
4,096 2021년 9월
gpt-35-turbo(1106) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo (0125) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
16,385 2021년 9월
gpt-4 (0613) 1 미국 중북부
스웨덴 중부
8192 2021년 9월
gpt-4o-mini 1(2024-07-18) 미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 64,536
2023년 10월
gpt-4o 1(2024-08-06) 미국 동부2
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 64,536
2023년 10월

1 GPT-4, GPT-4o 및 GPT-4o mini 미세 조정은 현재 공개 미리 보기로 제공됩니다. 자세한 내용은 GPT-4, GPT-4o 및 GPT-4o mini 미세 조정 안전성 평가 지침을 참조하세요.

Whisper 모델

Model ID 모델 가용성 최대 요청(오디오 파일 크기)
whisper 미국 동부 2
미국 중북부
노르웨이 동부
인도 남부
스웨덴 중부
서유럽
25MB

텍스트 음성 변환 모델(미리 보기)

Model ID 모델 가용성
tts-1 미국 중북부
스웨덴 중부
tts-1-hd 미국 중북부
스웨덴 중부

도우미(미리 보기)

도우미의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 다음 모델은 Assistants API, SDK, Azure AI Studio 및 Azure OpenAI Studio에서 사용할 수 있습니다. 다음 표는 종량제에 대한 것입니다. 프로비전된 처리량 단위(PTU) 가용성에 대한 자세한 내용은 프로비전된 처리량을 참조하세요. 나열된 모델과 지역은 Assistants v1과 v2 모두에서 사용할 수 있습니다. 아래 나열된 지역에서 지원되는 경우 글로벌 표준 모델을 사용할 수 있습니다.

지역 gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
오스트레일리아 동부
미국 동부
미국 동부 2
프랑스 중부
일본 동부
노르웨이 동부
스웨덴 중부
영국 남부
미국 서부
미국 서부 3

모델 사용 중지

모델 사용 중지에 대한 최신 정보는 모델 사용 중지 가이드를 참조하세요.

다음 단계