Azure OpenAI 서비스 모델

Azure OpenAI는 제품군 및 기능별로 그룹화된 다양한 모델에 대한 액세스를 제공합니다. 모델 제품군은 일반적으로 의도한 작업별로 모델을 연결합니다. 다음 표에서는 현재 Azure OpenAI에서 사용할 수 있는 모델 제품군에 대해 설명합니다. 현재 모든 지역에서 모든 모델을 사용할 수 있는 것은 아닙니다. 전체 분석은 이 문서의 모델 기능 표를 참조하세요.

모델 제품군 Description
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 생성할 뿐만 아니라 이해할 수 있는 일련의 모델입니다.
GPT-3 자연어를 이해하고 생성할 수 있는 일련의 모델입니다. 여기에는 새 ChatGPT 모델이 포함됩니다.
Codex 자연어를 코드로 번역하는 것을 포함하여 코드를 이해하고 생성할 수 있는 일련의 모델입니다.
포함 임베딩을 이해하고 사용할 수 있는 일련의 모델입니다. 포함은 기계 학습 모델 및 알고리즘에서 쉽게 활용할 수 있는 특수한 형식의 데이터 표현입니다. 포함은 텍스트 조각의 의미 체계적 의미에 대한 조밀한 정보 표현입니다. 현재 다양한 기능에 대해 세 가지(유사성, 텍스트 검색, 코드 검색) 임베딩 모델 제품군을 제공합니다.

모델 기능

각 모델 제품군에는 기능별로 더 구별되는 일련의 모델이 있습니다. 이러한 기능은 일반적으로 이름으로 식별되며, 이러한 이름의 사전순 순서는 일반적으로 지정된 모델 제품군 내에서 해당 모델의 상대적인 기능과 비용을 나타냅니다. 예를 들어 GPT-3 모델은 Ada, Babbage, Curie 및 Davinci와 같은 이름을 사용하여 상대적인 기능과 비용을 나타냅니다. Davinci는 Curie보다 더 유능하고 비용이 더 많이 듭니다. Curie는 Babbage보다 더 유능하고 비용이 더 많이 듭니다.

참고

역량이 더 낮은 모델(예: Ada)이 수행할 수 있는 작업은 역량이 더 높은 모델(예: Curie 또는 Davinci)이 수행할 수 있습니다.

명명 규칙

Azure OpenAI의 모델 이름은 일반적으로 다음과 같은 표준 명명 규칙에 부합합니다.

{capability}-{family}[-{input-type}]-{identifier}

요소 Description
{capability} 모델의 모델 기능입니다. 예를 들어 GPT-3 모델text를 사용하고 Codex 모델code를 사용합니다.
{family} 모델의 상대적 제품군입니다. 예를 들어 GPT-3 모델에는 ada, babbage, curiedavinci가 포함됩니다.
{input-type} (임베딩 모델만 해당) 모델에서 지원하는 임베딩의 입력 형식입니다. 예를 들어 텍스트 검색 임베딩 모델은 docquery를 지원합니다.
{identifier} 모델의 버전 식별자입니다.

예를 들어 가장 강력한 GPT-3 모델은 text-davinci-003라고 하며 가장 강력한 Codex 모델은 code-davinci-002라고 합니다.

표준 명명 규칙을 따르지 않는 ada, babbage, curiedavinci라는 이전 버전의 GPT-3 모델은 주로 미세 조정을 위한 것입니다. 자세한 내용은 애플리케이션에 맞게 모델을 사용자 지정하는 방법 알아보기를 참조하세요.

사용 가능한 모델 찾기

모델 목록 API를 사용하여 Azure OpenAI 리소스에서 유추 및 미세 조정에 사용할 수 있는 모델 목록을 가져올 수 있습니다.

적합한 모델 찾기

모델 기능이 요구 사항을 충족하는지 확인하려면 모델 제품군에서 가장 유능한 모델부터 시작하는 것이 좋습니다. 그런 다음 해당 모델을 유지하거나 기능과 비용이 더 낮은 모델로 이동하여 해당 모델의 기능을 최적화할 수 있습니다.

GPT-4 모델

GPT-4는 OpenAI의 이전 모델보다 더 정확하게 어려운 문제를 해결할 수 있습니다. gpt-35-turbo와 마찬가지로 GPT-4는 채팅에 최적화되어 있지만 기존 완료 작업에 적합합니다.

이 모델 시리즈에 대한 수요가 높기 때문에 현재 요청에 의해서만 사용할 수 있습니다. 액세스를 요청하기 위해 기존 Azure OpenAI 고객은 이 양식을 작성하여 적용할 수 있습니다.

  • gpt-4
  • gpt-4-32k

gpt-4는 최대 8192개의 입력 토큰을 지원하고 gpt-4-32k는 최대 32,768개의 토큰을 지원합니다.

GPT-3 모델

GPT-3 모델은 자연어를 이해하고 생성할 수 있습니다. 이 서비스는 4가지 모델 기능을 제공하며, 각기 다른 작업에 적합한 다른 수준의 성능과 속도를 갖추고 있습니다. Davinci는 역량이 가장 높은 모델이고 Ada는 가장 빠른 모델입니다. 기능이 큰 순으로 모델은 다음과 같습니다.

  • text-davinci-003
  • text-curie-001
  • text-babbage-001
  • text-ada-001

Davinci가 가장 뛰어나지만, 다른 모델은 상당한 속도 이점을 제공합니다. 사용자의 실험은 Davinci로 시작하는 것이 좋습니다. Davinci는 최상의 결과를 생성하며 Azure OpenAI가 제공하는 가치를 검증할 수 있기 때문입니다. 프로토타입이 적합하면 선택한 모델의 대기 시간/성능 균형을 애플리케이션에 가장 적합하게 최적화하면 됩니다.

Davinci

Davinci는 가장 유능한 모델이며, 다른 모델이 수행할 수 있는 모든 작업을(종종 더 적은 명령으로) 수행할 수 있습니다. 특정 대상 그룹에 대한 요약 및 창의적인 콘텐츠 생성과 같이 콘텐츠에 대한 깊은 이해가 필요한 애플리케이션의 경우 Davinci는 최상의 결과를 생성합니다. Davinci가 제공하는 향상된 기능에는 더 많은 컴퓨팅 리소스가 필요하므로 Davinci는 비용이 더 많이 들고 다른 모델만큼 빠르지 않습니다.

Davinci가 뛰어난 또 다른 영역은 텍스트의 의도를 이해하는 것입니다. Davinci는 다양한 종류의 논리 문제를 해결하고 특성의 동기를 설명하는 데 탁월합니다. Davinci는 원인 및 효과와 관련된 가장 어려운 AI 문제 중 일부를 해결할 수 있었습니다.

용도: 대상 그룹에 대한 복잡한 의도, 원인 및 효과, 요약

Curie

Curie는 강력하면서도 빠릅니다. Davinci는 복잡한 텍스트를 분석할 때 더 강력하지만, Curie는 감정 분류 및 요약과 같은 많은 미묘한 작업을 수행할 수 있습니다. Curie는 또한 질문에 답하고 Q&A를 수행하며 일반 서비스 챗봇으로 활동합니다.

용도: 언어 번역, 복잡한 분류, 텍스트 감정, 요약

Babbage

Babbage는 간단한 분류와 같은 간단한 작업을 수행할 수 있습니다. 또한 문서가 검색 쿼리와 일치하는 정도에 대한 의미 체계 검색 순위를 지정하는 것이 가능합니다.

용도: 중간 분류, 의미 체계 검색 분류

Ada

Ada는 일반적으로 가장 빠른 모델이며 텍스트 구문 분석, 주소 수정 및 너무 많은 뉘앙스가 필요하지 않은 특정 종류의 분류 작업과 같은 작업을 수행할 수 있습니다. Ada의 성능은 종종 더 많은 컨텍스트를 제공하여 향상될 수 있습니다.

용도: 텍스트 구문 분석, 간단한 분류, 주소 수정, 키워드

ChatGPT(gpt-35-turbo)

ChatGPT 모델(gpt-35-turbo)은 대화형 인터페이스용으로 설계된 언어 모델이며 이전 GPT-3 모델과 다르게 동작합니다. 이전 모델은 텍스트 입력 및 텍스트 출력이었습니다. 즉, 프롬프트 문자열을 수락하고 프롬프트에 추가하기 위해 완료를 반환했습니다. 그러나 ChatGPT 모델은 대화-인 및 메시지-아웃입니다. 모델은 특정 채팅과 같은 대화 내용 형식으로 형식화된 프롬프트 문자열을 예상하고 채팅에서 모델 작성 메시지를 나타내는 완료를 반환합니다.

ChatGPT 모델 및 채팅 API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

Codex 모델

Codex 모델은 코드를 이해하고 생성할 수 있는 기본 GPT-3 모델의 하위 항목입니다. 학습 데이터에는 자연어와 수십억 줄의 GitHub 공용 코드가 모두 포함됩니다.

Python에서 가장 유능하며 C#, JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL, 심지어 Shell을 포함한 12개 이상의 언어에 능숙합니다. 기능이 큰 순으로 Codex 모델은 다음과 같습니다.

  • code-davinci-002
  • code-cushman-001

Davinci

GPT-3과 유사하게 Davinci는 가장 유능한 Codex 모델이며, 다른 모델이 수행할 수 있는 모든 작업을 수행할 수 있고, 종종 더 적은 명령으로 수행할 수 있습니다. 콘텐츠에 대한 깊은 이해가 필요한 애플리케이션의 경우 Davinci가 최상의 결과를 생성합니다. 더 큰 기능에는 더 많은 컴퓨팅 리소스가 필요하므로 Davinci는 비용이 더 많이 들고 다른 모델만큼 빠르지 않습니다.

Cushman

Cushman은 강력하면서도 빠릅니다. 복잡한 작업을 분석할 때는 Davinci가 더 강력하지만 Cushman은 많은 코드 생성 작업에 유능한 모델입니다. Cushman은 일반적으로 Davinci보다 빠르게 실행되며 저렴합니다.

임베딩 모델

중요

text-embedding-ada-002 (Version 2)를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.

현재 다양한 기능에 대해 세 가지 임베딩 모델 제품군을 제공합니다.

각 제품군에는 다양한 기능의 모델이 포함되어 있습니다. 다음 목록은 모델 기능에 따라 서비스에서 반환되는 숫자 벡터의 길이를 나타냅니다.

기본 모델 모델 차원
Ada -001로 끝나는 모델(버전 1) 1024
Ada text-embedding-ada-002(버전 2) 1536
Babbage 2048
Curie 4096
Davinci 12288

Davinci는 가장 뛰어나지만 다른 모델보다 느리고 비용이 더 많이 듭니다. Ada는 역량이 가장 낮지만 더 빠르고 저렴합니다.

유사성 임베딩

이러한 모델은 둘 이상의 텍스트 조각 간의 의미 체계 유사성을 캡처하는 데 적합합니다.

사용 사례 모델
클러스터링, 회귀, 변칙 검색, 시각화 text-similarity-ada-001
text-similarity-babbage-001
text-similarity-curie-001
text-similarity-davinci-001

텍스트 검색 임베딩

이러한 모델은 긴 문서가 짧은 검색 쿼리와 관련이 있는지 여부를 측정하는 데 도움이 됩니다. 이 제품군에서 지원하는 입력 유형은 두 가지입니다. doc은 검색할 문서를 임베딩하기 위한 유형이며 query는 검색 쿼리를 임베딩하기 위한 유형입니다.

사용 사례 모델
검색, 컨텍스트 관련성, 정보 검색 text-search-ada-doc-001
text-search-ada-query-001
text-search-babbage-doc-001
text-search-babbage-query-001
text-search-curie-doc-001
text-search-curie-query-001
text-search-davinci-doc-001
text-search-davinci-query-001

코드 검색 임베딩

텍스트 검색 임베딩 모델과 유사하게 이 제품군에서 지원하는 두 가지 입력 유형은 검색할 코드 조각 임베딩을 위한 code 및 자연어 검색 쿼리 임베딩을 위한 text입니다.

사용 사례 모델
코드 검색 및 관련성 code-search-ada-code-001
code-search-ada-text-001
code-search-babbage-code-001
code-search-babbage-text-001

포함 모델을 사용할 때는 해당 모델의 한계와 위험을 염두에 두어야 합니다.

모델 요약 테이블 및 지역 가용성

중요

수요가 많기 때문에 미국 중남부에서 새 리소스를 일시적으로 만들 수 없습니다.

GPT-3 모델

이러한 모델은 완료 API 요청과 함께 사용할 수 있습니다. gpt-35-turbo는 완료 API 요청 및 채팅 완료 API와 함께 사용할 수 있는 유일한 모델입니다.

모델 ID 기본 모델 영역 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
ada 해당 없음 해당 없음 2,049 2019년 10월
text-ada-001 미국 동부, 미국 중남부, 서유럽 해당 없음 2,049 2019년 10월
babbage 해당 없음 해당 없음 2,049 2019년 10월
text-babbage-001 미국 동부, 미국 중남부, 서유럽 해당 없음 2,049 2019년 10월
curie 해당 없음 해당 없음 2,049 2019년 10월
text-curie-001 미국 동부, 미국 중남부, 서유럽 해당 없음 2,049 2019년 10월
다빈치 해당 없음 해당 없음 2,049 2019년 10월
text-davinci-001 미국 중남부, 서유럽 해당 없음
text-davinci-002 미국 동부, 미국 중남부, 서유럽 해당 없음 4,097 2021년 6월
text-davinci-003 미국 동부, 서부 유럽 해당 없음 4,097 2021년 6월
text-davinci-fine-tune-002 해당 없음 해당 없음
gpt-35-turbo1 (ChatGPT) 미국 동부, 프랑스 중부, 미국 중남부, 서유럽 해당 없음 4,096 2021년 9월


1 현재 이 모델의 버전 0301 만 사용할 수 있습니다.

GPT-4 모델

이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

모델 ID 기본 모델 영역 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
gpt-41,2 미국 동부, 프랑스 중부 해당 없음 8,192 2021년 9월
gpt-4-32k1,2 미국 동부, 프랑스 중부 해당 없음 32,768 2021년 9월

1 모델은 요청에 의해서만 사용할 수 있습니다.
2 현재 이 모델의 버전 0314만 사용할 수 있습니다.

Codex 모델

이러한 모델은 완료 API 요청에만 사용할 수 있습니다.

모델 ID 기본 모델 영역 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
code-cushman-0011 미국 중남부, 서유럽 현재 사용 불가 2,048
code-davinci-002 미국 동부, 서부 유럽 해당 없음 8,001 2021년 6월

1 모델은 요청에 의해서만 미세 조정이 가능합니다. 현재 모델 미세 조정에 대한 새로운 요청을 수락하지 않습니다.

포함 모델

이러한 모델은 포함 API 요청에만 사용할 수 있습니다.

참고

text-embedding-ada-002 (Version 2)를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.

모델 ID 기본 모델 영역 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
text-embedding-ada-002(버전 2) 미국 동부, 미국 중남부, 해당 없음 8,191 2021년 9월
text-embedding-ada-002(버전 1) 미국 동부, 미국 중남부, 서유럽 해당 없음 4,095 2021년 9월
text-similarity-ada-001 미국 동부, 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-similarity-babbage-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-similarity-curie-001 미국 동부, 미국 중남부, 서유럽 해당 없음 2046 2020년 8월
text-similarity-davinci-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-ada-doc-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-ada-query-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-babbage-doc-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-babbage-query-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-curie-doc-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-curie-query-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-davinci-doc-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
text-search-davinci-query-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
code-search-ada-code-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
code-search-ada-text-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
code-search-babbage-code-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월
code-search-babbage-text-001 미국 중남부, 서유럽 해당 없음 2,046 2020년 8월

다음 단계