Azure OpenAI 서비스 모델
Azure OpenAI는 제품군 및 기능별로 그룹화된 다양한 모델에 대한 액세스를 제공합니다. 모델 제품군은 일반적으로 의도한 작업별로 모델을 연결합니다. 다음 표에서는 현재 Azure OpenAI에서 사용할 수 있는 모델 제품군에 대해 설명합니다. 현재 모든 지역에서 모든 모델을 사용할 수 있는 것은 아닙니다. 전체 분석은 이 문서의 모델 기능 표를 참조하세요.
모델 제품군 | Description |
---|---|
GPT-4 | GPT-3.5를 개선하고 자연어와 코드를 생성할 뿐만 아니라 이해할 수 있는 일련의 모델입니다. |
GPT-3 | 자연어를 이해하고 생성할 수 있는 일련의 모델입니다. 여기에는 새 ChatGPT 모델이 포함됩니다. |
Codex | 자연어를 코드로 번역하는 것을 포함하여 코드를 이해하고 생성할 수 있는 일련의 모델입니다. |
포함 | 임베딩을 이해하고 사용할 수 있는 일련의 모델입니다. 포함은 기계 학습 모델 및 알고리즘에서 쉽게 활용할 수 있는 특수한 형식의 데이터 표현입니다. 포함은 텍스트 조각의 의미 체계적 의미에 대한 조밀한 정보 표현입니다. 현재 다양한 기능에 대해 세 가지(유사성, 텍스트 검색, 코드 검색) 임베딩 모델 제품군을 제공합니다. |
모델 기능
각 모델 제품군에는 기능별로 더 구별되는 일련의 모델이 있습니다. 이러한 기능은 일반적으로 이름으로 식별되며, 이러한 이름의 사전순 순서는 일반적으로 지정된 모델 제품군 내에서 해당 모델의 상대적인 기능과 비용을 나타냅니다. 예를 들어 GPT-3 모델은 Ada, Babbage, Curie 및 Davinci와 같은 이름을 사용하여 상대적인 기능과 비용을 나타냅니다. Davinci는 Curie보다 더 유능하고 비용이 더 많이 듭니다. Curie는 Babbage보다 더 유능하고 비용이 더 많이 듭니다.
참고
역량이 더 낮은 모델(예: Ada)이 수행할 수 있는 작업은 역량이 더 높은 모델(예: Curie 또는 Davinci)이 수행할 수 있습니다.
명명 규칙
Azure OpenAI의 모델 이름은 일반적으로 다음과 같은 표준 명명 규칙에 부합합니다.
{capability}-{family}[-{input-type}]-{identifier}
요소 | Description |
---|---|
{capability} |
모델의 모델 기능입니다. 예를 들어 GPT-3 모델은 text 를 사용하고 Codex 모델은 code 를 사용합니다. |
{family} |
모델의 상대적 제품군입니다. 예를 들어 GPT-3 모델에는 ada , babbage , curie 및 davinci 가 포함됩니다. |
{input-type} |
(임베딩 모델만 해당) 모델에서 지원하는 임베딩의 입력 형식입니다. 예를 들어 텍스트 검색 임베딩 모델은 doc 및 query 를 지원합니다. |
{identifier} |
모델의 버전 식별자입니다. |
예를 들어 가장 강력한 GPT-3 모델은 text-davinci-003
라고 하며 가장 강력한 Codex 모델은 code-davinci-002
라고 합니다.
표준 명명 규칙을 따르지 않는
ada
,babbage
,curie
및davinci
라는 이전 버전의 GPT-3 모델은 주로 미세 조정을 위한 것입니다. 자세한 내용은 애플리케이션에 맞게 모델을 사용자 지정하는 방법 알아보기를 참조하세요.
사용 가능한 모델 찾기
모델 목록 API를 사용하여 Azure OpenAI 리소스에서 유추 및 미세 조정에 사용할 수 있는 모델 목록을 가져올 수 있습니다.
적합한 모델 찾기
모델 기능이 요구 사항을 충족하는지 확인하려면 모델 제품군에서 가장 유능한 모델부터 시작하는 것이 좋습니다. 그런 다음 해당 모델을 유지하거나 기능과 비용이 더 낮은 모델로 이동하여 해당 모델의 기능을 최적화할 수 있습니다.
GPT-4 모델
GPT-4는 OpenAI의 이전 모델보다 더 정확하게 어려운 문제를 해결할 수 있습니다. gpt-35-turbo와 마찬가지로 GPT-4는 채팅에 최적화되어 있지만 기존 완료 작업에 적합합니다.
이 모델 시리즈에 대한 수요가 높기 때문에 현재 요청에 의해서만 사용할 수 있습니다. 액세스를 요청하기 위해 기존 Azure OpenAI 고객은 이 양식을 작성하여 적용할 수 있습니다.
gpt-4
gpt-4-32k
gpt-4
는 최대 8192개의 입력 토큰을 지원하고 gpt-4-32k
는 최대 32,768개의 토큰을 지원합니다.
GPT-3 모델
GPT-3 모델은 자연어를 이해하고 생성할 수 있습니다. 이 서비스는 4가지 모델 기능을 제공하며, 각기 다른 작업에 적합한 다른 수준의 성능과 속도를 갖추고 있습니다. Davinci는 역량이 가장 높은 모델이고 Ada는 가장 빠른 모델입니다. 기능이 큰 순으로 모델은 다음과 같습니다.
text-davinci-003
text-curie-001
text-babbage-001
text-ada-001
Davinci가 가장 뛰어나지만, 다른 모델은 상당한 속도 이점을 제공합니다. 사용자의 실험은 Davinci로 시작하는 것이 좋습니다. Davinci는 최상의 결과를 생성하며 Azure OpenAI가 제공하는 가치를 검증할 수 있기 때문입니다. 프로토타입이 적합하면 선택한 모델의 대기 시간/성능 균형을 애플리케이션에 가장 적합하게 최적화하면 됩니다.
Davinci
Davinci는 가장 유능한 모델이며, 다른 모델이 수행할 수 있는 모든 작업을(종종 더 적은 명령으로) 수행할 수 있습니다. 특정 대상 그룹에 대한 요약 및 창의적인 콘텐츠 생성과 같이 콘텐츠에 대한 깊은 이해가 필요한 애플리케이션의 경우 Davinci는 최상의 결과를 생성합니다. Davinci가 제공하는 향상된 기능에는 더 많은 컴퓨팅 리소스가 필요하므로 Davinci는 비용이 더 많이 들고 다른 모델만큼 빠르지 않습니다.
Davinci가 뛰어난 또 다른 영역은 텍스트의 의도를 이해하는 것입니다. Davinci는 다양한 종류의 논리 문제를 해결하고 특성의 동기를 설명하는 데 탁월합니다. Davinci는 원인 및 효과와 관련된 가장 어려운 AI 문제 중 일부를 해결할 수 있었습니다.
용도: 대상 그룹에 대한 복잡한 의도, 원인 및 효과, 요약
Curie
Curie는 강력하면서도 빠릅니다. Davinci는 복잡한 텍스트를 분석할 때 더 강력하지만, Curie는 감정 분류 및 요약과 같은 많은 미묘한 작업을 수행할 수 있습니다. Curie는 또한 질문에 답하고 Q&A를 수행하며 일반 서비스 챗봇으로 활동합니다.
용도: 언어 번역, 복잡한 분류, 텍스트 감정, 요약
Babbage
Babbage는 간단한 분류와 같은 간단한 작업을 수행할 수 있습니다. 또한 문서가 검색 쿼리와 일치하는 정도에 대한 의미 체계 검색 순위를 지정하는 것이 가능합니다.
용도: 중간 분류, 의미 체계 검색 분류
Ada
Ada는 일반적으로 가장 빠른 모델이며 텍스트 구문 분석, 주소 수정 및 너무 많은 뉘앙스가 필요하지 않은 특정 종류의 분류 작업과 같은 작업을 수행할 수 있습니다. Ada의 성능은 종종 더 많은 컨텍스트를 제공하여 향상될 수 있습니다.
용도: 텍스트 구문 분석, 간단한 분류, 주소 수정, 키워드
ChatGPT(gpt-35-turbo)
ChatGPT 모델(gpt-35-turbo)은 대화형 인터페이스용으로 설계된 언어 모델이며 이전 GPT-3 모델과 다르게 동작합니다. 이전 모델은 텍스트 입력 및 텍스트 출력이었습니다. 즉, 프롬프트 문자열을 수락하고 프롬프트에 추가하기 위해 완료를 반환했습니다. 그러나 ChatGPT 모델은 대화-인 및 메시지-아웃입니다. 모델은 특정 채팅과 같은 대화 내용 형식으로 형식화된 프롬프트 문자열을 예상하고 채팅에서 모델 작성 메시지를 나타내는 완료를 반환합니다.
ChatGPT 모델 및 채팅 API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.
Codex 모델
Codex 모델은 코드를 이해하고 생성할 수 있는 기본 GPT-3 모델의 하위 항목입니다. 학습 데이터에는 자연어와 수십억 줄의 GitHub 공용 코드가 모두 포함됩니다.
Python에서 가장 유능하며 C#, JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL, 심지어 Shell을 포함한 12개 이상의 언어에 능숙합니다. 기능이 큰 순으로 Codex 모델은 다음과 같습니다.
code-davinci-002
code-cushman-001
Davinci
GPT-3과 유사하게 Davinci는 가장 유능한 Codex 모델이며, 다른 모델이 수행할 수 있는 모든 작업을 수행할 수 있고, 종종 더 적은 명령으로 수행할 수 있습니다. 콘텐츠에 대한 깊은 이해가 필요한 애플리케이션의 경우 Davinci가 최상의 결과를 생성합니다. 더 큰 기능에는 더 많은 컴퓨팅 리소스가 필요하므로 Davinci는 비용이 더 많이 들고 다른 모델만큼 빠르지 않습니다.
Cushman
Cushman은 강력하면서도 빠릅니다. 복잡한 작업을 분석할 때는 Davinci가 더 강력하지만 Cushman은 많은 코드 생성 작업에 유능한 모델입니다. Cushman은 일반적으로 Davinci보다 빠르게 실행되며 저렴합니다.
임베딩 모델
중요
text-embedding-ada-002 (Version 2)
를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002
와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.
현재 다양한 기능에 대해 세 가지 임베딩 모델 제품군을 제공합니다.
각 제품군에는 다양한 기능의 모델이 포함되어 있습니다. 다음 목록은 모델 기능에 따라 서비스에서 반환되는 숫자 벡터의 길이를 나타냅니다.
기본 모델 | 모델 | 차원 |
---|---|---|
Ada | -001로 끝나는 모델(버전 1) | 1024 |
Ada | text-embedding-ada-002(버전 2) | 1536 |
Babbage | 2048 | |
Curie | 4096 | |
Davinci | 12288 |
Davinci는 가장 뛰어나지만 다른 모델보다 느리고 비용이 더 많이 듭니다. Ada는 역량이 가장 낮지만 더 빠르고 저렴합니다.
유사성 임베딩
이러한 모델은 둘 이상의 텍스트 조각 간의 의미 체계 유사성을 캡처하는 데 적합합니다.
사용 사례 | 모델 |
---|---|
클러스터링, 회귀, 변칙 검색, 시각화 | text-similarity-ada-001 text-similarity-babbage-001 text-similarity-curie-001 text-similarity-davinci-001 |
텍스트 검색 임베딩
이러한 모델은 긴 문서가 짧은 검색 쿼리와 관련이 있는지 여부를 측정하는 데 도움이 됩니다. 이 제품군에서 지원하는 입력 유형은 두 가지입니다. doc
은 검색할 문서를 임베딩하기 위한 유형이며 query
는 검색 쿼리를 임베딩하기 위한 유형입니다.
사용 사례 | 모델 |
---|---|
검색, 컨텍스트 관련성, 정보 검색 | text-search-ada-doc-001 text-search-ada-query-001 text-search-babbage-doc-001 text-search-babbage-query-001 text-search-curie-doc-001 text-search-curie-query-001 text-search-davinci-doc-001 text-search-davinci-query-001 |
코드 검색 임베딩
텍스트 검색 임베딩 모델과 유사하게 이 제품군에서 지원하는 두 가지 입력 유형은 검색할 코드 조각 임베딩을 위한 code
및 자연어 검색 쿼리 임베딩을 위한 text
입니다.
사용 사례 | 모델 |
---|---|
코드 검색 및 관련성 | code-search-ada-code-001 code-search-ada-text-001 code-search-babbage-code-001 code-search-babbage-text-001 |
포함 모델을 사용할 때는 해당 모델의 한계와 위험을 염두에 두어야 합니다.
모델 요약 테이블 및 지역 가용성
중요
수요가 많기 때문에 미국 중남부에서 새 리소스를 일시적으로 만들 수 없습니다.
GPT-3 모델
이러한 모델은 완료 API 요청과 함께 사용할 수 있습니다. gpt-35-turbo
는 완료 API 요청 및 채팅 완료 API와 함께 사용할 수 있는 유일한 모델입니다.
모델 ID | 기본 모델 영역 | 미세 조정 지역 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|---|
ada | 해당 없음 | 해당 없음 | 2,049 | 2019년 10월 |
text-ada-001 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 2,049 | 2019년 10월 |
babbage | 해당 없음 | 해당 없음 | 2,049 | 2019년 10월 |
text-babbage-001 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 2,049 | 2019년 10월 |
curie | 해당 없음 | 해당 없음 | 2,049 | 2019년 10월 |
text-curie-001 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 2,049 | 2019년 10월 |
다빈치 | 해당 없음 | 해당 없음 | 2,049 | 2019년 10월 |
text-davinci-001 | 미국 중남부, 서유럽 | 해당 없음 | ||
text-davinci-002 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 4,097 | 2021년 6월 |
text-davinci-003 | 미국 동부, 서부 유럽 | 해당 없음 | 4,097 | 2021년 6월 |
text-davinci-fine-tune-002 | 해당 없음 | 해당 없음 | ||
gpt-35-turbo1 (ChatGPT) | 미국 동부, 프랑스 중부, 미국 중남부, 서유럽 | 해당 없음 | 4,096 | 2021년 9월 |
1 현재 이 모델의 버전 0301
만 사용할 수 있습니다.
GPT-4 모델
이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.
모델 ID | 기본 모델 영역 | 미세 조정 지역 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|---|
gpt-4 1,2 |
미국 동부, 프랑스 중부 | 해당 없음 | 8,192 | 2021년 9월 |
gpt-4-32k 1,2 |
미국 동부, 프랑스 중부 | 해당 없음 | 32,768 | 2021년 9월 |
1 모델은 요청에 의해서만 사용할 수 있습니다.
2 현재 이 모델의 버전 0314
만 사용할 수 있습니다.
Codex 모델
이러한 모델은 완료 API 요청에만 사용할 수 있습니다.
모델 ID | 기본 모델 영역 | 미세 조정 지역 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|---|
code-cushman-0011 | 미국 중남부, 서유럽 | 현재 사용 불가 | 2,048 | |
code-davinci-002 | 미국 동부, 서부 유럽 | 해당 없음 | 8,001 | 2021년 6월 |
1 모델은 요청에 의해서만 미세 조정이 가능합니다. 현재 모델 미세 조정에 대한 새로운 요청을 수락하지 않습니다.
포함 모델
이러한 모델은 포함 API 요청에만 사용할 수 있습니다.
참고
text-embedding-ada-002 (Version 2)
를 사용하는 것이 좋습니다. 이 모델/버전은 OpenAI의 text-embedding-ada-002
와 패리티를 제공합니다. 이 모델이 제공하는 개선 사항에 대해 자세히 알아보려면 OpenAI의 블로그 게시물을 참조하세요. 현재 버전 1을 사용 중이더라도 최신 가중치/업데이트된 토큰 한도를 활용하려면 버전 2로 마이그레이션해야 합니다. 버전 1과 버전 2는 상호 교환이 불가능하므로 동일한 버전의 모델을 사용하여 문서 포함과 문서 검색을 수행해야 합니다.
모델 ID | 기본 모델 영역 | 미세 조정 지역 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|---|
text-embedding-ada-002(버전 2) | 미국 동부, 미국 중남부, | 해당 없음 | 8,191 | 2021년 9월 |
text-embedding-ada-002(버전 1) | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 4,095 | 2021년 9월 |
text-similarity-ada-001 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-similarity-babbage-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-similarity-curie-001 | 미국 동부, 미국 중남부, 서유럽 | 해당 없음 | 2046 | 2020년 8월 |
text-similarity-davinci-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-ada-doc-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-ada-query-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-babbage-doc-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-babbage-query-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-curie-doc-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-curie-query-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-davinci-doc-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
text-search-davinci-query-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
code-search-ada-code-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
code-search-ada-text-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
code-search-babbage-code-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |
code-search-babbage-text-001 | 미국 중남부, 서유럽 | 해당 없음 | 2,046 | 2020년 8월 |