Modelos do Serviço OpenAI do Azure
O Serviço OpenAI do Azure é alimentado por um conjunto diversificado de modelos com diferentes funcionalidades e pontos de preço. A disponibilidade do modelo varia de acordo com a região. Para o GPT-3 e outros modelos que serão desativados em julho de 2024, confira Modelos herdados do Serviço OpenAI do Azure.
Modelos | Descrição |
---|---|
GPT-4 | Um conjunto de modelos que aprimoram o GPT-3.5 e podem entender e gerar código e linguagem natural. |
GPT-3.5 | Um conjunto de modelos que aprimoram o GPT-3 e podem entender e gerar código e linguagem natural. |
Incorporações | Um conjunto de modelos que podem converter texto em um formulário de vetor numérico para facilitar a similaridade de texto. |
DALL-E | Uma série de modelos que podem gerar imagens originais a partir de linguagem natural. |
Whisper | Uma série de modelos em versão prévia que podem transcrever e traduzir uma fala em texto. |
Conversão de texto em fala (versão prévia) | Uma série de modelos em versão prévia que podem sintetizar a conversão de texto em fala. |
Versão prévia de GPT-4 e GPT-4 Turbo
O GPT-4 é um modelo multimodal grande (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores de OpenAI. Como o GPT-3.5 Turbo, o GPT-4 é otimizado para chat, mas funciona bem para tarefas de preenchimento tradicionais. Use a API de Preenchimentos de Chat para usar o GPT-4. Para saber mais sobre como interagir com o GPT-4 e a API de Preenchimentos de Chat, confira nossas instruções passo a passo aprofundadas.
O GPT-4 Turbo com Visão é a versão do GPT-4 que aceita entradas de imagem. Ele está disponível como o modelo vision-preview
de gpt-4
.
gpt-4
gpt-4-32k
Você pode ver o comprimento do contexto do token compatível com cada modelo na tabela de resumo do modelo.
GPT-3.5
Os modelos GPT-3.5 conseguem entender e gerar linguagem natural ou código. O modelo mais capaz e mais econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para chat e também funciona bem para tarefas de preenchimento tradicionais. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem recursos semelhantes ao text-davinci-003
usando a API de Conclusão em vez da API de Conclusão de Chat. Recomendamos o uso do GPT-3.5 Turbo e do GPT-3.5 Turbo Instruct em vez dos modelos herdados GPT-3.5 e GPT-3.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Você pode ver o comprimento do contexto do token compatível com cada modelo na tabela de resumo do modelo.
Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Preenchimentos de Chat, confira nossas instruções passo a passo aprofundadas.
Incorporações
text-embedding-3-large
é o modelo de inserção mais recente e mais capaz. A atualização entre modelos de inserções não é possível. Para passar do uso de text-embedding-ada-002
para text-embedding-3-large
, você precisaria gerar novas inserções.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Em testes, o OpenAI relata que os modelos de inserções de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação de vários idiomas com o parâmetro de comparação MIRACL, mantendo ainda o desempenho para tarefas em inglês com o parâmetro de comparação MTEB.
Benchmark de avaliação | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Média MIRACL | 31,4 | 44,0 | 54.9 |
Média MTEB | 61,0 | 62,3 | 64,6 |
Os modelos de inserções de terceira geração dão suporte à redução do tamanho da inserção por meio de um novo parâmetro dimensions
. Normalmente, inserções maiores são mais caras de uma perspectiva de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo e o desempenho gerais. Não há suporte para o parâmetro dimensions
em todas as versões da biblioteca OpenAI 1.x Python. Para aproveitar esse parâmetro, recomendamos atualizar para a versão mais recente: pip install openai --upgrade
.
O teste de parâmetro de comparação MTEB da OpenAI constatou que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de 1.536 dimensões de text-embeddings-ada-002
, o desempenho permanece ligeiramente melhor.
DALL-E
Os modelos DALL-E geram imagens a partir de prompts de texto fornecidos pelo usuário. DALL-E 3 está geralmente disponível para uso com APIs REST. DALL-E 2 e DALL-E 3 com SDKs de cliente estão em versão prévia.
Whisper
Os modelos do Whisper podem ser usados para conversão de fala em texto.
Use também o modelo Whisper por meio da API de transcrição em lote da Fala de IA do Azure. ConsulteO que é o modelo Whisper? para saber mais sobre quando usar a Fala de IA do Azure versus o Serviço OpenAI do Azure.
Conversão de texto em fala (versão prévia)
Os modelos de conversão de texto em fala do OpenAI, atualmente em versão prévia, podem ser usado para sintetizar a conversão de texto em fala.
Você também pode usar as vozes da conversão de texto em fala do OpenAI por meio da Fala de IA do Azure. Para saber mais, consulte o guia Vozes da conversão de texto em fala do OpenAI por meio do Serviço OpenAI do Azure ou Fala de IA do Azure.
Tabela de resumo de modelos e disponibilidade por região
Observação
Este artigo abrange apenas a disponibilidade de modelo/região que se aplica a todos os clientes do Azure OpenAI com tipos de implantação Standard. Alguns clientes selecionados têm acesso a combinações de modelo/região que não estão listadas na tabela unificada abaixo. Essas tabelas também não se aplicam a clientes que usam apenas tipos de implantação Provisionados que possuem sua própria matriz de disponibilidade de modelo/região exclusiva. Para obter mais informações sobre implantações provisionadas, consulte nossa orientação provisionada.
Disponibilidade do modelo de implantação padrão
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
babbage-002 , 1 |
dall-e-3 , 3.0 |
davinci-002 , 1 |
tts , 001 |
tts-hd , 001 |
whisper , 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Cota do modelo de implantação padrão
A cota padrão para modelos varia de acordo com o modelo e a região. Os limites da cota padrão estão sujeitos a alterações.
A cota para implantações padrão é descrita em termos de TPM (Tokens por Minuto).
Region | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 – ajuste fino | Davinci-002 | Davinci-002 – ajuste fino | GPT-35-Turbo – ajuste fino | GPT-35-Turbo-1106 – ajuste fino | GPT-35-Turbo-0125 – ajuste fino |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 mil | 80 mil | 80 mil | 30 K | 300 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 mil | - | - | - | - | - | - | - | - | - |
canadaeast | 40 mil | 80 mil | 80 mil | - | 300 mil | - | 350 mil | 350 mil | 350 mil | - | - | - | - | - | - | - |
eastus | - | - | 80 mil | - | 240 mil | 240 mil | 240 mil | 350 mil | 350 mil | - | - | - | - | - | - | - |
eastus2 | - | 80 mil | 80 mil | - | 300 mil | - | 350 mil | 350 mil | 350 mil | - | - | - | - | 250 mil | 250 mil | 250 mil |
francecentral | 20 mil | 60 K | 80 mil | - | 240 mil | - | 240 mil | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 mil | - | 300 mil | - | 350 mil | - | - | 240 mil | 250 mil | 240 mil | 250 mil | 250 mil | 250 mil | 250 mil |
norwayeast | - | - | 150 mil | - | - | - | 350 mil | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 mil | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 mil | - | 240 mil | - | 240 mil | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 mil | - | 300 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
swedencentral | 40 mil | 80 mil | 150 mil | 30 K | 300 mil | 240 mil | 350 mil | - | - | 240 mil | 250 mil | 240 mil | 250 mil | 250 mil | 250 mil | 250 mil |
switzerlandnorth | 40 mil | 80 mil | - | 30 K | 300 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
uksouth | - | - | 80 mil | - | 240 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 mil | - | 240 mil | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 mil | 30 K | 300 mil | - | 350 mil | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 mil | - | - | - | - | - | - | - | - | - |
1 K = 1000 TPM (Tokens por Minuto). A relação entre TPM e RPM (Solicitações por Minuto) é definida atualmente como 6 RPM por 1000 TPM.
Modelos da Versão prévia de GPT-4 e GPT-4 Turbo
O GPT-4, o GPT-4-32k e o GPT-4 Turbo com Visão já estão disponíveis para todos os clientes do Serviço OpenAI do Azure. A disponibilidade varia de acordo com a região. Se não encontrar o GPT-4 em sua região, verifique mais tarde.
Esses modelos só podem ser usados com a API de Conclusão de Chat.
O GPT-4 versão 0314 é a primeira versão do modelo lançado. A versão 0613 é a segunda versão do modelo e adiciona suporte à chamada de função.
Consulte as versões de modelo para saber mais sobre como o Serviço OpenAI do Azure lida com atualizações de versão de modelo e trabalhando com modelos, para saber como exibir e definir as configurações de versão do modelo de suas implantações GPT-4.
Observação
A versão 0314
de gpt-4
e gpt-4-32k
será desativada após 5 de julho de 2024. A versão 0613
de gpt-4
e gpt-4-32k
será desativada após 30 de setembro de 2024. Confira atualizações de modelos para obter o comportamento de atualização do modelo.
GPT-4 versão 0125-preview é uma versão atualizada da versão prévia do GPT-4 Turbo lançada anteriormente como versão 1106-preview. O GPT-4 versão 0125-preview conclui tarefas como a geração de código mais completamente em comparação com o gpt-4-1106-preview. Por isso, dependendo da tarefa, os clientes podem descobrir que o GPT-4-0125-preview gera mais saída em comparação com o gpt-4-1106-preview. Recomendamos que os clientes comparem as saídas do novo modelo. O GPT-4-0125-preview também aborda bugs no gpt-4-1106-preview com manipulação UTF-8 para idiomas diferentes do inglês.
Importante
gpt-4
as versões 1106-Preview e 0125-Preview serão atualizadas com uma versão estável dogpt-4
no futuro. A atualização de implantação degpt-4
1106-Preview paragpt-4
0125-Preview agendada para 8 de março de 2024 não está mais ocorrendo. As implantações das versõesgpt-4
1106-Preview e 0125-Preview definidas como "Atualização automática para padrão" e "Atualizar quando expirado" começarão a ser atualizadas após o lançamento da versão estável. Para cada implantação, ocorre uma atualização da versão do modelo sem interrupção do serviço para chamadas de API. As atualizações são realizadas por região e espera-se que o processo completo de atualização leve 2 semanas. As implantações das versõesgpt-4
1106-Preview e 0125-Preview definidas como "Sem atualização automática" não serão atualizadas e deixarão de funcionar quando a versão de visualização for atualizada na região.
ID do Modelo | Máx. de solicitações (tokens) | Dados de treinamento (até) |
---|---|---|
gpt-4 (0314) |
8\.192 | Setembro de 2021 |
gpt-4-32k (0314) |
32.768 | Setembro de 2021 |
gpt-4 (0613) |
8\.192 | Setembro de 2021 |
gpt-4-32k (0613) |
32.768 | Setembro de 2021 |
gpt-4 (1106-Preview)1Versão prévia do GPT-4 Turbo |
Input: 128,000 Output: 4,096 |
Abril de 2023 |
gpt-4 (0125-Preview)1Versão prévia do GPT-4 Turbo |
Input: 128,000 Output: 4,096 |
dez. de 2023 |
gpt-4 (vision-preview)2Versão prévia do GPT-4 Turbo com Visão |
Input: 128,000 Output: 4,096 |
Abril de 2023 |
1 Versão prévia do GPT-4 Turbo = gpt-4
(0125-Preview) ou gpt-4
(1106-Preview). Para implantar este modelo, em Implantações, selecione o modelo gpt-4. Em "versão", selecione (0125-Preview) ou (1106-Preview).
2 Versão prévia do GPT-4 Turbo com Visão = gpt-4
(vision-preview). Para implantar este modelo, em Implantações, selecione o modelo gpt-4. Em Versão do modelo, selecione vision-preview.
Cuidado
Não recomendamos o uso desses modelos de versão prévia em produção. Atualizaremos todas as implantações dos modelos de versão prévia para versões prévias futuras e uma versão estável. Os modelos de visualização designados não seguem o ciclo de vida padrão do modelo do Azure OpenAI.
Observação
As regiões em que o GPT-4 (0314) e (0613) estiver listado como disponível têm acesso às versões 8K e 32K do modelo
Disponibilidade do modelo GPT-4 e GPT-4 Turbo Preview
Regiões de nuvem pública
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
eastus | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
southcentralus | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - |
Selecione o acesso do cliente
Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 in regiões adicionais:
Modelar | Region |
---|---|
gpt-4 (0314) |
Leste dos EUA França Central Centro-Sul dos Estados Unidos Sul do Reino Unido |
gpt-4 (0613) |
Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido |
Regiões do Azure Governamental
Os seguintes modelos do GPT-4 estão disponíveis com o Azure Governamental:
ID do Modelo | Disponibilidade do modelo |
---|---|
gpt-4 (1106-preview) |
Gov. dos EUA – Virgínia Governo dos EUA do Arizona |
Modelos GPT-3.5
Importante
O novo modelo de gpt-35-turbo (0125)
tem vários aprimoramentos, incluindo maior precisão na resposta em formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função que não são em inglês.
O GPT-3.5 Turbo é usado com a API de Preenchimento de Chat. A versão 0301 do GPT-3.5 Turbo também pode ser usado com a API de Preenchimentos. As versões 0613 e 1106 do GPT-3.5 Turbo só dão suporte à API de Preenchimentos de Chat.
O GPT-3.5 Turbo versão 0301 é a primeira versão do modelo lançado. A versão 0613 é a segunda versão do modelo e adiciona suporte à chamada de função.
Consulte versões de modelo para saber mais sobre como o Serviço OpenAI do Azure lida com atualizações de versão de modelo e trabalhando com modelos, para saber como exibir e definir as configurações de versão do modelo de suas implantações do GPT-3.5 Turbo.
Observação
A versão 0613
do gpt-35-turbo
e gpt-35-turbo-16k
será desativada até 13 de julho de 2024. A versão 0301
de gpt-35-turbo
será desativada até 13 de junho de 2024. Confira atualizações de modelos para obter o comportamento de atualização do modelo.
ID do Modelo | Máx. de solicitações (tokens) | Dados de treinamento (até) |
---|---|---|
gpt-35-turbo 1 (0301) |
4\.096 | Setembro de 2021 |
gpt-35-turbo (0613) |
4\.096 | Setembro de 2021 |
gpt-35-turbo-16k (0613) |
16.384 | Setembro de 2021 |
gpt-35-turbo-instruct (0914) |
4,097 | Setembro de 2021 |
gpt-35-turbo (1106) |
Input: 16,385 Output: 4,096 |
Setembro de 2021 |
gpt-35-turbo (0125) NOVO |
16.385 | Setembro de 2021 |
Disponibilidade do modelo GPT-3.5-Turbo
Regiões de nuvem pública
Region |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Esse modelo aceitará solicitações > 4.096 tokens. Não é recomendável exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo é limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com esse modelo, essa configuração não terá suporte oficial.
Regiões do Azure Governamental
Os seguintes modelos do GPT-3.5 turbo estão disponíveis com o Azure Governamental:
ID do Modelo | Disponibilidade do modelo |
---|---|
gpt-35-turbo (1106-preview) |
Gov. dos EUA – Virgínia |
Modelos de inserções
Esses modelos só podem ser usados com solicitações da API de Inserção.
Observação
text-embedding-3-large
é o modelo de inserção mais recente e mais capaz. A atualização entre modelos de inserções não é possível. Para passar do uso de text-embedding-ada-002
para text-embedding-3-large
, você precisaria gerar novas inserções.
ID do Modelo | Máx. de solicitações (tokens) | Dimensões de saída | Dados de treinamento (até) |
---|---|---|---|
text-embedding-ada-002 (versão 2) |
8,191 | 1.536 | Setembro de 2021 |
text-embedding-ada-002 (versão 1) |
2,046 | 1.536 | Setembro de 2021 |
text-embedding-3-large |
8,191 | 3.072 | Setembro de 2021 |
text-embedding-3-small |
8,191 | 1.536 | Setembro de 2021 |
Observação
Ao enviar uma matriz de entradas para inserção, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de inserção é 2048.
Regiões de nuvem pública
Region |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
swedencentral | - | ✅ | - | - |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Regiões do Azure Governamental
Os seguintes modelos de Embeddings estão disponíveis no Azure Governamental:
ID do Modelo | Disponibilidade do modelo |
---|---|
text-embedding-ada-002 (versão 2) |
Gov. dos EUA – Virgínia Governo dos EUA do Arizona |
Modelos do DALL-E
ID do Modelo | Disponibilidade do recurso | Solicitação máxima (caracteres) |
---|---|---|
dalle2 (versão prévia) | Leste dos EUA | 1.000 |
dall-e-3 | Leste dos EUA, Leste da Austrália, Suécia Central | 4.000 |
Modelos de ajuste fino
babbage-002
e davinci-002
não são treinados para seguir as instruções. Consultar esses modelos base só deve ser feito como um ponto de referência para uma versão ajustada para avaliar o progresso do treinamento.
gpt-35-turbo-0613
: o ajuste fino desse modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está disponível.
ID do Modelo | Regiões com ajuste fino | Máx. de solicitações (tokens) | Dados de treinamento (até) |
---|---|---|---|
babbage-002 |
Centro-Norte dos EUA Suécia Central |
16.384 | Setembro de 2021 |
davinci-002 |
Centro-Norte dos EUA Suécia Central |
16.384 | Setembro de 2021 |
gpt-35-turbo (0613) |
Leste dos EUA 2 Centro-Norte dos EUA Suécia Central |
4\.096 | Setembro de 2021 |
gpt-35-turbo (1106) |
Leste dos EUA 2 Centro-Norte dos EUA Suécia Central |
Input: 16,385 Output: 4,096 |
Setembro de 2021 |
gpt-35-turbo (0125) |
Leste dos EUA 2 Centro-Norte dos EUA Suécia Central |
16.385 | Setembro de 2021 |
Modelos de sussurro
ID do Modelo | Disponibilidade do modelo | Solicitação máxima (tamanho do arquivo de áudio) |
---|---|---|
whisper |
Leste dos EUA 2 Centro-Norte dos EUA Leste da Noruega Sul da Índia Suécia Central Europa Ocidental |
25 MB |
Modelos de conversão de texto em fala (versão prévia)
ID do Modelo | Disponibilidade do modelo |
---|---|
tts-1 |
Centro-Norte dos EUA Suécia Central |
tts-1-hd |
Centro-Norte dos EUA Suécia Central |
Assistentes (versão prévia)
Para Assistentes, você precisa de uma combinação de um modelo com suporte e uma região com suporte. Determinadas ferramentas e funcionalidades exigem os modelos mais recentes. Os modelos a seguir estão disponíveis na API de Assistentes, no SDK, no Azure AI Studio e no Azure OpenAI Studio. A tabela a seguir é para pagamento conforme o uso. Para obter informações sobre a disponibilidade da unidade de produtividade provisionado (PTU), veja rendimento provisionado.
Region | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Leste da Austrália | ✅ | ✅ | ✅ | ✅ | |
Leste dos EUA | ✅ | ✅ | |||
Leste dos EUA 2 | ✅ | ✅ | ✅ | ||
França Central | ✅ | ✅ | ✅ | ✅ | |
Leste da Noruega | ✅ | ||||
Suécia Central | ✅ | ✅ | ✅ | ✅ | |
Sul do Reino Unido | ✅ | ✅ | ✅ | ✅ |