Modelos Azure OpenAI Service

Artigo
04/24/2024

O Azure OpenAI Service tem a tecnologia diversificada de um conjunto de modelos com diferentes capacidades e níveis de preços. A disponibilidade do modelo varia por região. Para a GPT-3 e outros modelos a descontinuar em julho de 2024, consulte modelos legados do Azure OpenAI Service.

Modelos	Description
GPT-4	Um conjunto de modelos que melhoram o GPT-3.5 e podem compreender e gerar linguagem natural e código.
GPT-3,5	Um conjunto de modelos que melhoram o GPT-3 e podem compreender e gerar linguagem natural e código.
Incorporações	Um conjunto de modelos que podem converter texto em forma vetorial numérica para facilitar a semelhança de texto.
DALL-E	Uma série de modelos que podem gerar imagens originais a partir de linguagem natural.
Sussurro	Uma série de modelos em pré-visualização que podem transcrever e traduzir fala em texto.
Conversão de texto em fala (Pré-visualização)	Uma série de modelos em pré-visualização que podem sintetizar texto em voz.

GPT-4 e GPT-4 Turbo Preview

GPT-4 é um grande modelo multimodal (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores da OpenAI. Como o GPT-3.5 Turbo, o GPT-4 é otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais. Use a API de conclusão de bate-papo para usar GPT-4. Para saber mais sobre como interagir com o GPT-4 e a API de Conclusão de Chat, confira nosso tutorial detalhado.

GPT-4 Turbo com Visão é a versão do GPT-4 que aceita entradas de imagem. Está disponível como modelo vision-preview de gpt-4.

gpt-4
gpt-4-32k

Você pode ver o comprimento do contexto do token suportado por cada modelo na tabela de resumo do modelo.

GPT-3,5

Os modelos GPT-3.5 podem compreender e gerar linguagem natural ou código. O modelo mais capaz e econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais também. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem recursos semelhantes ao text-davinci-003 uso da API de Conclusão em vez da API de Conclusão de Chat. Recomendamos o uso do GPT-3.5 Turbo e GPT-3.5 Turbo Instruct sobre os modelos legados GPT-3.5 e GPT-3.

gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct

Você pode ver o comprimento do contexto do token suportado por cada modelo na tabela de resumo do modelo.

Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Conclusão de Chat, confira nosso tutorial detalhado.

Incorporações

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos incorporados. A fim de passar de usar text-embedding-ada-002 para text-embedding-3-large você precisaria gerar novas incorporações.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Em testes, a OpenAI relata que os modelos de incorporação de terceira geração, grandes e pequenos, oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL enquanto ainda mantêm o desempenho para tarefas em inglês com o benchmark MTEB.

Benchmark de avaliação	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Média MIRACL	31.4	44.0	54.9
Média MTEB	61,0	62.3	64.6

Os modelos de incorporação de terceira geração suportam a redução do tamanho da incorporação através de um novo dimensions parâmetro. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

O teste de benchmark MTEB da OpenAI descobriu que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de text-embeddings-ada-002 1.536 dimensões, o desempenho permanece ligeiramente melhor.

DALL-E

Os modelos DALL-E geram imagens a partir de prompts de texto fornecidos pelo usuário. O DALL-E 3 está geralmente disponível para uso com as APIs REST. DALL-E 2 e DALL-E 3 com SDKs de cliente estão em visualização.

Sussurro

Os modelos Whisper podem ser usados para conversão de fala em texto.

Você também pode usar o modelo Whisper por meio da API de transcrição em lote do Azure AI Speech. Confira O que é o modelo Whisper?, para saber mais sobre quando usar o Azure AI Speech versus o Azure OpenAI Service.

Conversão de texto em fala (Pré-visualização)

Os modelos de texto para fala do OpenAI, atualmente em visualização, podem ser usados para sintetizar texto para fala.

Você também pode usar o texto OpenAI para falar vozes por meio do Azure AI Speech. Para saber mais, consulte Texto do OpenAI para vozes de fala por meio do Serviço OpenAI do Azure ou do Guia de Fala do Azure AI.

Tabela de resumo do modelo e disponibilidade da região

Nota

Este artigo aborda apenas a disponibilidade de modelo/região que se aplica a todos os clientes do Azure OpenAI com tipos de implantação do Standard. Alguns clientes selecionados têm acesso a combinações de modelo/região que não estão listadas na tabela unificada abaixo. Essas tabelas também não se aplicam a clientes que usam apenas tipos de implantação provisionada que têm sua própria matriz de disponibilidade de modelo/região exclusiva. Para obter mais informações sobre implantações provisionadas, consulte nossa Orientação provisionada.

Disponibilidade do modelo de implantação padrão

`Region`	`gpt-4`, `0613`	`gpt-4`, `1106-Preview`	`gpt-4`, `0125-Preview`	`gpt-4`, `vision-preview`	`gpt-4-32k`, `0613`	`gpt-35-turbo`, `0301`	`gpt-35-turbo`, `0613`	`gpt-35-turbo`, `1106`	`gpt-35-turbo`, `0125`	`gpt-35-turbo-16k`, `0613`	`gpt-35-turbo-instruct`, `0914`	`text-embedding-ada-002`, `1`	`text-embedding-ada-002`, `2`	`text-embedding-3-small`, `1`	`text-embedding-3-large`, `1`	`babbage-002`, `1`	`dall-e-3`, `3.0`	`davinci-002`, `1`	`tts`, `001`	`tts-hd`, `001`	`whisper`, `001`
australiaeast	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	-	-	-	✅	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
canadaeast	✅	✅	-	-	✅	-	✅	✅	✅	✅	-	-	✅	✅	✅	-	-	-	-	-	-
eastus	-	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	-
eastus2	-	✅	-	-	-	-	✅	-	-	✅	-	-	✅	✅	✅	-	-	-	-	-	✅
francecentral	✅	✅	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
japaneast	-	-	-	✅	-	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
northcentralus	-	-	✅	-	-	-	✅	-	✅	✅	-	-	✅	-	-	✅	-	✅	✅	✅	✅
norwayeast	-	✅	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
E.U.A Centro-Sul	-	-	✅	-	-	✅	-	-	✅	-	-	✅	✅	-	-	-	-	-	-	-	-
southindia	-	✅	-	-	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	✅
suécia central	✅	✅	-	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅
norte da suíça	✅	-	-	✅	✅	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
uksouth	-	✅	-	-	-	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
westus	-	✅	-	✅	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-

Esta tabela não inclui o ajuste fino da disponibilidade regional, consulte a seção dedicada ao ajuste fino para obter essas informações.

Cota de modelo de implantação padrão

A cota padrão para modelos varia de acordo com o modelo e a região. Os limites de cota padrão estão sujeitos a alterações.

A cota para implantações padrão é descrita em termos de Tokens por minuto (TPM).

País/Região	GPT-4	GPT-4-32K	GPT-4-Turbo	GPT-4-Turbo-V	GPT-35-Turbo	GPT-35-Turbo-Instruir	Incorporação de texto-Ada-002	incorporação de texto-3-pequeno	incorporação de texto-3-grande	Babbage-002	Babbage-002 - ajuste fino	Davinci-002	Davinci-002 - ajuste fino	GPT-35-Turbo - ajuste fino	GPT-35-Turbo-1106 - ajuste fino	GPT-35-Turbo-0125 - ajuste fino
australiaeast	40 K	80 K	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
canadaeast	40 K	80 K	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	-	-	-
eastus	-	-	80 K	-	240 K	240 K	240 K	350 K	350 K	-	-	-	-	-	-	-
eastus2	-	80 K	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	250 K	250 K	250 K
francecentral	20 mil	60 K	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
japaneast	-	-	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
northcentralus	-	-	80 K	-	300 K	-	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
norwayeast	-	-	150 K	-	-	-	350 K	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
E.U.A Centro-Sul	-	-	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
southindia	-	-	150 K	-	300 K	-	350 K	-	-	-	-	-	-	-	-	-
suécia central	40 K	80 K	150 K	30 K	300 K	240 K	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
norte da suíça	40 K	80 K	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
Suíça Oeste	-	-	-	-	-	-	-	-	-	-	250 K	-	250 K	250 K	250 K	250 K
uksouth	-	-	80 K	-	240 K	-	350 K	-	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
westus	-	-	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-

1 K = 1000 tokens por minuto (TPM). A relação entre TPM e solicitações por minuto (RPM) é atualmente definida como 6 RPM por 1000 TPM.

Modelos GPT-4 e GPT-4 Turbo Preview

GPT-4, GPT-4-32k e GPT-4 Turbo com Visão estão agora disponíveis para todos os clientes do Serviço OpenAI do Azure. A disponibilidade varia por região. Se não vir o GPT-4 na sua região, volte mais tarde.

Esses modelos só podem ser usados com a API de conclusão de bate-papo.

GPT-4 versão 0314 é a primeira versão do modelo lançado. A versão 0613 é a segunda versão do modelo e adiciona suporte a chamadas de função.

Consulte as versões do modelo para saber como o Serviço OpenAI do Azure lida com atualizações de versão do modelo e trabalhar com modelos para saber como exibir e configurar as configurações da versão do modelo de suas implantações GPT-4.

Nota

Versão 0314 de e gpt-4-32k será desativada não antes de 5 de julho de gpt-4 2024. Versão 0613 de e gpt-4-32k será desativada gpt-4 não antes de 30 de setembro de 2024. Consulte atualizações de modelo para obter o comportamento de atualização do modelo.

GPT-4 versão 0125-preview é uma versão atualizada do GPT-4 Turbo preview lançado anteriormente como versão 1106-preview. GPT-4 versão 0125-preview conclui tarefas como a geração de código mais completamente em comparação com gpt-4-1106-preview. Devido a isso, dependendo da tarefa, os clientes podem achar que GPT-4-0125-preview gera mais saída em comparação com o gpt-4-1106-preview. Recomendamos que os clientes comparem as saídas do novo modelo. O GPT-4-0125-preview também resolve bugs no gpt-4-1106-preview com manipulação UTF-8 para idiomas diferentes do inglês.

Importante

gpt-4 as versões 1106-Preview e 0125-Preview serão atualizadas com uma versão estável do gpt-4 no futuro. A atualização de implantação do 1106-Preview para gpt-4 o 0125-Preview agendada para 8 de março de gpt-4 2024 não está mais ocorrendo. As implantações das gpt-4 versões 1106-Preview e 0125-Preview definidas como "Atualização automática para padrão" e "Atualização quando expirada" começarão a ser atualizadas após o lançamento da versão estável. Para cada implantação, uma atualização da versão do modelo ocorre sem interrupção no serviço para chamadas de API. As atualizações são preparadas por região e espera-se que o processo completo de atualização leve 2 semanas. As implantações das versões 1106-Preview e 0125-Preview definidas como "Sem atualização automática" não serão atualizadas e deixarão de gpt-4 operar quando a versão de visualização for atualizada na região.

Model ID	Solicitação máxima (tokens)	Dados de formação (até)
`gpt-4` (0314)	8,192	Setembro 2021
`gpt-4-32k`(0314)	32,768	Setembro 2021
`gpt-4` (0613)	8,192	Setembro 2021
`gpt-4-32k` (0613)	32,768	Setembro 2021
`gpt-4` (1106-Pré-visualização)¹ GPT-4 Turbo Pré-visualização	Entrada: 128.000 Saída: 4.096	Abr 2023
`gpt-4` (0125-Pré-visualização)¹ GPT-4 Turbo Pré-visualização	Entrada: 128.000 Saída: 4.096	Dez 2023
`gpt-4` (visão-pré-visualização)² GPT-4 Turbo com Vision Preview	Entrada: 128.000 Saída: 4.096	Abr 2023

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) ou gpt-4 (1106-Preview). Para implantar esse modelo, em Implantações , selecione o modelo gpt-4. Em versão, selecione (0125-Preview) ou (1106-Preview).

2 GPT-4 Turbo com Vision Preview = gpt-4 (vision-preview). Para implantar esse modelo, em Implantações , selecione o modelo gpt-4. Para Versão do modelo , selecione vision-preview.

Atenção

Não recomendamos o uso de modelos de visualização em produção. Vamos atualizar todas as implantações de modelos de visualização para futuras versões de visualização e uma versão estável. Os modelos designados visualização não seguem o ciclo de vida padrão do modelo OpenAI do Azure.

Nota

As regiões onde GPT-4 (0314) & (0613) estão listadas como disponíveis têm acesso às versões 8K e 32K do modelo

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo Preview

Regiões de nuvem pública

`Region`	`gpt-4`, `0613`	`gpt-4`, `1106-Preview`	`gpt-4`, `0125-Preview`	`gpt-4`, `vision-preview`	`gpt-4-32k`, `0613`
australiaeast	✅	✅	-	✅	✅
canadaeast	✅	✅	-	-	✅
eastus	-	-	✅	-	-
eastus2	-	✅	-	-	-
francecentral	✅	✅	-	-	✅
japaneast	-	-	-	✅	-
northcentralus	-	-	✅	-	-
norwayeast	-	✅	-	-	-
E.U.A Centro-Sul	-	-	✅	-	-
southindia	-	✅	-	-	-
suécia central	✅	✅	-	✅	✅
norte da suíça	✅	-	-	✅	✅
uksouth	-	✅	-	-	-
westus	-	✅	-	✅	-

Selecionar acesso do cliente

Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 em regiões adicionais:

Modelo	País/Região
`gpt-4` (0314)	Leste dos EUA França Central Centro-Sul dos EUA Sul do Reino Unido
`gpt-4` (0613)	Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido

Regiões do Azure Government

Os seguintes modelos GPT-4 estão disponíveis com o Azure Government:

Model ID	Disponibilidade do modelo
`gpt-4` (1106-Pré-visualização)	US Gov - Virginia US Gov - Arizona

Modelos GPT-3.5

Importante

O modelo NEW gpt-35-turbo (0125) tem várias melhorias, incluindo maior precisão na resposta nos formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.

O GPT-3.5 Turbo é utilizado com a API de Conclusão de Chat. GPT-3.5 Turbo versão 0301 também pode ser usado com a API de conclusão, embora isso não seja recomendado. As versões GPT-3.5 Turbo 0613 e 1106 suportam apenas a API de conclusão de chat.

GPT-3.5 Turbo versão 0301 é a primeira versão do modelo lançado. A versão 0613 é a segunda versão do modelo e adiciona suporte a chamadas de função.

Nota

Versão 0613 de e gpt-35-turbo-16k será desativada não antes de 1º de agosto de gpt-35-turbo 2024. A versão 0301 do será desativada gpt-35-turbo não antes de 1º de agosto de 2024. Consulte atualizações de modelo para obter o comportamento de atualização do modelo.

Model ID	Solicitação máxima (tokens)	Dados de formação (até)
`gpt-35-turbo` 1 (0301)	4,096	Setembro 2021
`gpt-35-turbo` (0613)	4,096	Setembro 2021
`gpt-35-turbo-16k` (0613)	16,384	Setembro 2021
`gpt-35-turbo-instruct` (0914)	4,097	Setembro 2021
`gpt-35-turbo` (1106)	Entrada: 16.385 Saída: 4.096	Setembro 2021
`gpt-35-turbo` (0125) NOVO	16,385	Setembro 2021

Disponibilidade do modelo GPT-3.5-Turbo

Regiões de nuvem pública

`Region`	`gpt-35-turbo`, `0301`	`gpt-35-turbo`, `0613`	`gpt-35-turbo`, `1106`	`gpt-35-turbo`, `0125`	`gpt-35-turbo-16k`, `0613`	`gpt-35-turbo-instruct`, `0914`
australiaeast	-	✅	✅	-	✅	-
canadaeast	-	✅	✅	✅	✅	-
eastus	✅	✅	-	-	✅	✅
eastus2	-	✅	-	-	✅	-
francecentral	✅	✅	✅	-	✅	-
japaneast	-	✅	-	-	✅	-
northcentralus	-	✅	-	✅	✅	-
E.U.A Centro-Sul	✅	-	-	✅	-	-
southindia	-	-	✅	-	-	-
suécia central	-	✅	✅	-	✅	✅
norte da suíça	-	✅	-	-	✅	-
uksouth	✅	✅	✅	-	✅	-
westeurope	✅	-	-	-	-	-
westus	-	-	✅	-	-	-

1 Este modelo aceitará solicitações > de 4.096 tokens. Não é recomendado exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo está limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com este modelo, essa configuração não é oficialmente suportada.

Regiões do Azure Government

Os seguintes modelos GPT-3.5 turbo estão disponíveis com o Azure Government:

Model ID	Disponibilidade do modelo
`gpt-35-turbo` (1106-Pré-visualização)	US Gov - Virginia

Incorporação de modelos

Esses modelos só podem ser usados com solicitações de API de incorporação.

Nota

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos de incorporação. Para migrar do uso text-embedding-ada-002 para text-embedding-3-large você, seria necessário gerar novas incorporações.

Model ID	Solicitação máxima (tokens)	Dimensões de saída	Dados de formação (até)
`text-embedding-ada-002` (versão 2)	8,191	1,536	Setembro 2021
`text-embedding-ada-002` (versão 1)	2,046	1,536	Setembro 2021
`text-embedding-3-large`	8,191	3,072	Setembro 2021
`text-embedding-3-small`	8,191	1,536	Setembro 2021

Nota

Ao enviar uma matriz de entradas para incorporação, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de incorporação é 2048.

Regiões de nuvem pública

`Region`	`text-embedding-ada-002`, `1`	`text-embedding-ada-002`, `2`	`text-embedding-3-small`, `1`	`text-embedding-3-large`, `1`
australiaeast	-	✅	-	-
brazilsouth	-	✅	-	-
canadaeast	-	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	-	✅	✅	✅
francecentral	-	✅	-	-
japaneast	-	✅	-	-
northcentralus	-	✅	-	-
norwayeast	-	✅	-	-
southafricanorth	-	✅	-	-
E.U.A Centro-Sul	✅	✅	-	-
southindia	-	✅	-	-
suécia central	-	✅	-	-
norte da suíça	-	✅	-	-
uksouth	-	✅	-	-
westeurope	-	✅	-	-
westus	-	✅	-	-
westus3	-	✅	-	-

Regiões do Azure Government

Os seguintes modelos de Incorporações estão disponíveis com o Azure Government:

Model ID	Disponibilidade do modelo
`text-embedding-ada-002` (versão 2)	US Gov - Virginia US Gov - Arizona

Modelos DALL-E

Model ID	Disponibilidade de recursos	Max Request (caracteres)
dalle2 (pré-visualização)	E.U.A. Leste	1,000
DALL-E-3	Leste dos EUA, Leste da Austrália, Suécia Central	4,000

Modelos de ajuste fino

babbage-002 e davinci-002 não são treinados para seguir instruções. A consulta a esses modelos básicos deve ser feita apenas como um ponto de referência para uma versão ajustada para avaliar o progresso do seu treinamento.

gpt-35-turbo - O ajuste fino deste modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está disponível.

Model ID	Regiões de ajuste fino	Solicitação máxima (tokens)	Dados de formação (até)
`babbage-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,384	Setembro 2021
`davinci-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,384	Setembro 2021
`gpt-35-turbo` (0613)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	4,096	Setembro 2021
`gpt-35-turbo` (1106)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	Entrada: 16.385 Saída: 4.096	Setembro 2021
`gpt-35-turbo` (0125)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,385	Setembro 2021

Modelos de sussurro

Model ID	Disponibilidade do modelo	Max Request (tamanho do arquivo de áudio)
`whisper`	Leste dos EUA 2 Centro-Norte dos EUA Leste da Noruega Sul da Índia Suécia Central Europa Ocidental	25 MB

Modelos de conversão de texto em fala (Pré-visualização)

Model ID	Disponibilidade do modelo
`tts-1`	Centro-Norte dos EUA Suécia Central
`tts-1-hd`	Centro-Norte dos EUA Suécia Central

Assistentes (Pré-visualização)

Para assistentes, você precisa de uma combinação de um modelo suportado e uma região suportada. Certas ferramentas e capacidades requerem os modelos mais recentes. Os modelos a seguir estão disponíveis na API de Assistentes, SDK, Azure AI Studio e Azure OpenAI Studio. A tabela a seguir é para pagamento conforme o uso. Para obter informações sobre a disponibilidade da PTU (Unidade de Taxa de Transferência Provisionada), consulte Taxa de transferência provisionada.

País/Região	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`
Leste da Austrália	✅	✅	✅	✅
E.U.A. Leste	✅				✅
E.U.A. Leste 2	✅		✅	✅
França Central	✅	✅	✅	✅
Leste da Noruega				✅
Suécia Central	✅	✅	✅	✅
Sul do Reino Unido	✅	✅	✅	✅

Modelos Azure OpenAI Service

GPT-4 e GPT-4 Turbo Preview

GPT-3,5

Incorporações

DALL-E

Sussurro

Conversão de texto em fala (Pré-visualização)

Tabela de resumo do modelo e disponibilidade da região

Disponibilidade do modelo de implantação padrão

Cota de modelo de implantação padrão

Modelos GPT-4 e GPT-4 Turbo Preview

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo Preview

Regiões de nuvem pública

Selecionar acesso do cliente

Regiões do Azure Government

Modelos GPT-3.5

Disponibilidade do modelo GPT-3.5-Turbo

Regiões de nuvem pública

Regiões do Azure Government

Incorporação de modelos

Regiões de nuvem pública

Regiões do Azure Government

Modelos DALL-E

Modelos de ajuste fino

Modelos de sussurro

Modelos de conversão de texto em fala (Pré-visualização)

Assistentes (Pré-visualização)

Próximos passos

Recursos adicionais