Azure OpenAI em Modelos de Fundição de IA do Azure

2025-07-02

O Azure OpenAI é alimentado por um conjunto diversificado de modelos com diferentes capacidades e preços. A disponibilidade do modelo varia de acordo com a região e a nuvem. Para obter a disponibilidade do modelo do Azure Government, consulte Azure Government OpenAI Service.

Modelos	Descrição
códice-mini	Versão afinada do o4-mini.
Série GPT-4.1	Lançamento do modelo mais recente da Azure OpenAI
modelo-router	Um modelo que seleciona de forma inteligente a partir de um conjunto de modelos de chat subjacentes para responder a uma determinada solicitação.
visualização-do-uso-do-computador	Um modelo experimental treinado para uso com a ferramenta de uso do computador da API de Respostas.
Pré-visualização GPT-4.5	O mais recente modelo GPT que se destaca em diversas tarefas de texto e imagem.
Modelos da série O	Modelos de raciocínio com resolução avançada de problemas e maior foco e capacidade.
GPT-4o & GPT-4o mini & GPT-4 Turbo	Os modelos mais recentes e capazes do Azure OpenAI com versões multimodais, que podem aceitar texto e imagens como entrada.
GPT-4	Um conjunto de modelos que melhoram o GPT-3.5 e podem compreender e gerar linguagem natural e código.
GPT-3,5	Um conjunto de modelos que melhoram o GPT-3 e podem compreender e gerar linguagem natural e código.
Incorporações	Um conjunto de modelos que podem converter texto em forma vetorial numérica para facilitar a medição da semelhança de textos.
Geração de imagens	Uma série de modelos que podem gerar imagens originais a partir de linguagem natural.
Áudio	Uma série de modelos para conversão de fala para texto, tradução, e de texto para fala. Os modelos de áudio GPT-4o suportam tanto interações conversacionais de baixa latência, do tipo "fala entra, fala sai", quanto geração de áudio.

Série GPT 4.1

Disponibilidade da região

Modelo	Região
`gpt-4.1` (2025-04-14)	Consulte a tabela de modelos.
`gpt-4.1-nano` (2025-04-14)	Consulte a tabela de modelos.
`gpt-4.1-mini` (2025-04-14)	Consulte a tabela de modelos.

Capacidades

ID do modelo	Descrição	Janela de contexto	Máximo de Tokens de Saída	Dados de formação (até)
`gpt-4.1` (2025-04-14)	- Entrada de texto e imagem - Saída de texto - API de completões de chat - API de Respostas - Streaming - Chamadas de função Saídas estruturadas (conclusões de chat)	- 1,047,576 - 128.000 (implantações gerenciadas provisionadas) - 300.000 (implantações em lote)	32,768	31 de maio de 2024
`gpt-4.1-nano` (2025-04-14)	- Entrada de texto e imagem - Saída de texto - API de completões de chat - API de Respostas - Streaming - Chamadas de função Saídas estruturadas (conclusões de chat)	- 1,047,576 - 128.000 (implantações gerenciadas provisionadas) - 300.000 (implantações em lote)	32,768	31 de maio de 2024
`gpt-4.1-mini` (2025-04-14)	- Entrada de texto e imagem - Saída de texto - API de completões de chat - API de Respostas - Streaming - Chamadas de função Saídas estruturadas (conclusões de chat)	- 1,047,576 - 128.000 (implantações gerenciadas provisionadas) - 300.000 (implantações em lote)	32,768	31 de maio de 2024

modelo-router

Um modelo que seleciona de forma inteligente a partir de um conjunto de modelos de chat subjacentes para responder a uma determinada solicitação.

Disponibilidade da região

Modelo	Região
`model-router` (2025-05-19)	Leste dos EUA 2 (Padrão Global), Suécia Central (Padrão Global)

Capacidades

ID do modelo	Descrição	Janela de contexto	Máximo de Tokens de Saída	Dados de formação (até)
`model-router` (2025-05-19)	Um modelo que seleciona de forma inteligente a partir de um conjunto de modelos de chat subjacentes para responder a uma determinada solicitação.	200,000*	32768 (GPT série 4.1) 100 K (o4-mini)	31 de maio de 2024

*Janelas de contexto maiores são compatíveis com alguns dos modelos subjacentes, o que significa que uma chamada de API com um contexto maior só terá êxito se o prompt for roteado para o modelo certo, caso contrário, a chamada falhará.

pré-visualização do uso do computador

Um modelo experimental treinado para uso com a ferramenta Responses API de uso informático. Ele pode ser usado em conjunto com bibliotecas de terceiros para permitir que o modelo controle os comandos de mouse e teclado enquanto obtém contexto de capturas de ecrã do ambiente atual.

Atenção

Não recomendamos o uso de modelos de visualização em produção. Atualizaremos todas as implantações de modelos de visualização para futuras versões de visualização ou para a versão estável mais recente do GA. Os modelos designados como visualização não seguem o ciclo de vida padrão do modelo OpenAI do Azure.

Disponibilidade

Para o acesso ao computer-use-preview registro é necessário, e o acesso será concedido com base nos critérios de elegibilidade da Microsoft. Os clientes que têm acesso a outros modelos de acesso limitado ainda precisarão solicitar acesso para esse modelo.

Solicitar acesso: computer-use-preview aplicativo modelo de acesso limitado

Depois que o acesso for concedido, você precisará criar uma implantação para o modelo.

Disponibilidade da região

Modelo	Região
`computer-use-preview`	Consulte a tabela de modelos.

Capacidades

ID do modelo	Descrição	Janela de contexto	Máximo de Tokens de Saída	Dados de formação (até)
`computer-use-preview` (2025-03-11)	Modelo especializado para uso com a ferramenta API Responses para uso de computador -Ferramentas Streaming -Texto (entrada/saída) - Imagem (entrada)	8,192	1,024	Outubro de 2023

Pré-visualização GPT-4.5

Disponibilidade da região

Modelo	Região
`gpt-4.5-preview`	Consulte a tabela de modelos.

Capacidades

ID do modelo	Descrição	Janela de contexto	Máximo de Tokens de Saída	Dados de formação (até)
`gpt-4.5-preview` (2025-02-27) Pré-visualização GPT-4.5	GPT 4.1 é o substituto recomendado para este modelo. Sobressai-se em tarefas diversificadas de texto e imagem. - Resultados estruturados - Prompt de cache - Ferramentas - Streaming - Texto (entrada/saída) - Imagem (entrada)	128,000	16,384	Outubro de 2023

Observação

Espera-se que o modelo não consiga responder a perguntas sobre si mesmo. Se você quiser saber quando é o ponto de corte de conhecimento para os dados de treinamento do modelo, ou outros detalhes sobre o modelo, consulte a documentação do modelo acima.

Modelos da série O

Os modelos da série o do Azure OpenAI são^* projetados especificamente para lidar com tarefas de raciocínio e resolução de problemas com maior foco e capacidade. Esses modelos gastam mais tempo processando e entendendo a solicitação do usuário, tornando-os excepcionalmente fortes em áreas como ciência, codificação e matemática em comparação com iterações anteriores.

ID do modelo	Descrição	Pedido Máximo (tokens)	Dados de formação (até)
`codex-mini` (2025-05-16)	Versão afinada do o4-mini. - API de respostas - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas Resumo completo das capacidades	Entrada: 200 000 Saída: 100 000	31 de maio de 2024
`o3-pro` (2025-06-10)	- API de respostas - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas Resumo completo das capacidades	Entrada: 200 000 Saída: 100 000	31 de maio de 2024
`o4-mini` (2025-04-16)	- NOVO modelo de raciocínio, oferecendo capacidades de raciocínio melhoradas. - API de conclusão de bate-papo - API de respostas - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas Resumo completo das capacidades	Entrada: 200 000 Saída: 100 000	31 de maio de 2024
`o3` (2025-04-16)	- NOVO modelo de raciocínio, oferecendo capacidades de raciocínio melhoradas. - API de conclusão de bate-papo - API de respostas - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas/Chamada de ferramentas paralelas Resumo completo das capacidades	Entrada: 200 000 Saída: 100 000	31 de maio de 2024
`o3-mini` (2025-01-31)	- Capacidades de raciocínio melhoradas. - Resultados estruturados - Processamento apenas de texto - Funções/Ferramentas	Entrada: 200 000 Saída: 100 000	Outubro de 2023
`o1` (2024-12-17)	- Capacidades de raciocínio melhoradas. - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas	Entrada: 200 000 Saída: 100 000	Outubro de 2023
`o1-preview` (2024-09-12)	Versão de pré-visualização mais antiga	Entrada: 128.000 Potência: 32.768	Outubro de 2023
`o1-mini` (2024-09-12)	Uma opção mais rápida e económica na série o1, ideal para tarefas de codificação que exigem velocidade e menor consumo de recursos. Implantação padrão global disponível automaticamente. Atualmente, as implementações padrão (regionais) estão disponíveis apenas para clientes selecionados que receberam acesso como parte do lançamento de `o1-preview` acesso limitado.	Entrada: 128.000 Saída: 65.536	Outubro de 2023

Disponibilidade

Para saber mais sobre os modelos avançados o-series , consulte Introdução aos modelos de raciocínio.

Disponibilidade da região

Modelo	Região
`codex-mini`	Leste dos EUA 2 & Suécia Central (Padrão Global)
`o3-pro`	Leste dos EUA 2 & Suécia Central (Padrão Global)
`o4-mini`	Consulte a tabela de modelos.
`o3`	Consulte a tabela de modelos.
`o3-mini`	Consulte a tabela de modelos.
`o1`	Consulte a tabela de modelos.
`o1-preview`	Consulte a tabela de modelos. Este modelo só está disponível para clientes aos quais foi concedido acesso como parte do acesso limitado original
`o1-mini`	Consulte a tabela de modelos.

GPT-4o e GPT-4 Turbo

O GPT-4o integra texto e imagens em um único modelo, permitindo lidar com vários tipos de dados simultaneamente. Esta abordagem multimodal aumenta a precisão e a capacidade de resposta nas interações homem-computador. O GPT-4o combina com o GPT-4 Turbo em tarefas de texto e codificação em inglês, oferecendo desempenho superior em idiomas diferentes do inglês e tarefas de visão, estabelecendo novos padrões para os recursos de IA.

Como faço para acessar os modelos GPT-4o e GPT-4o mini?

GPT-4o e GPT-4o mini estão disponíveis para implantação de modelos padrão e padrão-global.

Você precisa criar ou usar um recurso existente numa região com um padrão suportado ou padrão global onde o modelo está disponível.

Quando seu recurso é criado, você pode implantar os modelos GPT-4o. Se você estiver executando uma implantação programática, os nomes dos modelos são:

gpt-4o Versão2024-11-20
gpt-4o Versão2024-08-06
gpt-4o Versão2024-05-13
gpt-4o-mini Versão2024-07-18

GPT-4 Turbo

GPT-4 Turbo é um grande modelo multimodal (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores da OpenAI. Como o GPT-3.5 Turbo e os modelos GPT-4 mais antigos, o GPT-4 Turbo é otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais.

GPT-4

O GPT-4 é o antecessor do GPT-4 Turbo. Ambos os modelos GPT-4 e GPT-4 Turbo têm um nome de modelo base de gpt-4. Você pode distinguir entre os modelos GPT-4 e Turbo examinando a versão do modelo.

gpt-4 Versão0314
gpt-4 Versão0613
gpt-4-32k Versão0613

Você pode ver o comprimento do contexto do token suportado por cada modelo na tabela de resumo do modelo.

Modelos GPT-4 e GPT-4 Turbo

Esses modelos só podem ser usados com a API de conclusão de bate-papo.

Consulte Versões de modelo para saber como o Azure OpenAI lida com atualizações de versão de modelo e trabalhar com modelos para saber como exibir e definir as configurações de versão de modelo de suas implantações GPT-4.

ID do modelo	Descrição	Pedido Máximo (tokens)	Dados de formação (até)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	O mais recente grande modelo GA - Resultados estruturados - Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em idiomas diferentes do inglês e em tarefas de visão. - Capacidade de escrita criativa melhorada	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o` (2024-08-06) GPT-4o (Omni)	- Resultados estruturados - Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em línguas diferentes do inglês e em tarefas de visão	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini \|	O mais recente modelo GA pequeno - Modelo rápido, barato e capaz, ideal para substituir os modelos da série GPT-3.5 Turbo. - Texto, processamento de imagem - Modo JSON - Chamada de função paralela	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em línguas diferentes do inglês e em tarefas de visão	Entrada: 128.000 Saída: 4,096	Outubro de 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo com Visão	Novo modelo GA - Substituição de todos os modelos anteriores de pré-visualização GPT-4 (`vision-preview`, `1106-Preview`, `0125-Preview`). - Atualmente, a disponibilidade do recurso é diferente, dependendo do método de entrada e do tipo de implantação.	Entrada: 128.000 Saída: 4,096	Dez 2023
`gpt-4-32k` (0613)	Modelo GA mais antigo - Chamada básica de funções com ferramentas	32,768	Setembro 2021
`gpt-4` (0613)	Modelo GA mais antigo - Chamada básica de funções com ferramentas	8,192	Setembro 2021
`gpt-4-32k`(0314)	Modelo GA mais antigo - Informações sobre aposentadoria	32,768	Setembro 2021
`gpt-4` (0314)	Modelo GA mais antigo - Informações sobre aposentadoria	8,192	Setembro 2021

Atenção

GPT-3,5

Os modelos GPT-3.5 podem compreender e gerar linguagem natural ou código. O modelo mais capaz e econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais também. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem capacidades semelhantes ao text-davinci-003 usando a API de Conclusões ao invés da API de Conclusões de Chat. Recomendamos o uso do GPT-3.5 Turbo e GPT-3.5 Turbo Instruct sobre os modelos legados GPT-3.5 e GPT-3.

ID do modelo	Descrição	Pedido Máximo (tokens)	Dados de formação (até)
`gpt-35-turbo` (0125) NOVO	Modelo GA mais recente - Modo JSON - Chamada de função paralela - Resultado reprodutível (visualização prévia) - Maior precisão na resposta nos formatos solicitados. - Correção de um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.	Entrada: 16.385 Saída: 4,096	Setembro 2021
`gpt-35-turbo` (1106)	Modelo GA mais antigo - Modo JSON - Chamada de função paralela - Resultado reprodutível (pré-visualização)	Entrada: 16.385 Saída: 4,096	Setembro 2021
`gpt-35-turbo-instruct` (0914)	Somente ponto final de conclusões - Substituição de modelos de completamento antigos	4,097	Setembro 2021

Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Conclusão de Chat, confira nosso tutorial detalhado.

¹ Este modelo aceitará solicitações > de 4.096 tokens. Não é recomendado exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo está limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com este modelo, essa configuração não é oficialmente suportada.

Incorporações

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos de embeddings. A fim de passar de usar text-embedding-ada-002 para text-embedding-3-large você precisaria gerar novas incorporações.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Em testes, a OpenAI relata que os modelos de incorporação de terceira geração, grandes e pequenos, oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL enquanto ainda mantêm o desempenho para tarefas em inglês com o benchmark MTEB .

Padrão de Avaliação	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Média MIRACL	31,4	44.0	54.9
média de MTEB	61.0	62.3	64.6

Os modelos de incorporação de terceira geração suportam a redução do tamanho da incorporação através de um novo dimensions parâmetro. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

O teste de benchmark MTEB da OpenAI descobriu que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de text-embeddings-ada-002 1.536 dimensões, o desempenho permanece ligeiramente melhor.

Modelos de geração de imagem

Os modelos de geração de imagem geram imagens a partir de prompts de texto que o usuário fornece. GPT-image-1 está em visualização pública de acesso limitado. O DALL-E 3 está geralmente disponível para uso com as APIs REST. DALL-E 2 e DALL-E 3 com SDKs para clientes estão em pré-visualização.

Disponibilidade

Para o acesso ao gpt-image-1 registro é necessário, e o acesso será concedido com base nos critérios de elegibilidade da Microsoft. Os clientes que têm acesso a outros modelos de acesso limitado ainda precisarão solicitar acesso para esse modelo.

Solicitar acesso: gpt-image-1 aplicativo modelo de acesso limitado

Depois que o acesso for concedido, você precisará criar uma implantação para o modelo.

Disponibilidade da região

Modelo	Região
`dall-e-3`	E.U.A. Leste Leste da Austrália Suécia Central
`gpt-image-1`	Oeste dos EUA 3 (Padrão Global) Norte dos Emirados Árabes Unidos (Padrão Global) Polónia Central (Norma Global)

Modelos de geração de vídeo

Sora é um modelo de IA da OpenAI que pode criar cenas de vídeo realistas e imaginativas a partir de instruções de texto. Sora está em pré-visualização pública.

Disponibilidade da região

Modelo	Região
`sora`	E.U.A. Leste 2

Modelos de áudio

Os modelos de áudio no Azure OpenAI estão disponíveis através das realtimeAPIs , completionse audio .

Modelos de áudio GPT-4o

Os modelos de áudio GPT 4o fazem parte da família de modelos GPT-4o e suportam interações conversacionais de baixa latência, "speech in, speech out" ou geração de áudio.

Atenção

Detalhes sobre tokens de solicitação máxima e dados de treinamento estão disponíveis na tabela a seguir.

ID do modelo	Descrição	Pedido Máximo (tokens)	Dados de formação (até)
`gpt-4o-mini-audio-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para geração de áudio e texto.	Entrada: 128.000 Saída: 4,096	Outubro de 2023
`gpt-4o-mini-realtime-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real.	Entrada: 128.000 Saída: 4,096	Outubro de 2023
`gpt-4o-audio-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para geração de áudio e texto.	Entrada: 128.000 Saída: 4,096	Outubro de 2023
`gpt-4o-realtime-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real.	Entrada: 128.000 Saída: 4,096	Outubro de 2023
`gpt-4o-mini-realtime-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real.	Entrada: 128.000 Saída: 4,096	Outubro de 2023

Para comparar a disponibilidade de modelos de áudio GPT-4o em todas as regiões, consulte a tabela de modelos.

API de áudio

Os modelos de áudio por meio da /audio API podem ser usados para conversão de fala em texto, tradução e conversão de texto em fala.

Modelos de transcrição de fala para texto

ID do modelo	Descrição	Max Request (tamanho do arquivo de áudio)
`whisper`	Modelo de reconhecimento de fala de uso geral.	25 MB
`gpt-4o-transcribe`	Reconhecimento de voz para texto impulsionado por GPT-4o.	25 MB
`gpt-4o-mini-transcribe`	Transcrição de voz para texto potenciada por GPT-4o mini.	25 MB

Modelos de tradução de fala

ID do modelo	Descrição	Max Request (tamanho do arquivo de áudio)
`whisper`	Modelo de reconhecimento de fala de uso geral.	25 MB

Modelos de conversão de texto em fala (Pré-visualização)

ID do modelo	Descrição
`tts`	Conversão de texto em fala otimizada para velocidade.
`tts-hd`	Leitura de texto em voz otimizada para uma qualidade superior.
`gpt-4o-mini-tts`	Modelo de texto para voz potenciado por GPT-4o mini. Você pode guiar a voz para falar em um estilo ou tom.

Para obter mais informações, consulte Disponibilidade de modelos de áudio por região neste artigo.

Tabela de resumo do modelo e disponibilidade da região

Modelos por tipo de implantação

O Azure OpenAI oferece aos clientes opções sobre a estrutura de hospedagem que se adapta aos seus padrões de negócios e uso. O serviço oferece dois tipos principais de implantação:

O Standard é oferecido com uma opção de implantação global, roteando o tráfego globalmente para fornecer uma taxa de transferência mais alta.
Provisioned é também oferecido com uma opção de implementação global, permitindo que os clientes possam adquirir e distribuir unidades de throughput provisionadas na infraestrutura global do Azure.

Todas as implantações podem executar exatamente as mesmas operações de inferência, no entanto, o faturamento, a escala e o desempenho são substancialmente diferentes. Para saber mais sobre os tipos de implantação do Azure OpenAI, consulte nosso guia de tipos de implantação.

Disponibilidade do modelo padrão global

Região	O3-PRO, 2025-06-10	códice-mini, 2025-05-16	modelo-router, 2025-05-19	o3, 2025-04-16	o4-mini, 2025-04-16	gpt-imagem-1, 2025-04-15	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	pré-visualização de uso do computador, 2025-03-11	Pré-visualização do GPT-4.5, 2025-02-27	O3-Mini, 2025-01-31	o1, 2024-12-17	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18	GPT-4, turbo-2024-04-09	text-embedding-3-small, 1	incorporação de texto-3-grande, 1	incorporação de textos-ada-002, 2	gpt-4o-pré-visualização em tempo real, 2024-12-17	gpt-4o-áudio-prévia, 2024-12-17	gpt-4o-mini-visualização em tempo real, 2024-12-17	gpt-4o-mini-áudio-pré-visualização, 2024-12-17	gpt-4o-transcribe, 2025-03-20	GPT-4O-Mini-TTS, 2025-03-20	gpt-4o-mini-transcribe, 2025-03-20
leste da Austrália	-	-	-	-	-	-	✅	✅	✅	-	-	✅	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Brasil Sul	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Canadá Leste	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Eastus	-	-	-	-	-	-	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	✅	-	-	-
Eastus2	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Alemanha Oeste Central	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
ItáliaNorte	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	-	-	✅	✅	-	✅	✅	✅	-	-	-	-	-	-	-
JapãoLeste	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Coreia Central	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Centro-Norte	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Noruega Oriental	-	-	-	-	-	-	✅	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Polónia Central	-	-	-	-	-	✅	✅	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
África do SulNorte	-	-	-	-	-	-	✅	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Centro-Sul	-	-	-	-	-	-	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Sul da Índia	-	-	-	-	-	-	-	✅	✅	✅	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
EspanhaCentral	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
suécia central	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	-	✅
suíçanorte	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
UAENORTH	-	-	-	-	-	✅	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
UKSOUTH	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Europa Ocidental	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Westus	-	-	-	-	-	-	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-
Westus3	-	-	-	-	-	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-	-

Observação

o1-mini está atualmente disponível para todos os clientes para implementação com padrão global.

Alguns clientes receberam acesso de implantação padrão (regional) a o1-mini como parte de o1-preview a versão de acesso limitado. Neste momento, o acesso a o1-mini implementações padrão (regionais) não está a ser expandido.

Disponibilidade global do modelo gerido provisionado

Região	o3 2025-04-16	o4-mini 2025-04-16	GPT-4,1 2025-04-14	GPT-4.1-nano 2025-04-14	GPT-4.1-mini 2025-04-14	O3-Mini 31-01-2025	o1 17-12-2024	GPT-4O 13 de maio de 2024	GPT-4O 2024-08-06	GPT-4O 2024-11-20	GPT-4O-Mini 18-07-2024	DeepSeek-R1	DeepSeek-V3-0324	DeepSeek-R1-0528
leste da Austrália	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Brasil Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Canadá Leste	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Alemanha Oeste Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
ItáliaNorte	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
JapãoLeste	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Coreia Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Centro-Norte	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Noruega Oriental	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Polónia Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
África do SulNorte	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Sudeste Asiático	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Sul da Índia	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
EspanhaCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suíçanorte	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Suíça Oeste	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
UAENORTH	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
UKSOUTH	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Europa Ocidental	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade global do modelo de processamento em lote

Região	o3, 2025-04-16	o4-mini, 2025-04-16	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	O3-Mini, 2025-01-31	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18
leste da Austrália	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Brasil Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Canadá Leste	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Alemanha Oeste Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
JapãoLeste	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Coreia Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Noruega Oriental	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Polónia Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Sul da Índia	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suíçanorte	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
UKSOUTH	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Europa Ocidental	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade do modelo padrão da zona de dados

Região	o3, 2025-04-16	o4-mini, 2025-04-16	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	O3-Mini, 2025-01-31	o1, 2024-12-17	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18
Eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
Alemanha Oeste Central	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
ItáliaNorte	✅	✅	✅	✅	-	✅	✅	-	-	✅	✅
Northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Polónia Central	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
EspanhaCentral	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
Europa Ocidental	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅
Westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Observação

o1-mini está atualmente disponível para todos os clientes para implementação com padrão global.

Disponibilidade de modelo gerido proporcionado pela zona de dados

Região	o3, 2025-04-16	o4-mini, 2025-04-16	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	O3-Mini, 2025-01-31	o1, 2024-12-17	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18
Eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Alemanha Oeste Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
ItáliaNorte	✅	✅	✅	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅
Polónia Central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
EspanhaCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Europa Ocidental	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade do modelo em lote da zona de dados

Região	o3, 2025-04-16	o4-mini, 2025-04-16	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	O3-Mini, 2025-01-31	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18
Eastus	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	✅	✅	✅	✅	✅	-	✅	✅
Alemanha Oeste Central	✅	✅	✅	✅	✅	-	✅	✅
Centro-Norte	✅	✅	✅	✅	✅	✅	✅	✅
Polónia Central	✅	✅	✅	✅	✅	-	✅	✅
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	-	✅	✅
Europa Ocidental	✅	✅	✅	✅	✅	-	✅	✅
Westus	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade do modelo de implantação padrão

Região	Sora, 2025-05-02	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-11-20	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, turbo-2024-04-09	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125	gpt-35-turbo-instruct, 0914	text-embedding-3-small, 1	incorporação de texto-3-grande, 1	incorporação de texto-ada-002, 1	incorporação de textos-ada-002, 2	DALL-E-3, 3,0	TTS, 001	TTS-HD, 001	sussurro, 001
leste da Austrália	-	-	-	-	✅	-	-	-	✅	✅	-	✅	✅	-	✅	✅	-	-	-
Brasil Sul	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
Canadá Leste	-	-	-	-	✅	-	-	-	✅	✅	-	✅	✅	-	✅	-	-	-	-
Eastus	-	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	-	-	-
Eastus2	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	✅	-	-	-	✅
FranceCentral	-	-	-	-	✅	-	-	-	✅	✅	-	-	✅	-	✅	-	-	-	-
Alemanha Oeste Central	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
JapãoLeste	-	-	-	-	✅	-	-	-	-	✅	-	✅	✅	-	✅	-	-	-	-
Coreia Central	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
Centro-Norte	-	✅	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	-	✅	-	✅	✅	✅
Noruega Oriental	-	-	-	-	✅	-	-	-	-	-	-	-	✅	-	✅	-	-	-	✅
Polónia Central	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
África do SulNorte	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-
Centro-Sul	-	✅	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	✅	✅	-	-	-	-
Sudeste Asiático	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
Sul da Índia	-	-	-	-	✅	-	-	-	✅	✅	-	-	✅	-	✅	-	-	-	✅
EspanhaCentral	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
suécia central	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	-	✅	✅	✅	✅	✅
suíçanorte	-	-	-	-	✅	-	-	-	-	✅	-	✅	✅	-	✅	-	-	-	✅
UAENORTH	-	-	-	-	-	-	-	-	-	-	-	✅	✅	-	✅	-	-	-	✅
UKSOUTH	-	-	-	-	✅	-	-	-	✅	✅	-	-	✅	-	✅	-	-	-	-
Europa Ocidental	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	✅	-	-	-	✅
Westus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-
Westus3	-	✅	✅	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	✅	✅	-

Observação

o1-mini está atualmente disponível para todos os clientes para implementação com padrão global.

Disponibilidade do modelo de implantação provisionado

Região	o3, 2025-04-16	o4-mini, 2025-04-16	GPT-4.1, 14-04-2025	GPT-4.1-NANO, 2025-04-14	GPT-4.1-Mini, 2025-04-14	O3-Mini, 2025-01-31	o1, 2024-12-17	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125
leste da Austrália	-	-	-	-	-	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Brasil Sul	-	-	-	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	-
Canadá Leste	-	-	-	-	-	✅	-	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-
Eastus	-	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Eastus2	✅	✅	✅	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
FranceCentral	-	-	-	-	-	-	-	✅	✅	-	✅	✅	✅	✅	-	✅	-	✅
Alemanha Oeste Central	-	-	-	-	-	-	-	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	-
JapãoLeste	-	-	-	-	-	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	-	✅
Coreia Central	-	-	✅	-	-	✅	-	✅	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	-	✅	✅	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Noruega Oriental	-	-	-	-	-	-	-	✅	✅	-	✅	✅	-	✅	-	✅	-	-
Polónia Central	-	-	-	-	-	-	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅	✅
África do SulNorte	-	-	-	-	-	-	-	✅	-	-	-	✅	✅	-	✅	✅	✅	-
Centro-Sul	-	✅	✅	-	-	-	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
Sudeste Asiático	-	-	-	-	-	-	-	-	✅	✅	✅	-	-	-	-	-	-	-
Sul da Índia	-	-	-	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅
EspanhaCentral	-	-	-	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	-	✅
suécia central	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
suíçanorte	-	-	-	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Suíça Oeste	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅
UAENORTH	-	-	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	-	-	✅	✅
UKSOUTH	-	-	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Europa Ocidental	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
Westus	-	✅	✅	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	-	✅	✅	-	-	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Observação

A versão provisionada de gpt-4Version:turbo-2024-04-09 está atualmente limitada apenas ao texto.

Para mais informações sobre implementações provisionadas, consulte o nosso guia de provisionamento.

Esta tabela não inclui informações ajustadas de disponibilidade regional. Consulte a secção de afinação fina para obter estas informações.

Modelos de implantação padrão (regionais) por ponto de extremidade

Finalizações de chat

Região	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-11-20	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, turbo-2024-04-09	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125
leste da Austrália	-	-	-	✅	-	-	-	✅	✅
Canadá Leste	-	-	-	✅	-	-	-	✅	✅
Eastus	✅	✅	✅	✅	✅	✅	✅	-	✅
Eastus2	✅	✅	✅	✅	✅	✅	✅	-	✅
FranceCentral	-	-	-	✅	-	-	-	✅	✅
JapãoLeste	-	-	-	✅	-	-	-	-	✅
Centro-Norte	✅	✅	✅	✅	✅	✅	✅	-	✅
Noruega Oriental	-	-	-	✅	-	-	-	-	-
Centro-Sul	✅	✅	✅	✅	✅	✅	✅	-	✅
Sul da Índia	-	-	-	✅	-	-	-	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅
suíçanorte	-	-	-	✅	-	-	-	-	✅
UKSOUTH	-	-	-	✅	-	-	-	✅	✅
Europa Ocidental	-	-	-	-	-	-	-	-	✅
Westus	✅	✅	✅	✅	✅	✅	✅	✅	✅
Westus3	✅	✅	✅	✅	✅	✅	✅	-	✅

Observação

o1-mini está atualmente disponível para todos os clientes para implementação com padrão global.

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo

Selecionar acesso do cliente

Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 em regiões adicionais:

Modelo	Região
`gpt-4` (0314) `gpt-4-32k` (0314)	Leste dos EUA França Central Centro-Sul dos EUA Sul do Reino Unido
`gpt-4` (0613) `gpt-4-32k` (0613)	Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido

Modelos GPT-3.5

Consulte as versões do modelo para saber como o Azure OpenAI lida com atualizações de versão do modelo e como trabalhar com modelos para saber como exibir e configurar as configurações da versão do modelo de suas implantações do GPT-3.5 Turbo.

Incorporação de modelos

Região	text-embedding-3-small, 1	incorporação de texto-3-grande, 1	incorporação de texto-ada-002, 1	incorporação de textos-ada-002, 2
leste da Austrália	✅	✅	-	✅
Brasil Sul	-	-	-	✅
Canadá Leste	✅	✅	-	✅
Eastus	✅	✅	✅	✅
Eastus2	✅	✅	-	✅
FranceCentral	-	✅	-	✅
JapãoLeste	✅	✅	-	✅
Centro-Norte	-	-	-	✅
Noruega Oriental	-	✅	-	✅
Polónia Central	-	✅	-	-
SulAfricanorte	-	✅	-	✅
Centro-Sul	-	-	✅	✅
Sudeste Asiático	-	✅	-	-
Sul da Índia	-	✅	-	✅
EspanhaCentral	-	✅	-	-
suécia central	-	✅	-	✅
suíçanorte	✅	✅	-	✅
UAENORTH	✅	✅	-	✅
UKSOUTH	-	✅	-	✅
Europa Ocidental	-	-	-	✅
Westus	✅	-	-	✅
Westus3	-	✅	-	✅

Esses modelos só podem ser usados com solicitações de API de incorporação.

Observação

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos de incorporação. Para migrar do uso de text-embedding-ada-002 para text-embedding-3-large, será necessário gerar novos embeddings.

ID do modelo	Pedido Máximo (tokens)	Dimensões de saída	Dados de formação (até)
`text-embedding-ada-002` (versão 2)	8,192	1,536	Setembro 2021
`text-embedding-ada-002` (versão 1)	2,046	1,536	Setembro 2021
`text-embedding-3-large`	8,192	3,072	Setembro 2021
`text-embedding-3-small`	8,192	1,536	Setembro 2021

Observação

Ao enviar uma matriz de entradas para incorporação, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de incorporação é 2048.

Modelos de geração de imagem

Região	DALL-E-3, 3,0	gpt-imagem-1
leste da Austrália	✅
Eastus	✅
suécia central	✅
Westus3		✅
UAENORTH		✅

ID do modelo	Pedido Máximo (caracteres)
gpt-imagem-1	4,000
DALL-E-3	4,000

Região	Sora
Eastus2	✅

ID do modelo	Pedido Máximo (caracteres)
Sora	4,000

Modelos de áudio

Região	TTS, 001	TTS-HD, 001	sussurro, 001
Eastus2	-	-	✅
Centro-Norte	✅	✅	✅
Noruega Oriental	-	-	✅
Sul da Índia	-	-	✅
suécia central	✅	✅	✅
suíçanorte	-	-	✅
UAENORTH	-	-	✅
Europa Ocidental	-	-	✅
Westus3	✅	✅	-

Região	gpt-35-turbo-instruct, 0914
Eastus	✅
suécia central	✅

Modelos de afinação fina

Observação

gpt-35-turbo - O ajuste fino deste modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está disponível.

As regiões com suporte para ajuste fino podem variar se você usar modelos do Azure OpenAI em um projeto do Azure AI Foundry versus fora de um projeto.

ID do modelo	Regiões de treinamento padrão	Formação Global (Pré-visualização)	Pedido Máximo (tokens)	Dados de formação (até)	Modalidade
`gpt-35-turbo` (1106)	Leste EUA2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	-	Entrada: 16.385 Saída: 4,096	Setembro 2021	Texto para texto
`gpt-35-turbo` (0125)	Leste EUA2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	-	16,385	Setembro 2021	Texto para texto
`gpt-4o-mini` (2024-07-18)	Centro-Norte dos EUA Suécia Central	-	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 65.536	Outubro de 2023	Texto para texto
`gpt-4o` (2024-08-06)	Leste EUA2 Centro-Norte dos EUA Suécia Central	-	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 65.536	Outubro de 2023	Texto e Visão para Texto
`gpt-4.1` (2025-04-14)	Centro-Norte dos EUA Suécia Central	✅	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 65.536	maio de 2024	Texto e Visão para Texto
`gpt-4.1-mini` (2025-04-14)	Centro-Norte dos EUA Suécia Central	✅	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 65.536	maio de 2024	Texto para texto
`gpt-4.1-nano` (2025-04-14)	Centro-Norte dos EUA Suécia Central	-	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 32.768	maio de 2024	Texto para texto
`o4-mini` (2025-04-16)	Leste EUA2 Suécia Central	-	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 65.536	maio de 2024	Texto para texto

Observação

O treinamento global (em visualização pública) oferece treinamento mais acessível por token, mas não oferece residência de dados. Atualmente, ele está disponível para recursos do Azure OpenAI nas seguintes regiões, com mais regiões em breve:

Leste da Austrália
Sul do Brasil
E.U.A. Leste
Leste dos EUA2
Centro de França
Alemanha Centro-Oeste
Norte de Itália
Leste do Japão (sem suporte à visão)
Coreia Central
E.U.A. Centro-Norte
Leste da Noruega
Polónia Central
Sudeste Asiático
Norte da África do Sul
E.U.A. Centro-Sul
Espanha Central
Suécia Central
Oeste da Suíça
Norte da Suíça
Sul do Reino Unido
Europa Ocidental
E.U.A. Oeste
Oeste dos EUA3

Assistentes (Pré-visualização)

Para Assistentes, precisa de uma combinação de um modelo compatível e uma região compatível. Certas ferramentas e capacidades requerem os modelos mais recentes. Os modelos a seguir estão disponíveis na API de Assistentes, SDK e Azure AI Foundry. A tabela a seguir é para implantação padrão. Para obter informações sobre a disponibilidade da Unidade de Taxa de Transferência Provisionada (PTU), consulte Unidade de Taxa de Transferência Provisionada. Os modelos e regiões listados podem ser usados com os Assistentes v1 e v2. Você pode usar modelos padrão globais se eles forem suportados nas regiões listadas abaixo.

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-TURBO, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125	GPT-35-TURBO-16K, 0613
leste da Austrália	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
Eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
Eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
FranceCentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
JapãoLeste	-	-	-	-	-	-	-	-	✅	-	✅	✅
Noruega Oriental	-	-	-	-	✅	-	-	-	-	-	-	-
Sul da Índia	-	-	-	-	✅	-	-	-	-	✅	✅	-
suécia central	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
UKSOUTH	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
Westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
Westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Modelo de aposentadoria

Para obter as informações mais recentes sobre modelos de aposentadoria, consulte o guia de aposentadoria modelo.

Partilhar via

Disponibilidade do modelo padrão global

Disponibilidade global do modelo gerido provisionado

Disponibilidade global do modelo de processamento em lote

Disponibilidade do modelo padrão da zona de dados

Disponibilidade de modelo gerido proporcionado pela zona de dados

Disponibilidade do modelo em lote da zona de dados

Disponibilidade do modelo de implantação padrão

Disponibilidade do modelo de implantação provisionado

Finalizações de chat

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo

Selecionar acesso do cliente

Modelos GPT-3.5

Incorporação de modelos

Modelos de geração de imagem

Modelos de geração de vídeo

Modelos de áudio

Modelos de completamento

Partilhar via

Azure OpenAI em Modelos de Fundição de IA do Azure

Série GPT 4.1

Disponibilidade da região

Capacidades

modelo-router

Disponibilidade da região

Capacidades

pré-visualização do uso do computador

Disponibilidade

Disponibilidade da região

Capacidades

Pré-visualização GPT-4.5

Disponibilidade da região

Capacidades

Modelos da série O

Disponibilidade

Disponibilidade da região

GPT-4o e GPT-4 Turbo

Como faço para acessar os modelos GPT-4o e GPT-4o mini?

GPT-4 Turbo

GPT-4

Modelos GPT-4 e GPT-4 Turbo

GPT-3,5

Incorporações

Modelos de geração de imagem

Disponibilidade

Disponibilidade da região

Modelos de geração de vídeo

Disponibilidade da região

Modelos de áudio

Modelos de áudio GPT-4o

API de áudio

Modelos de transcrição de fala para texto

Modelos de tradução de fala

Modelos de conversão de texto em fala (Pré-visualização)

Tabela de resumo do modelo e disponibilidade da região

Modelos por tipo de implantação

Disponibilidade do modelo padrão global

Modelos de implantação padrão (regionais) por ponto de extremidade

Finalizações de chat

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo

Selecionar acesso do cliente

Modelos GPT-3.5

Modelos de afinação fina

Assistentes (Pré-visualização)

Modelo de aposentadoria

Próximos passos

Comentários

Recursos adicionais