Substituições e desativações de modelos do Serviço OpenAI do Azure

Artigo
10/25/2024

Visão geral

Os modelos do Serviço OpenAI do Azure são atualizados continuamente com modelos mais recentes e capazes. Como parte desse processo, substituímos e desativamos modelos mais antigos. Este documento fornece informações sobre os modelos que estão disponíveis, preteridos e desativados no momento.

Terminologia

Desativação
- Quando um modelo é desativado, ele não fica mais disponível para uso. As implantações do Serviço OpenAI do Azure de um modelo desativado sempre retornam respostas de erro.
Reprovação
- Quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes com implantações existentes até que o modelo seja desativado.

Notificações

O OpenAI do Azure notifica os clientes sobre as implantações ativas do Serviço OpenAI do Azure para modelos com desativações futuras. Notificaremos os clientes sobre as próximas desativações da seguinte maneira para cada implantação:

No lançamento do modelo, designamos programaticamente uma data de desativação "não antes de" (normalmente de seis meses a um ano).
Aviso prévio de pelo menos 60 dias antes da desativação do modelo para modelos de GA (Disponibilidade geral).
Aviso prévio de 30 dias antes das atualizações da versão do modelo de versão prévia.

As desativações são feitas de forma contínua, região por região.

Modelo de disponibilidade

Pelo menos um ano da disponibilidade do modelo para modelos de GA após a data de lançamento de um modelo em pelo menos uma região em todo o mundo
Para implantações globais, todas as versões futuras do modelo que começa com gpt-4o e gpt-4 0409 estarão disponíveis em seu (N) próximo modelo de sucesso (N+1) para comparação em conjunto.
Os clientes têm 60 dias para experimentar um novo modelo de GA em pelo menos uma região global ou padrão, antes que quaisquer atualizações ocorram em um modelo de GA mais recente.

Considerações para a nuvem pública do Azure

Esteja ciente do seguinte:

Todas as combinações de versão do modelo não estarão disponíveis em todas as regiões.
A versão do modelo N e N+1 pode nem sempre estar disponível na mesma região.
A versão do modelo de GA N pode atualizar para uma versão futura do modelo N+X em algumas regiões com base nas limitações de capacidade e sem que a nova versão do modelo N+X esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes que as atualizações sejam agendadas.
As versões de modelo de versão prévia e as versões de GA do mesmo modelo nem sempre estarão disponíveis para teste em conjunto na mesma região. Haverá versões de versão prévia e de GA disponíveis para teste em regiões diferentes.
Reservamos-nos o direito de limitar os clientes futuros usando uma região específica para equilibrar a qualidade do serviço para clientes existentes.
Como sempre na Microsoft, a segurança é de extrema importância. Caso seja constatado que um modelo ou versão de modelo apresenta problemas de conformidade ou segurança, reservamos-nos o direito de invocar a necessidade de fazer desativações emergenciais. Confira os termos de serviço para obter mais informações.

Considerações especiais para nuvens do Azure Governamental

As implantações padrão globais não estarão disponíveis em nuvens governamentais.
Nem todos os modelos ou versões de modelo disponíveis na nuvem comercial/pública estarão disponíveis em nuvens governamentais.
Nas nuvens do Azure Governamental, pretendemos dar suporte apenas a uma versão de um determinado modelo de cada vez.
1. Por exemplo, apenas uma versão de gpt-35-turbo 0125 e gpt-4o (2024-05-13).
No entanto, haverá uma sobreposição de 30 dias entre as novas versões do modelo, em que mais de duas estarão disponíveis.
1. Por exemplo, se gpt-35-turbo 0125 ou gpt-4o (2024-05-13) for atualizada para uma versão futura ou
2. para alterações na família de modelos além das atualizações de versão, como ao migrar de gpt-4 1106-preview para gpt-4o (2024-05-13).

Quem recebe notificações sobre as próximas desativações

O OpenAI do Azure notifica membros das seguintes funções para cada assinatura com uma implantação de um modelo com desativação futura.

Proprietário
Colaborador
Leitor
Colaborador de monitoramento
Leitor de monitoramento

Como se preparar para desativações de modelo e atualizações de versão

Para se preparar para desativações de modelo e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e seu comportamento. Também recomendamos atualizar os aplicativos para uso dos novos modelos e versões antes da data de desativação.

Para obter mais informações sobre o processo de avaliação do modelo, consulte Introdução ao guia de avaliação do modelo.

Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.

Modelos atuais

Observação

Nem todos os modelos passam por um período de depreciação antes da desativação. Alguns modelos/versões têm apenas uma data de desativação.

Os modelos ajustados estão sujeitos ao mesmo cronograma de reprovação e desativação do modelo base equivalente.

Atualmente, estes modelos estão disponíveis para uso no Serviço OpenAI do Azure.

Modelar	Versão	Data de baixa	Substituições sugeridas
`babbage-002`	1	Data de substituição: 15 de novembro de 2024 Data de desativação: 27 de janeiro de 2025
`davinci-002`	1	Data de substituição: 15 de novembro de 2024 Data de desativação: 27 de janeiro de 2025
`dall-e-2`	2	27 de janeiro de 2025	`dalle-3`
`dall-e-3`	3	Em ou após 30 de abril de 2025
`gpt-35-turbo`	0301	27 de janeiro de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: `0125`, a partir de 13 de novembro de 2024.	`gpt-35-turbo` (0125) `gpt-4o-mini`
`gpt-35-turbo` `gpt-35-turbo-16k`	0613	27 de janeiro de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: `0125`, a partir de 13 de novembro de 2024.	`gpt-35-turbo` (0125) `gpt-4o-mini`
`gpt-35-turbo`	1106	Não antes de 27 de janeiro de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: `0125`, a partir de 13 de novembro de 2024.	`gpt-35-turbo` (0125) `gpt-4o-mini`
`gpt-35-turbo`	0125	Em ou após 22 de fevereiro de 2025	`gpt-4o-mini`
`gpt-4` `gpt-4-32k`	0314	6 de junho de 2025	`gpt-4o`
`gpt-4` `gpt-4-32k`	0613	6 de junho de 2025	`gpt-4o`
`gpt-4`	1106-preview	Para ser atualizado para a versão `gpt-4`: `turbo-2024-04-09`, a partir de 27 de janeiro de 2025 ¹	`gpt-4o`
`gpt-4`	0125-preview	Para ser atualizado para a versão `gpt-4`: `turbo-2024-04-09`, a partir de 27 de janeiro de 2025 ¹	`gpt-4o`
`gpt-4`	vision-preview	Para ser atualizado para a versão `gpt-4`: `turbo-2024-04-09`, a partir de 27 de janeiro de 2025 ¹	`gpt-4o`
`gpt-4o`	2024-05-13	Não antes de 20 de maio de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: `2024-08-06`, a partir de 5 de dezembro de 2024.
`gpt-4o-mini`	2024-07-18	Em ou após 18 de julho de 2025
`gpt-3.5-turbo-instruct`	0914	Em ou após 14 de setembro de 2025
`text-embedding-ada-002`	2	Em ou após 3 de abril de 2025	`text-embedding-3-small` ou `text-embedding-3-large`
`text-embedding-ada-002`	1	Em ou após 3 de abril de 2025	`text-embedding-3-small` ou `text-embedding-3-large`
`text-embedding-3-small`		Em ou após 2 de fevereiro de 2025
`text-embedding-3-large`		Em ou após 2 de fevereiro de 2025

¹ Notificaremos todos os clientes com essas implantações de visualização pelo menos 30 dias antes do início das atualizações. Publicaremos um agendamento de atualização detalhando a ordem das regiões e versões de modelo que seguiremos durante as atualizações e vincularemos a esse agendamento a partir daqui.

Importante

Os recursos de visualização de melhorias de visão, incluindo Reconhecimento Óptico de Caracteres (OCR), fixação de objetos e prompts de vídeo, serão desativados e não estarão mais disponíveis assim que a gpt-4 Versão: vision-preview for atualizada para turbo-2024-04-09. Se você estiver dependendo de algum desses recursos de visualização, essa atualização automática do modelo será uma mudança radical.

Versões do modelo padrão

Modelar	Versão padrão atual	Nova versão padrão	Data de atualização padrão
`gpt-35-turbo`	0301	0125	As implantações das versões `0301`, `0613` e `1106` definidas como Atualização automática para padrão serão atualizadas automaticamente para a versão: `0125`, a partir de 13 de novembro de 2024.
`gpt-4o`	2024-05-13	06/08/2024	As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: `2024-08-06`, a partir de 5 de dezembro de 2024.

Modelos preteridos

Estes modelos foram preteridos em 6 de julho de 2023 e foram desativados em 14 de junho de 2024. Esses modelos não estão mais disponíveis para novas implantações. As implantações criadas antes de 6 de julho de 2023 permanecerão disponíveis para os clientes até 14 de junho de 2024. Recomendamos que os clientes migrem seus aplicativos para implantações de modelos de substituição antes da desativação em 14 de junho de 2024.

Se você for um cliente existente procurando informações sobre esses modelos, consulte Modelos herdados.

Modelar	Data de preterição	Data de baixa	Substituição sugerida
ada	6 de julho de 2023	14 de junho de 2024	babbage-002
babbage	6 de julho de 2023	14 de junho de 2024	babbage-002
curie	6 de julho de 2023	14 de junho de 2024	davinci-002
davinci	6 de julho de 2023	14 de junho de 2024	davinci-002
text-ada-001	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
text-babbage-001	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
text-curie-001	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
text-davinci-002	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
text-davinci-003	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
code-cushman-001	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
code-davinci-002	6 de julho de 2023	14 de junho de 2024	gpt-35-turbo-instruct
text-similarity-ada-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-similarity-babbage-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-similarity-curie-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-similarity-davinci-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-ada-doc-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-ada-query-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-babbage-doc-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-babbage-query-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-curie-doc-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-curie-query-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-davinci-doc-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
text-search-davinci-query-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
code-search-ada-code-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
code-search-ada-text-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
code-search-babbage-code-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small
code-search-babbage-text-001	6 de julho de 2023	14 de junho de 2024	text-embedding-3-small

Histórico de desativação e substituição

25 de outubro de 2024

Data de substituição de babbage-002 & davinci-002: 15 de novembro de 2024 e data de desativação: 27 de janeiro de 2025.

12 de setembro de 2024

Data de atualização automática de gpt-35-turbo (0301), (0613), (1106) e gpt-35-turbo-16k (0613) para o padrão atualizada para 13 de novembro de 2024.

9 de setembro de 2024

A desativação de gpt-35-turbo (0301) e (0613) foi alterada para 27 de janeiro de 2025.
A data de atualização do modelo de visualização gpt-4 foi alterada para começar antes de 27 de janeiro de 2025.

3 de setembro de 2024

Tabelas atualizadas para incluir informações sobre atualizações da versão padrão gpt-35-turbo. As implantações das versões 0301, 0613 e 1106 definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 15 de novembro de 2024.|.

22 de agosto de 2024

Data de desativação (0301) do gpt-35-turbo atualizada para data não anterior a 1º de novembro de 2024.
Atualização de gpt4 e gpt-4-32k (0314 e 0613) com data de substituição até 1º de novembro de 2024.

8 de agosto de 2024

Atualizada a data de desativação dos modelos gpt-35-turbo e gpt-35-turbo-16k (0613) para 1º de novembro de 2024.

30 de julho de 2024

A data de atualização da versão prévia do modelo gpt-4 foi atualizada para 15 de novembro de 2024 ou posterior para as seguintes versões:
- 1106-preview
- 0125-preview
- vision-preview (O recurso de melhorias de visão não será mais compatível após a desativação/atualização deste modelo.)

18 de julho de 2024

Data de substituição do gpt-4 0613 atualizada para 1º de outubro de 2024 e data de desativação para 6 de junho de 2025.

19 de junho de 2024

Data de desativação 0301 do gpt-35-turbo atualizada para data não anterior a 1º de outubro de 2024.
Data de desativação do gpt-35-turbo e gpt-35-turbo-16k0613 atualizada para 1º de outubro de 2024.
Data de substituição do gpt-4 e gpt-4-32k 0314 atualizada para 1º de outubro de 2024 e data de desativação para 6 de junho de 2025.

4 de junho de 2024

Data de desativação dos modelos herdados atualizados por um mês.

24 de abril de 2024

A data de desativação mais antiga do gpt-35-turbo 0301 e 0613 foi atualizada para 1º de agosto de 2024.

13 de março de 2024

Publicamos este documento para fornecer informações sobre os modelos atuais e preteridos e as desativações futuras.

23 de fevereiro de 2024

Anunciamos a próxima atualização in-loco da versão do gpt-4 1106-preview para 0125-preview para ter início em ou após 8 de março de 2024.

30 de novembro de 2023

A versão padrão de gpt-4 e gpt-3-32k foi atualizada de 0314 para 0613 em 30 de novembro de 2023. A atualização das implantações de 0314 definidas para atualização automática para 0613 foi concluída em 3 de dezembro de 2023.

6 de julho de 2023

Anunciamos a substituição de modelos com desativação futura em 5 de julho de 2024.

Compartilhar via