Política de manutenção de modelos de IA generativos

Este artigo descreve a política de manutenção do modelo para as APIs do Modelo de Fundação com pagamento por token, as APIs do Modelo de Fundação com taxa de transferência provisionada e as ofertas de ajuste fino do Modelo de Fundação.

Para continuar dando suporte aos modelos de última geração, o Databricks pode atualizar modelos com suporte ou desativar modelos mais antigos para essas ofertas.

Política de desativação de modelo

A política de desativação do modelo explica como o Databricks notifica você quando um modelo com suporte está definido para a aposentadoria, o que acontece durante o período de transição e o que esperar na data de desativação. As linhas do tempo diferem por meio da oferta e da categoria de modelo, conforme resumido nas seções a seguir.

Para modelos atualmente aposentados e datas de aposentadoria planejadas, consulte modelos aposentados. Para modelos de parceiros, consulte a política de desativação do modelo de parceiro.

Importante

As políticas de aposentadoria que se aplicam às APIs do Foundation Model com pagamento por token e às ofertas de ajuste fino do Foundation Model afetam apenas os modelos de chat e conclusão com suporte.

As APIs do Modelo de Base pagas por token

A tabela a seguir resume a política de descontinuação das APIs do Foundation Model de pagamento por token.

Notificação de descontinuação Transição para a aposentadoria Na data de aposentadoria
Databricks executa as seguintes etapas para notificar os clientes sobre um modelo com previsão de desativação:
  • Na página Serviço do workspace do Databricks, uma mensagem de aviso é exibida no cartão de modelo que indica que o modelo está planejado para a desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para a desativação e a data de início em que ele não terá mais suporte.
O Databricks desativará o modelo em três meses. Durante esse período de três meses, os clientes podem:
  • Escolha migrar para um endpoint provisionado de throughput das APIs do modelo de fundação para continuar usando o modelo após sua data de fim de vida útil.
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
O modelo não está mais disponível para uso e removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Taxa de transferência provisionada das APIs do Modelo do Foundation

A tabela a seguir resume a política de retirada para a taxa de transferência configurada das APIs do Modelo de Fundação.

Notificação de descontinuação Transição para a aposentadoria Na data de aposentadoria
Databricks executa as seguintes etapas para notificar os clientes sobre um modelo com previsão de desativação:
  • Para endpoints que servem a um modelo obsoleto, uma mensagem de aviso é exibida na página de detalhes desse endpoint em seu Databricks Workspace. Esta mensagem indica que o modelo está planejado para ser aposentado e a data de aposentadoria aplicável.
  • Uma mensagem de dica de ferramenta fornece modelos alternativos recomendados para migração de carga de trabalho.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para a desativação e a data de início em que ele não terá mais suporte.
O Databricks desativará o modelo em seis meses. Durante este período de seis meses:
  • Os clientes podem continuar utilizando os pontos de extremidade existentes de taxa de transferência provisionada usando o modelo obsoleto até a data de retirada.
  • Clientes que não estão usando ativamente um modelo obsoleto não podem criar novos endpoints de taxa de transferência provisionada nem reiniciar endpoints parados para um modelo obsoleto.
O modelo não está mais disponível para uso e removido do produto.
  • Todos os pontos de extremidade que usam o modelo desativado são transferidos para um estado de falha com uma mensagem descritiva. Todas as solicitações para esses pontos de extremidade falharão.
  • O cliente pode excluir endereços que usam o modelo desativado, mas não é possível reiniciá-los.
  • A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Política de desativação do modelo de parceiro

Os modelos de parceiro são modelos fornecidos por parceiros de terceiros, especificamente OpenAI, Anthropic e Google, que estão disponíveis por meio de APIs do Foundation Model. Para esses modelos de parceiro, o Databricks geralmente segue as mesmas linhas do tempo e políticas de substituição, conforme descrito para modelos de taxa de transferência e pagamento por token provisionados.

No entanto, as datas de desativação fornecidas pelos parceiros podem ser menores do que os períodos de transição publicados pelo Databricks. Nesses casos, o Databricks tenta preencher a lacuna redirecionando temporariamente modelos para uma versão semelhante, para que os clientes recebam o tempo de transição completo.

Por exemplo, se uma substituição de modelo de pagamento por token for anunciada com um mês de tempo de entrega em vez de três, o Databricks redirecionará o modelo por mais dois meses para evitar interrupções imediatas e permitir tempo para a migração. As consultas falham no final do período completo de três meses.

Note

Esse redirecionamento só poderá ocorrer se o modelo de substituição tiver o mesmo preço e for compatível com versões anteriores. O modelo de substituição geralmente é uma versão de modelo incremental, como 3.0 versus 3.1.

Aprimoramento do Modelo Base

A tabela a seguir resume a política de aposentadoria do Ajuste Fino do Modelo Fundamental.

Notificação de descontinuação Transição para a aposentadoria Na data de aposentadoria
Databricks executa as seguintes etapas para notificar os clientes sobre um modelo com previsão de desativação:
  • Na guia Experimentos, uma mensagem de aviso aparece no menu suspenso para refinamento do Modelo Fundacional, indicando que o modelo está planejado para ser desativado.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para a desativação e a data de início em que ele não terá mais suporte.
O Databricks aposenta o modelo em três meses. Durante esse período de três meses, os clientes podem migrar fluxos de trabalho existentes para usar modelos de substituição recomendados. O modelo não está mais disponível para uso e removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais de modelo para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 4/3/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.

modelos aposentados

As seções a seguir resumem as aposentadorias atuais e futuras do modelo para as ofertas de recursos indicadas.

Desativações das APIs pagas por token do Foundation Model

A tabela a seguir mostra a desativação dos modelos, suas datas de desativação e os modelos de substituição recomendados para o uso em APIs do Foundation Model que processam cargas de trabalho pagas por token. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Modelo de parceiro Data de aposentadoria Modelo de substituição recomendado
Anthropico Claude 3.7 Sonnet 12 de abril de 2026 Usar o modelo mais recente do Claude Sonnet
Abrir modelo Data de aposentadoria Modelo de substituição recomendado
Meta Llama 3.1 405B 15 de fevereiro de 2026 OpenAI GPT OSS 120B
Instrução DBRX 30 de abril de 2025 Meta-Llama-4-Maverick
Instrução ao Mixtral-8x7B 30 de abril de 2025 Meta-Llama-4-Maverick
Meta-Llama-3.1-70B-Instruct 11 de dezembro de 2024 Meta-Llama-4-Maverick
Meta-Llama-3-70B-Instruct 23 de julho de 2024 Meta-Llama-4-Maverick
Meta-Llama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-4-Maverick
Instrução MPT 7B 30 de agosto de 2024 Meta-Llama-4-Maverick
Instrução MPT 30B 30 de agosto de 2024 Meta-Llama-4-Maverick

Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada das APIs do Foundation Model para suas cargas de trabalho de serviço.

APIs de Modelo de Fundação descontinuações de capacidade provisionada

A tabela a seguir mostra as aposentadorias da família modelo, suas datas de desativação e modelos de substituição recomendados a serem usados para APIs do Foundation Model provisionadas por taxa de transferência que atende cargas de trabalho. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Modelo de parceiro Data de aposentadoria Modelo de substituição recomendado
Gemini 3 Pro 26 de março de 2026 Gemini 3.1 Pro. Para permitir mais tempo para a migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas à API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. O preço de ambos os modelos é idêntico.
Abrir família de modelos Data de aposentadoria Modelo de substituição recomendado
Meta Llama 3.1 405B 15 de maio de 2026 OpenAI GPT OSS 120B
Meta Llama 3 70B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 3 8B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 2 70B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 2 13B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 2 7B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Mixtral 8x7B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Mistral 7B 27 de fevereiro de 2026 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
DBRX 19 de dezembro de 2025 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
MPT 30B 19 de dezembro de 2025 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
MPT 7B 19 de dezembro de 2025 Modelo comparável na mesma oferta, como os modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.

Desativações de ajustes fino do Foundation Model

A tabela a seguir mostra famílias de modelos desativadas, suas datas de desativação e famílias de modelos de substituição recomendadas para serem usadas em cargas de trabalho de ajuste fino do Foundation Model. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Família de modelos Data de aposentadoria Família de modelos de substituição recomendada
DBRX 30 de abril de 2025 Llama-3.1-70B
Mixtral 30 de abril de 2025 Llama-3.1-70B
Mistral 30 de abril de 2025 Llama-3.1-8B
Meta-Llama-3.1-405B 30 de janeiro de 2025 Llama-3.1-70B
Meta-Llama-3 7 de janeiro de 2025 Meta-Llama-3.1
Meta-Llama-2 7 de janeiro de 2025 Meta-Llama-3.1
Código Llama 7 de janeiro de 2025 Meta-Llama-3.1

Localizar cargas de trabalho que usam modelos desativados

Use a consulta a seguir para localizar cargas de trabalho que estão usando modelos preteridos e identificar seus proprietários.

SELECT
   eu.requester,
   se.endpoint_name,
   se.entity_name,
   COUNT(*) AS request_count,
   SUM(eu.input_token_count) AS total_input_tokens,
   SUM(eu.output_token_count) AS total_output_tokens,
   MIN(eu.request_time) AS first_request,
   MAX(eu.request_time) AS last_request
 FROM system.serving.endpoint_usage eu
 JOIN system.serving.served_entities se
   ON eu.served_entity_id = se.served_entity_id
 WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
 GROUP BY eu.requester, se.endpoint_name, se.entity_name
 ORDER BY request_count DESC