Compartilhar via


Política de manutenção de modelos de IA generativos

Este artigo descreve a política de manutenção de modelo para as APIs de pagamento por token do Foundation Model e as ofertas de Ajuste fino do Foundation Model.

Para continuar a dar suporte aos modelos de última geração, o Databricks pode atualizar os modelos com suporte ou desativar modelos mais antigos em suas ofertas de API de Modelos Fundamentais com cobrança por token e ajuste fino de Modelos Fundamentais.

Política de desativação de modelo

A política de desativação a seguir aplica-se apenas a modelos de chat e conclusão com suporte nas ofertas de ajuste fino e pagamento por token das APIs do Foundation Model.

Quando um modelo é desativado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. Databricks executa as seguintes etapas para notificar os clientes sobre um modelo com previsão de desativação:

  • Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
  • Uma mensagem de aviso é exibida no menu suspenso de ajuste fino do Foundation Model na guia Experimentos, indicando que o modelo está programado para desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para a desativação e a data de início em que ele não terá mais suporte.

Depois que os usuários forem notificados sobre a próxima desativação do modelo, o Databricks desativará o modelo em três meses. Durante esse período de três meses, os clientes podem:

  • Escolha migrar para um ponto de extremidade de taxa de transferência provisionada a fim de continuar usando o modelo após sua data de fim de vida útil.
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.

Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Confira Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 4/3/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.

modelos aposentados

As seções a seguir resumem as desativações atuais e futuras de modelos para as APIs de pagamento por token e das ofertas de ajuste fino do Foundation Model.

Desativações de ajustes fino do Foundation Model

A tabela a seguir mostra famílias de modelos desativadas, suas datas de desativação e famílias de modelos de substituição recomendadas para serem usadas em cargas de trabalho de ajuste fino do Foundation Model. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Família de modelos Data de aposentadoria Família de modelos de substituição recomendada
DBRX 30 de abril de 2025 Llama-3.1-70B
Mixtral 30 de abril de 2025 Llama-3.1-70B
Mistral 30 de abril de 2025 Llama-3.1-8B
Meta-Llama-3.1-405B 30 de janeiro de 2025 Llama-3.1-70B
Meta-Llama-3 7 de janeiro de 2025 Meta-Llama-3.1
Meta-Llama-2 7 de janeiro de 2025 Meta-Llama-3.1
Code Llama 7 de janeiro de 2025 Meta-Llama-3.1

Desativações das APIs pagas por token do Foundation Model

A tabela a seguir mostra a desativação dos modelos, suas datas de desativação e os modelos de substituição recomendados para o uso em APIs do Foundation Model que processam cargas de trabalho pagas por token. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Importante

Em 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct substituiu o suporte para Meta-Llama-3.1-70B-Instruct em pontos de extremidade pagos por token das APIs do Foundation Model.

Modelo Data de aposentadoria Modelo de substituição recomendado
DBRX Instruct 30 de abril de 2025 Meta-Llama-3.3-70B-Instruct
Mixtral-8x7B Instruct 30 de abril de 2025 Meta-Llama-3.3-70B-Instruct
Meta-Llama-3.1-70B-Instruct 11 de dezembro de 2024 Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Instruct 23 de julho de 2024 Meta-Llama-3.3-70B-Instruct
Meta-Llama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-3.3-70B-Instruct
MPT 7B Instruct 30 de agosto de 2024 Meta-Llama-3.3-70B-Instruct
MPT 30B Instruct 30 de agosto de 2024 Meta-Llama-3.3-70B-Instruct

Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada das APIs do Foundation Model para suas cargas de trabalho de serviço.