Política de manutenção de modelos de IA generativos
Este artigo descreve a política de manutenção de modelo para as APIs de pagamento por token do Foundation Model e as ofertas de Ajuste fino do Foundation Model.
Para continuar a dar suporte aos modelos de última geração, o Databricks pode atualizar os modelos com suporte ou desativar modelos mais antigos em suas ofertas de API de Modelos Fundamentais com cobrança por token e ajuste fino de Modelos Fundamentais.
Política de desativação de modelo
A política de desativação a seguir aplica-se apenas a modelos de chat e conclusão com suporte nas ofertas de ajuste fino e pagamento por token das APIs do Foundation Model.
Quando um modelo é desativado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. Databricks executa as seguintes etapas para notificar os clientes sobre um modelo com previsão de desativação:
- Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
- Uma mensagem de aviso é exibida no menu suspenso de ajuste fino do Foundation Model na guia Experimentos, indicando que o modelo está programado para desativação.
- A documentação aplicável contém um aviso que indica que o modelo está planejado para a desativação e a data de início em que ele não terá mais suporte.
Depois que os usuários forem notificados sobre a próxima desativação do modelo, o Databricks desativará o modelo em três meses. Durante esse período de três meses, os clientes podem:
- Escolha migrar para um ponto de extremidade de taxa de transferência provisionada a fim de continuar usando o modelo após sua data de fim de vida útil.
- Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.
Confira Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.
Atualizações de modelo
O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B
em 4/3/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424
. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.
modelos aposentados
As seções a seguir resumem as desativações atuais e futuras de modelos para as APIs de pagamento por token e das ofertas de ajuste fino do Foundation Model.
Desativações de ajustes fino do Foundation Model
A tabela a seguir mostra famílias de modelos desativadas, suas datas de desativação e famílias de modelos de substituição recomendadas para serem usadas em cargas de trabalho de ajuste fino do Foundation Model. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Família de modelos | Data de aposentadoria | Família de modelos de substituição recomendada |
---|---|---|
DBRX | 30 de abril de 2025 | Llama-3.1-70B |
Mixtral | 30 de abril de 2025 | Llama-3.1-70B |
Mistral | 30 de abril de 2025 | Llama-3.1-8B |
Meta-Llama-3.1-405B | 30 de janeiro de 2025 | Llama-3.1-70B |
Meta-Llama-3 | 7 de janeiro de 2025 | Meta-Llama-3.1 |
Meta-Llama-2 | 7 de janeiro de 2025 | Meta-Llama-3.1 |
Code Llama | 7 de janeiro de 2025 | Meta-Llama-3.1 |
Desativações das APIs pagas por token do Foundation Model
A tabela a seguir mostra a desativação dos modelos, suas datas de desativação e os modelos de substituição recomendados para o uso em APIs do Foundation Model que processam cargas de trabalho pagas por token. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Importante
Em 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct substituiu o suporte para Meta-Llama-3.1-70B-Instruct em pontos de extremidade pagos por token das APIs do Foundation Model.
Modelo | Data de aposentadoria | Modelo de substituição recomendado |
---|---|---|
DBRX Instruct | 30 de abril de 2025 | Meta-Llama-3.3-70B-Instruct |
Mixtral-8x7B Instruct | 30 de abril de 2025 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3.1-70B-Instruct | 11 de dezembro de 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.3-70B-Instruct |
MPT 7B Instruct | 30 de agosto de 2024 | Meta-Llama-3.3-70B-Instruct |
MPT 30B Instruct | 30 de agosto de 2024 | Meta-Llama-3.3-70B-Instruct |
Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada das APIs do Foundation Model para suas cargas de trabalho de serviço.