Compartilhar via


Política de manutenção de modelos de IA generativa

Este artigo descreve a política de manutenção de modelo para as Ofertas de pagamento por token das APIs do Modelo de Base e do Treinamento de Modelo de IA do Mosaic.

Para continuar a dar suporte aos modelos mais avançados, o Databricks pode desativar modelos compatíveis ou desativar modelos compatíveis para as ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.

Política de desativação de modelo

A política de desativação a seguir se aplica apenas a modelos de chat e de conclusão compatíveis nas ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.

Se um modelo estiver definido para desativação, o Databricks executará as seguintes etapas para notificar os clientes:

  • Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
  • Uma mensagem de aviso é exibida no menu suspenso do Treinamento de Modelo de IA do Mosaic na guia Experimentos que indica que o modelo está planejado para a desativação.
  • A documentação contém um aviso que indica que o modelo será desativado e a data de início em que o modelo não terá mais suporte.

Depois que os clientes forem notificados sobre a desativação do modelo futura, o Databricks desativará o modelo em três meses. Durante esse período de tempo, os clientes podem optar por migrar para um ponto de extremidade de taxa de transferência provisionada para continuar usando o modelo após a respectiva data de fim de vida útil.

Consulte Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424. O Databricks mantém um histórico de versões das atualizações às quais os clientes podem se referir.

Modelos desativados

As seções a seguir resumem as desativações de modelos atuais e futuras para as ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.

Desativações do modelo de treinamento do Mosaic AI

A tabela a seguir mostra as desativações da família de modelos desativados, suas datas de desativação e as famílias de modelos de substituição recomendadas a serem usadas para cargas de trabalho de treinamento de modelos do Mosaic AI. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Família do modelo Data de baixa Família do modelo de substituição recomendado
Meta Llama-3 13 de dezembro de 2024 Meta Llama-3.1
Meta Llama-2 13 de dezembro de 2024 Meta Llama-3.1
Code Llama 13 de dezembro de 2024 Meta Llama-3.1

Desativações do pagamento por token das APIs do modelo base

A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token das APIs de Modelos Fundamentais. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Importante

A partir de 23 de julho de 2024, o Meta-Llama-3.1-70B-Instruct substitui o suporte para Meta-Llama-3-70B-Instruct nos pontos de extremidade de pagamento por token das APIs do modelo base.

Modelar Data de baixa Modelo de substituição recomendado
Meta-Llama-3-70B-Instruct 23 de julho de 2024 Meta-Llama-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-3.1-70B-Instruct
MPT 7B Instruct 30 de agosto de 2024 Mixtral-8x7B
MPT 30B Instruct 30 de agosto de 2024 Mixtral-8x7B

Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada de APIs do Modelo de Fundação para suas cargas de trabalho de serviço.