Política de manutenção de modelos de IA generativa
Este artigo descreve a política de manutenção de modelo para as Ofertas de pagamento por token das APIs do Modelo de Base e do Treinamento de Modelo de IA do Mosaic.
Para continuar a dar suporte aos modelos mais avançados, o Databricks pode desativar modelos compatíveis ou desativar modelos compatíveis para as ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.
Política de desativação de modelo
A política de desativação a seguir se aplica apenas a modelos de chat e de conclusão compatíveis nas ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.
Se um modelo estiver definido para desativação, o Databricks executará as seguintes etapas para notificar os clientes:
- Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
- Uma mensagem de aviso é exibida no menu suspenso do Treinamento de Modelo de IA do Mosaic na guia Experimentos que indica que o modelo está planejado para a desativação.
- A documentação contém um aviso que indica que o modelo será desativado e a data de início em que o modelo não terá mais suporte.
Depois que os clientes forem notificados sobre a desativação do modelo futura, o Databricks desativará o modelo em três meses. Durante esse período de tempo, os clientes podem optar por migrar para um ponto de extremidade de taxa de transferência provisionada para continuar usando o modelo após a respectiva data de fim de vida útil.
Consulte Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.
Atualizações de modelo
O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B
em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424
. O Databricks mantém um histórico de versões das atualizações às quais os clientes podem se referir.
Modelos desativados
As seções a seguir resumem as desativações de modelos atuais e futuras para as ofertas de pagamento por token das APIs do modelo base e de modelo de treinamento do Mosaic AI.
Desativações do modelo de treinamento do Mosaic AI
A tabela a seguir mostra as desativações da família de modelos desativados, suas datas de desativação e as famílias de modelos de substituição recomendadas a serem usadas para cargas de trabalho de treinamento de modelos do Mosaic AI. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Família do modelo | Data de baixa | Família do modelo de substituição recomendado |
---|---|---|
Meta Llama-3 | 13 de dezembro de 2024 | Meta Llama-3.1 |
Meta Llama-2 | 13 de dezembro de 2024 | Meta Llama-3.1 |
Code Llama | 13 de dezembro de 2024 | Meta Llama-3.1 |
Desativações do pagamento por token das APIs do modelo base
A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token das APIs de Modelos Fundamentais. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Importante
A partir de 23 de julho de 2024, o Meta-Llama-3.1-70B-Instruct substitui o suporte para Meta-Llama-3-70B-Instruct nos pontos de extremidade de pagamento por token das APIs do modelo base.
Modelar | Data de baixa | Modelo de substituição recomendado |
---|---|---|
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B Instruct | 30 de agosto de 2024 | Mixtral-8x7B |
MPT 30B Instruct | 30 de agosto de 2024 | Mixtral-8x7B |
Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada de APIs do Modelo de Fundação para suas cargas de trabalho de serviço.