Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Adicione modelos que servem pontos de extremidade como recursos do Databricks Apps para que seu aplicativo possa consultar modelos de aprendizado de máquina para inferência. Os endpoints de serviço de modelo gerem as previsões do modelo e oferecem uma interface consistente para acessar os modelos implementados.
Adicionar um modelo que serve o recurso de ponto de extremidade
Antes de adicionar um endpoint de serviço de modelos como recurso, reveja os pré-requisitos de recursos da aplicação.
- Quando criar ou editar uma aplicação, navegue até ao passo Configurar .
- Na secção de recursos da App , clique em + Adicionar recurso.
- Selecione Ponto de extremidade de serviço como o tipo de recurso.
- Escolha um ponto de extremidade de modelo de serviço entre os pontos de extremidade disponíveis no seu espaço de trabalho.
- Selecione o nível de permissão apropriado para seu aplicativo:
- Pode visualizar: Pode visualizar metadados do endpoint, incluindo nomes de modelos, versões e configuração de workload. Não é possível enviar solicitações de inferência.
- Pode consultar: Envie solicitações de inferência e visualize metadados. Use isso para a maioria dos aplicativos que precisam de previsões de modelo.
- Pode gerenciar: Controle administrativo completo, incluindo visualizar, editar, consultar, excluir e gerenciar permissões.
- (Opcional) Especifique uma chave de recurso personalizada, que é como tu referencias o endpoint de serviço do modelo na configuração da tua aplicação. A chave padrão é
serving-endpoint.
Observação
O ponto de extremidade de serviço de modelo deve estar num estado READY para processar pedidos de inferência do seu aplicativo.
Variáveis de ambiente
Quando se implanta uma aplicação com um recurso de ponto de extremidade de serviço de modelo, o Azure Databricks expõe o nome do ponto de extremidade de serviço por meio de variáveis de ambiente que se podem referenciar usando o campo valueFrom.
Por exemplo:
SERVING_ENDPOINT=<your-serving-endpoint-name>
Para obter mais informações, consulte Usar variáveis de ambiente para acessar recursos.
Remover um modelo que serve o recurso de ponto de extremidade
Quando você remove um modelo que serve o recurso de ponto de extremidade de um aplicativo, a entidade de serviço do aplicativo perde o acesso ao ponto de extremidade. O modelo que serve o ponto de extremidade em si permanece inalterado e continua disponível para outros usuários e aplicativos que têm permissões apropriadas.
Melhores práticas
Considere o seguinte ao trabalhar com recursos de ponto de extremidade de serviço de modelo:
- Conceda permissões mínimas. Use
Can viewpara o menor acesso ouCan querypara a maioria dos aplicativos que precisam enviar solicitações de inferência, a menos que seu aplicativo precise especificamente executar tarefas administrativas no ponto de extremidade. - Evite consultas de longa duração quando possível, pois as solicitações de inferência podem expirar.
- Verifique o status do endpoint antes de enviar solicitações. Os pontos de extremidade devem encontrar-se no estado
READYpara processar consultas. - Considere limitar a taxa das suas solicitações de inferência para evitar sobrecarregar o endpoint, especialmente durante períodos de alto tráfego.