Quando você estiver satisfeito com o desempenho do seu modelo, ele estará pronto para ser implantado e consultá-lo para obter previsões de enunciados. A implantação de um modelo o torna disponível para uso por meio da API de previsão.
Pré-requisitos
Um projeto criado com sucesso
Enunciados rotulados e modelo treinado com sucesso
Depois de analisar o desempenho do modelo e decidir que ele é adequado para ser usado em seu ambiente, você precisa atribuí-lo a uma implantação para poder consultá-lo. A atribuição do modelo a uma implantação o torna disponível para uso por meio da API de previsão. É recomendável criar uma implantação nomeada production à qual você atribui o melhor modelo que você construiu até agora e usá-lo em seu sistema. Você pode criar outra implantação chamada staging à qual você pode atribuir o modelo em que está trabalhando no momento para poder testá-la. Você pode ter um máximo de 10 implantações em seu projeto.
Selecione Implantando um modelo no menu do lado esquerdo.
Selecione Adicionar implantação para iniciar o assistente Adicionar implantação .
Selecione Criar um novo nome de implantação para criar uma nova implantação e atribuir um modelo treinado na lista suspensa abaixo. Caso contrário, você pode selecionar Substituir um nome de implantação existente para substituir efetivamente o modelo usado por uma implantação existente.
Nota
A substituição de uma implantação existente não requer alterações na chamada da API de Previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.
Selecione um modelo treinado na lista suspensa Modelo .
Selecione Implantar para iniciar o trabalho de implantação.
Depois que a implantação for bem-sucedida, uma data de expiração aparecerá ao lado dela. A expiração da implantação é quando o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece doze meses após a expiração de uma configuração de treinamento.
Enviar trabalho de implantação
Crie uma solicitação PUT usando a seguinte URL, cabeçalhos e corpo JSON para começar a implantar um modelo de compreensão de linguagem conversacional.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Corpo do Pedido
{
"trainedModelLabel": "{MODEL-NAME}",
}
Chave
Marcador de Posição
valor
Exemplo
trainedModelLabel
{MODEL-NAME}
O nome do modelo que será atribuído à sua implantação. Você só pode atribuir modelos treinados com sucesso. Esse valor diferencia maiúsculas de minúsculas.
myModel
Depois de enviar sua solicitação de API, você receberá uma 202 resposta indicando sucesso. Nos cabeçalhos de resposta, extraia o operation-location valor. Será formatado da seguinte forma:
Você pode usar essa URL para obter o status do trabalho de implantação.
Obter o status do trabalho de implantação
Quando você envia uma solicitação de implantação bem-sucedida, a URL de solicitação completa para verificar o status do trabalho (incluindo seu ponto de extremidade, nome do projeto e ID do trabalho) está contida no cabeçalho da operation-location resposta.
Use a seguinte solicitação GET para obter o status do seu trabalho de implantação. Substitua os valores de espaço reservado por seus próprios valores.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar a solicitação, você receberá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".
Depois de concluir o teste de um modelo atribuído a uma implantação, convém atribuí-lo a outra implantação. A troca de implantações envolve:
Pegando o modelo atribuído à primeira implantação e atribuindo-o à segunda implantação.
pegar o modelo atribuído à segunda implantação e atribuí-lo à primeira implantação.
Isso pode ser usado para trocar suas production implantações e staging quando você quiser pegar o modelo atribuído a staging e atribuí-lo ao production.
Para excluir uma implantação do Language Studio, selecione a página Implantar modelo . Em seguida, selecione a implantação que deseja excluir e selecione Excluir implantação no menu superior.
Crie uma solicitação DELETE usando a seguinte URL, cabeçalhos e corpo JSON para excluir uma implantação de compreensão de linguagem conversacional.
Para atribuir recursos de implantação em outras regiões no Language Studio:
Certifique-se de que se atribuiu como Proprietário de Idiomas dos Serviços Cognitivos ao recurso que utilizou para criar o projeto.
Vá para a página Implantando um modelo no Language Studio.
Selecione a guia Regiões .
Selecione Adicionar recurso de implantação.
Selecione um recurso de idioma em outra região.
Agora você está pronto para implantar seu projeto nas regiões onde atribuiu recursos.
A atribuição de recursos de implantação programaticamente requer autenticação do Microsoft Entra**. O Microsoft Entra ID é usado para confirmar que você tem acesso aos recursos que está interessado em atribuir ao seu projeto para implantação em várias regiões. Para usar programaticamente a autenticação do Microsoft Entra ao fazer chamadas de API REST, consulte a documentação de autenticação de serviços de IA do Azure.
Atribuir recurso
Envie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para atribuir recursos de implantação.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O caminho de ID de recurso completo que você deseja atribuir. Encontrado no portal do Azure na guia Propriedades do recurso, dentro do campo ID do Recurso.
O subdomínio personalizado do recurso que você deseja atribuir. Encontrado no portal do Azure na guia Chaves e Ponto Final do recurso, parte do campo Ponto de Extremidade na URL https://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Um código de região que especifica a região do recurso que você deseja atribuir. Encontrado no portal do Azure na guia Chaves e Ponto Final do recurso, como parte do campo Local/Região .
eastus
Obter o status do recurso atribuído
Use a seguinte solicitação GET para obter o status do seu trabalho de atribuição de recurso de implantação. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
myProject
{JOB-ID}
O ID do trabalho para obter o status de implantação atribuído. Isso está no valor do operation-location cabeçalho que você recebeu da API em resposta à sua solicitação de recurso de implantação atribuída.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
A versão da API que você está chamando.
2022-10-01-preview
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".
Ao cancelar a atribuição ou remover um recurso de implantação de um projeto, você também excluirá todas as implantações que foram implantadas na região desse recurso.
Para cancelar a atribuição ou remoção de recursos de implantação em outras regiões usando o Language Studio:
Vá para a guia Regiões na página Implantar um modelo .
Selecione o recurso que deseja cancelar a atribuição.
Selecione o botão Remover atribuição .
Na janela apresentada, escreva o nome do recurso que pretende remover.
Cancelar atribuição de recurso
Envie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para cancelar a atribuição ou remover recursos de implantação do seu projeto.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O caminho de ID de recurso completo que você deseja desatribuir. Encontrado no portal do Azure na guia Propriedades do recurso como o campo ID do Recurso.
Obter o status do recurso para cancelar a atribuição
Use a seguinte solicitação GET para obter o status do seu trabalho de recursos de implantação não atribuído. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
myProject
{JOB-ID}
O ID do trabalho para obter o status de implantação atribuído. Isso está no valor do operation-location cabeçalho que você recebeu da API em resposta à sua solicitação de recurso de implantação de não atribuição.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
A versão da API que você está chamando.
2022-10-01-preview
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".