Treinar o modelo do fluxo de trabalho de orquestração

Artigo
12/19/2023

O treinamento é o processo no qual o modelo aprende com os enunciados rotulados. Após a conclusão do treinamento, você poderá exibir o desempenho do modelo.

Para treinar um modelo, inicie um trabalho de treinamento. Somente trabalhos concluídos com êxito criam um modelo. Os trabalhos de treinamento expiram após sete dias, e, após esse prazo, você não poderá recuperar os detalhes do trabalho. Se o trabalho de treinamento foi concluído com êxito e um modelo foi criado, ele não será afetado pela expiração do trabalho. Você só pode ter um trabalho de treinamento em execução de cada vez e não pode iniciar outros trabalhos no mesmo projeto.

Os tempos de treinamento podem estar em qualquer lugar de alguns segundos ao lidar com projetos simples, até algumas horas quando você atinge o imite máximo de declarações.

A avaliação do modelo é disparada automaticamente depois que o treinamento é concluído com êxito. O processo de avaliação começa usando o modelo treinado para executar previsões nos enunciados no conjunto de testes e compara os resultados previstos com os rótulos fornecidos (que estabelecem uma linha de base de verdade). Os resultados são retornados para que você possa revisar o desempenho do modelo.

Pré-requisitos

Um projeto criado com sucesso com uma conta de armazenamento de blobs do Azure configurada

Confira o ciclo de vida de desenvolvimento de projetos para obter mais informações.

Divisão de dados

Antes de iniciar o processo de treinamento, os enunciados rotulados no projeto são divididos em um conjunto de treinamento e um conjunto de teste. Cada um deles atua em uma função diferente. O conjunto de treinamentos é usado no treinamento do modelo, esse é o conjunto com o qual o modelo aprende os enunciados rotulados. O conjunto de teste é um conjunto cego que não é introduzido ao modelo durante o treinamento, mas somente durante a avaliação.

Depois que o modelo é treinado com êxito, ele pode ser usado para fazer previsões nos enunciados do conjunto de testes. Essas previsões são usadas para calcular as métricas de avaliação.

É recomendável garantir que todas as intenções sejam representadas adequadamente nos conjuntos de treinamentos e testes.

O fluxo de trabalho de orquestração dá suporte a dois métodos para divisão de dados:

Dividir automaticamente o conjunto de testes nos dados de treinamento: o sistema dividirá os dados marcados entre os conjuntos de treinamentos e testes, de acordo com os percentuais escolhidos. A divisão percentual recomendada é de 80% para treinamento e 20% para teste.

Observação

Se você escolher a opção Dividir automaticamente o conjunto de testes nos dados de treinamento, somente os dados atribuídos ao conjunto de treinamentos serão divididos de acordo com os percentuais fornecidos.

Usar uma divisão manual dos dados de treinamento e de teste: esse método permite que os usuários definam quais enunciados devem pertencer a qual conjunto. Essa etapa será habilitada somente se você tiver adicionado enunciados ao conjunto de testes durante a rotulagem.

Observação

Os enunciados no conjunto de dados de treinamento só podem ser adicionado para intenções não conectadas.

Treinar um modelo

Para começar a treinar o modelo no Language Studio:

Selecione Trabalhos de treinamento no menu à esquerda.
Selecione Iniciar um trabalho de treinamento no menu superior.
Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Também é possível substituir um modelo existente selecionando essa opção e escolhendo o modelo que você deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.

Se você habilitou seu projeto para dividir manualmente os dados ao marcar os enunciados, verá duas opções de divisão de dados:
- Dividir automaticamente o conjunto de teste nos dados de treinamento: os enunciados marcados serão divididos aleatoriamente entre os conjuntos de treinamento e de teste, de acordo com os percentuais escolhidos. A divisão percentual padrão é de 80% para treinamento e 20% para teste. Para alterar esses valores, escolha o conjunto que deseja alterar e insira o novo valor.
Observação

Se você escolher a opção Dividir automaticamente o conjunto de testes nos dados de treinamento, somente os enunciados no conjunto de treinamento serão divididos de acordo com os percentuais fornecidos.
- Use uma divisão manual de dados de treinamento e teste: atribua cada enunciado ao conjunto de treinamento ou teste durante a etapa de marcação do projeto.
Observação

A opção Usar uma divisão manual de dados de treinamento e teste só será habilitada se você adicionar enunciados ao conjunto de testes na página de dados da marcação. Caso contrário, ela será desabilitada.
Selecione o botão Treinar.

Observação

Somente os trabalhos de treinamento concluídos com êxito vão gerar modelos.
O treinamento pode levar de alguns minutos a algumas horas, de acordo com o tamanho dos dados marcados.
É possível ter um trabalho de treinamento em execução por vez. Não é possível iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.

Crie uma solicitação POST usando a URL, os cabeçalhos e o corpo JSON a seguir para enviar um trabalho de treinamento.

URL da solicitação

Use a URL a seguir ao criar sua solicitação de API. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`EmailApp`
`{API-VERSION}`	A versão da API que você está chamando.	`2023-04-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da solicitação

Use o seguinte objeto em sua solicitação. O modelo será nomeado MyModel quando o treinamento for concluído.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "standard",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Chave	Espaço reservado	Valor	Exemplo
`modelLabel`	`{MODEL-NAME}`	O nome do seu Modelo.	`Model1`
`trainingMode`	`standard`	Modo de treinamento. Apenas um modo de treinamento está disponível na orquestração, que é `standard`.	`standard`
`trainingConfigVersion`	`{CONFIG-VERSION}`	A versão do modelo de configuração de treinamento. Por padrão, a versão do modelo mais recente do modelo é usada.	`2022-05-01`
`kind`	`percentage`	Métodos de divisão. Os possíveis valores são `percentage` ou `manual`. Confira como treinar um modelo para obter mais informações.	`percentage`
`trainingSplitPercentage`	`80`	Porcentual dos dados marcados a serem incluídos no conjunto de treinamentos. O valor recomendado é `80`.	`80`
`testingSplitPercentage`	`20`	Porcentual dos dados marcados a serem incluídos no conjunto de teste. O valor recomendado é `20`.	`20`

Observação

trainingSplitPercentage e testingSplitPercentage serão necessários somente se Kind for definido como percentage, sendo que a soma de ambos os percentuais deverá ser igual a 100.

Depois de enviar sua solicitação de API, você receberá uma 202 resposta indicando êxito. Nos cabeçalhos de resposta, extraia o valor operation-location. A formatação ficará da seguinte maneira:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

É possível usar essa URL para obter o status do trabalho de treinamento.

Obter status do trabalho de treinamento

Language Studio
APIs REST

Selecione a ID do trabalho de treinamento na lista; um painel lateral aparecerá, onde você pode verificar o Progresso do treinamento, o Status do trabalho e outros detalhes para este trabalho.

O treinamento pode demorar um pouco, dependendo do tamanho dos dados de treinamento e da complexidade do esquema. Você pode usar a solicitação a seguir para continuar sondando o status do trabalho de treinamento até que ele seja concluído com êxito.

Use a seguinte solicitação GET para obter o status do processo de treinamento do modelo. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

URL da solicitação

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{YOUR-ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`EmailApp`
`{JOB-ID}`	A ID para localização do status de treinamento do modelo. Isso está no valor de cabeçalho `location` recebido quando você enviou seu trabalho de treinamento.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	A versão da API que você está chamando.	`2023-04-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da resposta

Depois de enviar a solicitação, você receberá a seguinte resposta. Continue sondando esse ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxxx-xxxxx-xxxxxx-xxxxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Chave	Valor	Exemplo
`modelLabel`	O nome do modelo	`Model1`
`trainingConfigVersion`	A versão da configuração de treinamento. Por padrão, a versão mais recente é usada.	`2022-05-01`
`startDateTime`	A hora de início do treinamento	`2022-04-14T10:23:04.2598544Z`
`status`	O status do trabalho de treinamento	`running`
`estimatedEndDateTime`	Tempo estimado para o término do trabalho de treinamento	`2022-04-14T10:29:38.2598544Z`
`jobId`	ID do trabalho de treinamento	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Data e hora de criação do trabalho de treinamento	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Data e hora da última atualização do trabalho de treinamento	`2022-04-14T10:23:45Z`
`expirationDateTime`	Data e hora de validade do trabalho de treinamento	`2022-04-14T10:22:42Z`

Cancelar o trabalho de treinamento

Language Studio
APIs REST

Para cancelar um trabalho de treinamento no Language Studio, acesse a página Treinar modelo. Selecione o trabalho de treinamento que deseja cancelar e selecione Cancelar no menu superior.

Crie uma solicitaçãoPOST usando a URL, os cabeçalhos e o corpo JSON a seguir para cancelar um trabalho de treinamento.

URL da solicitação

Use a URL a seguir ao criar sua solicitação de API. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`EmailApp`
`{JOB-ID}`	Essa é a ID do trabalho de treinamento	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	A versão da API que você está chamando.	`2023-04-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Depois de enviar a solicitação de API, você receberá uma resposta 202 indicando êxito, o que significa que o trabalho de treinamento foi cancelado. Uma chamada bem-sucedida resulta em um cabeçalho Operation-Location usado para verificar o status do trabalho.

Treinar o modelo do fluxo de trabalho de orquestração

Pré-requisitos

Divisão de dados

Treinar um modelo

Iniciar o trabalho de treinamento

URL da solicitação

Cabeçalhos

Corpo da solicitação

Obter status do trabalho de treinamento

URL da solicitação

Cabeçalhos

Corpo da resposta

Cancelar o trabalho de treinamento

URL da solicitação

Cabeçalhos

Próximas etapas

Recursos adicionais