Como treinar um modelo da Análise de sentimento personalizada
Para treinar um modelo, inicie um trabalho de treinamento. Somente trabalhos concluídos com êxito criam um modelo utilizável. Os trabalhos de treinamento expiram após sete dias. Após esse período, você não poderá recuperar os detalhes do trabalho. Se o trabalho de treinamento foi concluído com êxito e um modelo foi criado, ele não será afetado pela expiração do trabalho. Você só pode ter um trabalho de treinamento em execução de cada vez e não pode iniciar outros trabalhos no mesmo projeto.
Os tempos de treinamento podem ser de alguns minutos ao lidar com alguns documentos até várias horas, dependendo do tamanho do conjunto de dados e da complexidade do esquema.
Pré-requisitos
Antes de treinar o modelo, você precisa dos seguintes itens:
- Um projeto criado com êxito com uma conta configurada do armazenamento de blobs do Azure.
Divisão de dados
Antes de iniciar o processo de treinamento, os documentos rotulados no projeto são divididos em um conjunto de treinamento e um conjunto de teste. Cada um deles atua em uma função diferente. O conjunto de treinamentos é usado no treinamento do modelo, esse é o conjunto com o qual o modelo aprende a classe/as classes atribuídas a cada documento. O conjunto de testes é um conjunto cego que não é introduzido ao modelo durante o treinamento, mas somente durante a avaliação. Depois que o modelo é treinado com êxito, ele é usado para fazer previsões nos documentos do conjunto de testes. As métricas de avaliação do modelo serão calculadas com base nessas previsões. É recomendável garantir que todas as classes sejam representadas adequadamente nos conjuntos de treinamentos e testes.
A Análise de sentimento personalizada dá suporte a dois métodos para divisão de dados:
- Dividir automaticamente o conjunto de teste nos dados de treinamento: o sistema dividirá os dados rotulados entre os conjuntos de treinamentos e testes, de acordo com os percentuais escolhidos. O sistema tentará ter uma representação de todas as classes em seu conjunto de treinamento. A divisão percentual recomendada é de 80% para treinamento e 20% para teste.
Observação
Se você escolher a opção Dividir automaticamente o conjunto de testes nos dados de treinamento, somente os dados atribuídos ao conjunto de treinamentos serão divididos de acordo com os percentuais fornecidos.
- Usar uma divisão manual dos dados de treinamento e de teste: esse método permite que os usuários definam quais documentos rotulados devem pertencer a qual conjunto.
Treinar um modelo
Para começar a treinar o modelo no Language Studio:
Selecione Trabalhos de treinamento no menu à esquerda.
Selecione Iniciar um trabalho de treinamento no menu superior.
Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Também é possível substituir um modelo existente selecionando essa opção e escolhendo o modelo que você deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.
Por padrão, o sistema dividirá seus dados rotulados entre os conjuntos de treinamento e teste, de acordo com as porcentagens especificadas. Se você tiver documentos em seu conjunto de testes, poderá dividir manualmente os dados de treinamento e teste.
Selecione o botão Treinar.
Se você selecionar a ID de Trabalho de Treinamento da lista, será exibido um painel lateral no qual você poderá verificar o Progresso do treinamento, o Status do trabalho e outros detalhes para esse trabalho.
Observação
- Somente os trabalhos de treinamento concluídos com êxito vão gerar modelos.
- O treinamento pode levar entre alguns minutos e várias horas de acordo com o tamanho dos dados rotulados.
- É possível ter um trabalho de treinamento em execução por vez. Não é possível iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.
Cancelar o trabalho de treinamento
Para cancelar um trabalho de treinamento no Language Studio, acesse a página Trabalhos de treinamento. Selecione o trabalho de treinamento que você deseja cancelar e clique em Cancelar no menu superior.
Próximas etapas
Após a conclusão do treinamento, você poderá exibir o desempenho do modelo para melhorar o modelo opcionalmente, se necessário. Quando estiver satisfeito com seu modelo, você poderá implantá-lo, tornando-o disponível para uso.