Preparar o modelo de reconhecimento de entidades com nome personalizado
A preparação é o processo em que o modelo aprende com os seus dados etiquetados. Após a conclusão da preparação, poderá ver o desempenho do modelo para determinar se precisa de melhorar o modelo.
Para preparar um modelo, inicie uma tarefa de preparação e apenas as tarefas concluídas com êxito criam um modelo. As tarefas de formação expiram após sete dias, o que significa que não conseguirá obter os detalhes da tarefa após esta altura. Se a tarefa de preparação tiver sido concluída com êxito e tiver sido criado um modelo, o modelo não será afetado. Só pode ter um trabalho de formação em execução de cada vez e não pode iniciar outros trabalhos no mesmo projeto.
Os tempos de preparação podem ser em qualquer lugar a partir de alguns minutos ao lidar com poucos documentos, até várias horas, dependendo do tamanho do conjunto de dados e da complexidade do seu esquema.
Pré-requisitos
- Um projeto criado com êxito com uma conta de armazenamento de blobs do Azure configurada
- Dados de texto que foram carregados para a sua conta de armazenamento.
- Dados etiquetados
Veja o ciclo de vida de desenvolvimento do projeto para obter mais informações.
Divisão de dados
Antes de iniciar o processo de preparação, os documentos etiquetados no projeto são divididos num conjunto de preparação e num conjunto de testes. Cada um deles serve uma função diferente. O conjunto de preparação é utilizado na preparação do modelo, este é o conjunto a partir do qual o modelo aprende as entidades etiquetadas e que intervalos de texto devem ser extraídos como entidades. O conjunto de testes é um conjunto cego que não é introduzido no modelo durante a preparação, mas apenas durante a avaliação. Após a conclusão da preparação de modelos com êxito, o modelo é utilizado para fazer predições a partir dos documentos nos testes e com base nestas métricas de avaliação de predições são calculadas . É recomendado garantir que todas as suas entidades estão adequadamente representadas no conjunto de preparação e teste.
O NER personalizado suporta dois métodos de divisão de dados:
- Dividir automaticamente o conjunto de testes a partir dos dados de preparação: o sistema irá dividir os dados etiquetados entre os conjuntos de preparação e teste, de acordo com as percentagens que escolher. A divisão percentual recomendada é de 80% para preparação e 20% para testes.
Nota
Se escolher a opção Dividir automaticamente o conjunto de testes a partir da opção de dados de preparação , apenas os dados atribuídos ao conjunto de preparação serão divididos de acordo com as percentagens fornecidas.
- Utilizar uma divisão manual dos dados de preparação e teste: este método permite que os utilizadores definam a que documentos etiquetados devem pertencer a que conjunto. Este passo só está ativado se tiver adicionado documentos ao conjunto de testes durante a etiquetagem de dados.
Preparar modelo
Para começar a preparar o modelo a partir do Language Studio:
Selecione Tarefas de preparação no menu do lado esquerdo.
Selecione Iniciar uma tarefa de preparação no menu superior.
Selecione Preparar um novo modelo e escreva o nome do modelo na caixa de texto. Também pode substituir um modelo existente ao selecionar esta opção e escolher o modelo que pretende substituir no menu pendente. A substituição de um modelo preparado é irreversível, mas não afetará os modelos implementados até implementar o novo modelo.
Selecione o método de divisão de dados. Pode escolher Dividir automaticamente o conjunto de testes dos dados de preparação em que o sistema irá dividir os dados etiquetados entre os conjuntos de preparação e teste, de acordo com as percentagens especificadas. Em alternativa, pode Utilizar uma divisão manual dos dados de preparação e teste, esta opção só está ativada se tiver adicionado documentos ao seu conjunto de testes durante a etiquetagem de dados. Veja Como preparar um modelo para obter informações sobre a divisão de dados.
Selecione o botão Preparar .
Se selecionar o ID da Tarefa de Preparação na lista, será apresentado um painel lateral onde pode verificar o progresso da preparação, o estado da tarefa e outros detalhes para esta tarefa.
Nota
- Apenas as tarefas de preparação concluídas com êxito irão gerar modelos.
- A preparação pode demorar algum tempo entre alguns minutos e várias horas com base no tamanho dos seus dados etiquetados.
- Só pode ter um trabalho de preparação em execução de cada vez. Não pode iniciar outro trabalho de preparação no mesmo projeto sem que o trabalho em execução esteja concluído.
Cancelar tarefa de preparação
Para cancelar uma tarefa de preparação a partir do Language Studio, aceda à página Tarefas de preparação . Selecione a tarefa de preparação que pretende cancelar e selecione Cancelar no menu superior.
Passos seguintes
Após a conclusão da preparação, poderá ver o desempenho do modelo para melhorar opcionalmente o modelo, se necessário. Assim que estiver satisfeito com o seu modelo, pode implementá-lo, disponibilizando-o para utilização para extrair entidades do texto.