Definições e termos de reconhecimento de entidades nomeados personalizados

Artigo
12/19/2023

Utilize este artigo para saber mais sobre algumas das definições e termos que poderá encontrar ao utilizar o NER personalizado.

Entidade

Uma entidade é um intervalo de texto que indica um determinado tipo de informação. O intervalo de texto pode consistir numa ou mais palavras. No âmbito do NER personalizado, as entidades representam as informações que o utilizador quer extrair do texto. Os programadores identificam entidades nos respetivos dados com as entidades necessárias antes de as transmitirem ao modelo para preparação. Por exemplo, "Número da fatura", "Data de início", "Número de envio", "Local de nascimento", "Cidade de origem", "Nome do fornecedor" ou "Endereço do cliente".

Por exemplo, na frase "João pediu emprestado 25 000 USD ao Fred." as entidades podem ser:

Nome/tipo de entidade	Entidade
Nome do Mutuário	John
Nome do Credor	Fred
Montante do Empréstimo	25 000 USD

Classificação F1

A classificação F1 é uma função de Precisão e Revocação. É necessário quando procura um equilíbrio entre precisão e revocação.

Modelação

Um modelo é um objeto preparado para realizar uma determinada tarefa, neste caso, o reconhecimento de entidades personalizadas. Os modelos são preparados ao fornecer dados etiquetados para aprender, para que possam ser utilizados posteriormente para tarefas de reconhecimento.

A preparação de modelos é o processo de ensinar ao seu modelo o que extrair com base nos seus dados etiquetados.
A avaliação de modelos é o processo que ocorre logo após a preparação para saber o desempenho do modelo.
A implementação é o processo de atribuição do modelo a uma implementação para o disponibilizar para utilização através da API de predição.

Precisão

Mede a precisão/precisão do modelo. É a proporção entre os positivos corretamente identificados (verdadeiros positivos) e todos os positivos identificados. A métrica de precisão revela quantas classes previstas estão corretamente etiquetadas.

Project

Um projeto é uma área de trabalho para criar os seus modelos de ML personalizados com base nos seus dados. O projeto só pode ser acedido por si e por outras pessoas que tenham acesso ao recurso do Azure que está a ser utilizado. Como pré-requisito para criar um projeto de extração de entidades personalizado, tem de ligar o recurso a uma conta de armazenamento com o seu conjunto de dados quando criar um novo projeto. O projeto inclui automaticamente todos os .txt ficheiros disponíveis no contentor.

No seu projeto, pode efetuar as seguintes ações:

Etiquetar os seus dados: o processo de etiquetagem dos seus dados para que quando prepara o seu modelo aprenda o que pretende extrair.
Criar e preparar o seu modelo: o passo principal do seu projeto, onde o modelo começa a aprender com os seus dados etiquetados.
Ver detalhes da avaliação do modelo: reveja o desempenho do modelo para decidir se há espaço para melhoramentos ou se está satisfeito com os resultados.
Implementação: depois de rever o desempenho do modelo e decidir que pode ser utilizado no seu ambiente, tem de atribuí-lo a uma implementação para o utilizar. Atribuir o modelo a uma implementação torna-o disponível para utilização através da API de predição.
Modelo de teste: depois de implementar o seu modelo, teste a sua implementação no Language Studio para ver como funcionaria na produção.

Chamar de volta

Mede a capacidade do modelo de prever classes positivas reais. É a proporção entre os verdadeiros positivos previstos e o que foi realmente marcado. A métrica de resgate revela quantas das classes previstas estão corretas.