O que é o reconhecimento de entidades com nome personalizado?

Artigo
12/19/2023

O NER personalizado é uma das funcionalidades personalizadas oferecidas pela Linguagem de IA do Azure. É um serviço de API baseado na cloud que aplica machine learning intelligence para lhe permitir criar modelos personalizados para tarefas de reconhecimento de entidades nomeadas personalizadas.

O NER personalizado permite que os utilizadores criem modelos de IA personalizados para extrair entidades específicas do domínio de texto não estruturado, como contratos ou documentos financeiros. Ao criar um projeto NER Personalizado, os programadores podem etiquetar iterativamente dados, preparar, avaliar e melhorar o desempenho do modelo antes de os disponibilizarem para consumo. A qualidade dos dados etiquetados afeta significativamente o desempenho do modelo. Para simplificar a criação e personalização do modelo, o serviço oferece um portal Web personalizado que pode ser acedido através do Language Studio. Pode facilmente começar a utilizar o serviço ao seguir os passos neste início rápido.

Esta documentação contém os seguintes tipos de artigo:

Os inícios rápidos são instruções de introdução para orientá-lo através da realização de pedidos para o serviço.
Os conceitos fornecem explicações sobre as funcionalidades e funcionalidades do serviço.
Os manuais de instruções contêm instruções para utilizar o serviço de formas mais específicas ou personalizadas.

Cenários de utilização de exemplo

O reconhecimento de entidades com nome personalizado pode ser utilizado em vários cenários em vários setores:

Extração de informações

Muitas organizações financeiras e jurídicas extraem e normalizam dados de milhares de origens de texto complexas e não estruturadas diariamente. Tais fontes incluem extratos bancários, contratos legais ou formulários bancários. Por exemplo, a extração de dados de pedidos de hipotecas feita manualmente pelos revisores humanos pode demorar vários dias a extrair. Automatizar estes passos ao criar um modelo NER personalizado simplifica o processo e poupa custos, tempo e esforço.

Extração de conhecimentos para melhorar/enriquecer a pesquisa semântica

A pesquisa é fundamental para qualquer aplicação que apresenta conteúdo de texto aos utilizadores. Os cenários comuns incluem pesquisa de catálogos ou documentos, pesquisa de produtos de revenda ou extração de conhecimentos para ciência de dados. Muitas empresas em vários setores querem criar uma experiência de pesquisa avançada em conteúdo privado e heterogéneo, que inclui documentos estruturados e não estruturados. Como parte do pipeline, os programadores podem utilizar o NER personalizado para extrair entidades do texto que são relevantes para o setor. Estas entidades podem ser utilizadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.

Auditoria e conformidade

Em vez de rever manualmente ficheiros de texto significativamente longos para auditar e aplicar políticas, os departamentos de TI em empresas financeiras ou jurídicas podem utilizar o NER personalizado para criar soluções automatizadas. Estas soluções podem ser úteis para impor políticas de conformidade e configurar as regras de negócio necessárias com base em pipelines de extração de conhecimento que processam conteúdo estruturado e não estruturado.

Ciclo de vida de desenvolvimento de projetos

Normalmente, a utilização de NER personalizado envolve vários passos diferentes.

Defina o esquema: conheça os seus dados e identifique as entidades que pretende extrair. Evite ambiguidade.
Etiquetar os seus dados: a etiquetagem de dados é um fator fundamental para determinar o desempenho do modelo. Etiquetar com precisão, de forma consistente e completa.
1. Etiquetar com precisão: etiquetar cada entidade para o tipo certo sempre. Inclua apenas o que pretende extrair, evite dados desnecessários nas suas etiquetas.
2. Etiqueta de forma consistente: a mesma entidade deve ter a mesma etiqueta em todos os ficheiros.
3. Etiquetar completamente: etiquetar todas as instâncias da entidade em todos os seus ficheiros.
Preparar o modelo: o modelo começa a aprender com os seus dados etiquetados.
Ver o desempenho do modelo: após a conclusão da preparação, veja os detalhes de avaliação do modelo, o desempenho e a documentação de orientação sobre como melhorá-lo.
Implementar o modelo: implementar um modelo disponibiliza-o para utilização através da API de Análise.
Extrair entidades: utilize os seus modelos personalizados para tarefas de extração de entidades.

Documentação de referência e exemplos de código

À medida que utiliza o NER personalizado, veja a seguinte documentação de referência e exemplos para a Linguagem de IA do Azure:

Opção de desenvolvimento/idioma	Documentação de referência	Amostras
APIs REST (Criação)	Documentação da API REST
APIs REST (Runtime)	Documentação da API REST
C# (Runtime)	Documentação do C#	Amostras em C#
Java (Runtime)	Documentação do Java	Exemplos de Java
JavaScript (Runtime)	Documentação do JavaScript	Exemplos de JavaScript
Python (Runtime)	Documentação do Python	Amostras de Python

IA Responsável

Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a utilizarão, as pessoas que serão afetadas pela mesma e o ambiente em que é implementada. Leia a nota de transparência do NER personalizado para saber mais sobre a utilização e implementação responsáveis de IA nos seus sistemas. Também pode ver os seguintes artigos para obter mais informações:

Passos seguintes

Utilize o artigo de início rápido para começar a utilizar o reconhecimento de entidades com nome personalizado.
À medida que percorre o ciclo de vida de desenvolvimento do projeto, reveja o glossário para saber mais sobre os termos utilizados em toda a documentação para esta funcionalidade.
Lembre-se de ver os limites de serviço para obter informações como a disponibilidade regional.