Partilhar via


O que é o reconhecimento de entidade nomeado personalizado?

O reconhecimento personalizado de entidade nomeada (NER) é um serviço de API baseado em nuvem que usa aprendizado de máquina para ajudá-lo a criar modelos projetados para seus requisitos exclusivos de reconhecimento de entidade. É uma das funcionalidades especializadas disponíveis através do Azure Language no Foundry Tools. Com o NER personalizado, você pode criar modelos de IA que extraem entidades específicas do domínio de texto não estruturado, como contratos ou documentos financeiros. Ao iniciar um projeto NER personalizado, você pode rotular dados repetidamente, treinar e avaliar seu modelo e melhorar seu desempenho antes de implantá-lo. A qualidade dos dados rotulados é essencial, uma vez que impacta diretamente a precisão do modelo.

Para simplificar a construção e personalização do seu modelo, o serviço oferece uma plataforma web personalizada que pode ser acedida através do Microsoft Foundry. Você pode facilmente começar com o serviço seguindo as etapas neste início rápido.

Esta documentação contém os seguintes tipos de artigo:

  • Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.

Exemplos de cenários de utilização

O reconhecimento personalizado de entidades nomeadas pode ser usado em vários cenários em vários setores:

Extração de informação

Muitas organizações financeiras e jurídicas extraem e normalizam dados de milhares de fontes de texto complexas e não estruturadas diariamente. Essas fontes incluem extratos bancários, acordos legais ou formulários bancários. Por exemplo, a extração de dados de aplicativos de hipoteca feita manualmente por revisores humanos pode levar vários dias para ser extraída. Automatizar essas etapas criando um modelo NER personalizado simplifica o processo e economiza custo, tempo e esforço.

A pesquisa é fundamental para qualquer aplicativo que exponha conteúdo de texto para os usuários. Os cenários comuns incluem pesquisa de catálogos ou documentos, pesquisa de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores querem criar uma experiência de pesquisa rica em conteúdo privado e heterogêneo, que inclui documentos estruturados e não estruturados. Como parte de seu pipeline, os desenvolvedores podem usar o NER personalizado para extrair entidades do texto que são relevantes para seu setor. Essas entidades podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Auditoria e conformidade

Em vez de revisar manualmente arquivos de texto longos para auditar e aplicar políticas, os departamentos de TI em empresas financeiras ou jurídicas podem usar o NER personalizado para criar soluções automatizadas. Essas soluções podem ser úteis para aplicar políticas de conformidade e configurar as regras de negócios necessárias com base em pipelines de mineração de conhecimento que processam conteúdo estruturado e não estruturado.

Ciclo de vida de desenvolvimento do projeto

O uso do NER personalizado normalmente envolve várias etapas diferentes.

O ciclo de vida do desenvolvimento

  1. Defina seu esquema: conheça seus dados e identifique as entidades que deseja extrair. Evite a ambiguidade.

  2. Rotule seus dados: rotular dados é um fator-chave para determinar o desempenho do modelo. Rotule de forma precisa, consistente e completa.

    • Rotule com precisão: rotule cada entidade sempre com o tipo certo. Inclua apenas o que pretende extrair e evite dados desnecessários nas suas etiquetas.
    • Rotular de forma consistente: a mesma entidade deve ter o mesmo rótulo em todos os arquivos. Rotular completamente: rotule todas as instâncias da entidade em todos os seus arquivos.
  3. Treinar o modelo: seu modelo começa a aprender com seus dados rotulados.

  4. Veja o desempenho do modelo: Após o treinamento, revise os resultados da avaliação e analise o desempenho para melhoria.

  5. Implantar o modelo: a implantação de um modelo o torna disponível para uso por meio da API de análise.

  6. Extrair entidades: use seus modelos personalizados para tarefas de extração de entidades.

Documentação de referência e exemplos de código

Ao usar NER personalizado, consulte a seguinte documentação de referência e exemplos para a Linguagem Azure no Foundry Tools:

Opção de desenvolvimento / linguagem Documentação de referência Exemplos
APIs REST (criação) Documentação da API REST
APIs REST (tempo de execução) Documentação da API REST
C# (Tempo de execução) Documentação em C# Exemplos de C#
Java (Tempo de execução) Documentação Java Amostras Java
JavaScript (Tempo de execução) Documentação do JavaScript Exemplos de JavaScript
Python (Tempo de execução) Documentação Python Amostras de Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para saber mais sobre o uso e a implantação responsáveis da IA em seus sistemas. Para obter mais informações, consulte os seguintes artigos:

Próximos passos

  • Use o artigo de início rápido para começar a usar o reconhecimento personalizado de entidade nomeada.

  • Ao percorrer o ciclo de vida de desenvolvimento do projeto, revise o glossário para saber mais sobre os termos usados em toda a documentação para esse recurso.

  • Lembre-se de visualizar os limites de serviço para informações como disponibilidade regional.