Usar o Estúdio da Informação de Documentos do Azure

Concluído

Além dos SDKs e da API REST, os serviços do Azure Document Intelligence podem ser acessados por meio de uma interface do usuário chamada Azure Document Intelligence Studio, uma ferramenta online para explorar visualmente, entender e integrar recursos do serviço de Inteligência de Documentos do Azure. O Estúdio pode ser usado para analisar layouts de formulário, extrair dados de modelos predefinidos e treinar modelos personalizados.

Gif dos recursos do Azure Document Intelligence Studio.

Atualmente, o Estúdio da Informação de Documentos do Azure dá suporte aos seguintes projetos:

  • Modelos de análise de documentos
    • Leitura: extrai linhas de texto impressas e manuscritas, palavras, locais e idiomas detectados de documentos e imagens.
    • Layout: extrai texto, tabelas, marcas de seleção e informações de estrutura de documentos (PDF e TIFF) e imagens (JPG, PNG e BMP).
    • Documentos gerais: extrai pares de valores-chave, marcas de seleção e entidades de documentos.
  • Modelos predefinidos
  • Modelos personalizados

Criar projetos de modelo de análise de documento

Para extrair texto, tabelas, estrutura, pares chave-valor e entidades nomeadas com modelos de análise de documentos:

  • Criar um recurso de Informação de Documentos do Azure ou Foundry Tools
  • Selecione "Ler", "Layout" ou "Documentos Gerais" na categoria de Modelos de análise de documento
  • Analise seu documento. Você precisará do ponto de extremidade e da chave da sua Informação de Documentos do Azure ou Foundry Tools.

Criar projetos de modelo predefinido

Para extrair dados de formulários comuns com modelos predefinidos:

  • Criar um recurso do Azure Document Intelligence ou Foundry Tools
  • Selecione um dos "modelos predefinidos", incluindo W-2s, faturas, recibos, documentos de identificação, seguro de saúde, vacinação e cartões de visita.
  • Analise seu documento. Você precisará do ponto de extremidade e da chave da sua Informação de Documentos do Azure ou Foundry Tools.

Criar projetos de modelo personalizado

Você pode usar o serviço personalizado do Estúdio da Informação de Documentos do Azure durante todo o processo de treinamento e teste de modelos personalizados.

Quando você usa o Azure Document Intelligence Studio para criar modelos personalizados, os arquivos ocr.json , arquivoslabels.json e fields.json arquivo necessário para treinamento são automaticamente criados e armazenados em sua conta de armazenamento.

Para treinar um modelo personalizado e usá-lo para extrair dados com modelos personalizados:

  • Criar um recurso do Azure Document Intelligence ou das Ferramentas de Foundry
  • Recolher pelo menos 5 a 6 formulários de exemplo para treinamento e carregá-los no contêiner da conta de armazenamento.
  • Configure o CORS (compartilhamento de recurso entre domínios). O CORS permite que o Estúdio da Informação de Documentos do Azure armazene arquivos rotulados em seu contêiner de armazenamento.
  • Crie um projeto de modelo personalizado no Estúdio da Informação de Documentos do Azure. Você precisará fornecer configurações que vinculem seu contêiner de armazenamento ao recurso de Azure Document Intelligence ou às ferramentas Foundry no projeto.
  • Use o Estúdio da Informação de Documentos do Azure para aplicar rótulos ao texto.
  • Treine o modelo. Depois que o modelo for treinado, você receberá uma ID de modelo e uma precisão média para marcas.
  • Teste seu modelo analisando um novo formulário que não foi usado no treinamento.