Estúdio de Informação de Documentos

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
  • Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
  • Leste dos EUA
  • Oeste dos EUA 2
  • Oeste da Europa

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (disponibilidade geral)marca de seleção azulv3.0 (disponibilidade geral)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção roxav3.1

O Estúdio da Informação de Documentos é uma ferramenta online para explorar visualmente, entender e integrar recursos do serviço Informação de Documentos em seus aplicativos. Use o Document Intelligence Studio para:

  • Saiba mais sobre os diferentes recursos da Informação de Documentos.
  • Use seu recurso de Informação de Documentos para testar modelos em documentos de amostra ou carregar seus próprios documentos.
  • Experimente com diferentes complemento versões prévias de recursos para adaptar o resultado às suas necessidades.
  • Treine modelos de classificação personalizados para classificar documentos.
  • Treine modelos de extração personalizados para extrair campos de documentos.
  • Obtenha o código de exemplo dos SDKs específicos do idioma para integrar em seus aplicativos.

Use o Guia de início rápido do Document Intelligence Studio para começar a analisar documentos com a análise de documentos ou modelos predefinidos. Crie modelos personalizados e faça referência aos modelos em seus aplicativos usando os SDKs específicos do idioma e outros inícios rápidos.

A imagem a seguir mostra a página de aterrissagem do Estúdio da Informação de Documentos.

Página inicial do Estúdio da Informação de Documentos

Introdução

Se você estiver visitando o Studio pela primeira vez, siga o guia de introdução para configurá-lo para uso.

Opções de análise

  • A Informação de Documentos agora dá suporte a recursos de análise sofisticados. O Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos de complemento com facilidade.

  • Dependendo do cenário de extração de documentos, configure o intervalo de análises, o intervalo de páginas de documentos, a detecção opcional e os recursos de detecção premium.

    Captura de tela da janela de diálogo analisar opções.

    Observação

    A extração de fontes não é visualizada no Estúdio da Informação de Documentos. No entanto, é possível marcar a seção de estilos da saída JSON para obter os resultados de detecção de fonte.

✔️ Rotulagem automática de documentos com modelos predefinidos ou um de seus próprios modelos

  • Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente seus documentos usando um dos modelos predefinidos do Serviço de Informação de Documentos ou seus modelos treinados.

    Captura de tela animada mostrando a rotulagem automática no Estúdio.

  • Para alguns documentos, rótulos duplicados após a execução do rótulo automático são possíveis. Modifique os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

    Captura de tela mostrando o aviso de rótulo duplicado após a rotulagem automática.

✔️ Tabelas de rotulagem automática

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

    Captura de tela animada mostrando a rotulagem automática no Estúdio.

✔️ Adicionar arquivos de teste diretamente ao conjunto de dados de treinamento

  • Uma vez treinado um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo, carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

  • Se uma pontuação de baixa confiança for retornada para alguns rótulos, verifique se eles estão corretamente rotulados. Caso contrário, adicione-os ao conjunto de dados de treinamento e re-rótulo para melhorar a qualidade do modelo.

Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados

  • Na página de rotulagem de modelo de extração personalizada, agora você pode navegar por seus documentos de treinamento com facilidade fazendo uso da pesquisa, filtro e classificação por recurso.

  • Utilize o modo de exibição de grade para visualizar documentos ou use a exibição de lista para percorrer os documentos com mais facilidade.

    Captura de tela das opções e filtros de exibição de lista de documentos.

✔️ Compartilhamento de projetos

Suporte ao modelo da Informação de Documentos

  • Leitura: experimente o recurso de leitura da Informação de Documentos para extrair linhas de texto, palavras, idiomas detectados e estilo manuscrito, se detectado. Comece com o recurso de leitura do estúdio. Explore com documentos de exemplo e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Confira a Visão geral de leitura para saber mais e começar a trabalhar com o início rápido do SDK do Python para Layout.

  • Layout: experimente o recurso de layout da Informação de Documentos para extrair texto, tabelas, marcas de seleção e informações da estrutura. Comece com o recurso de layout do estúdio. Explore com documentos de exemplo e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Confira a Visão geral do layout para saber mais e começar a trabalhar com o início rápido do SDK do Python para Layout.

  • Modelos predefinidos: os modelos predefinidos da Informação de Documentos permitem adicionar processamento de documento inteligente aos seus aplicativos e fluxos sem precisar treinar e criar seus próprios modelos. Como exemplo, comece com o recurso de fatura do estúdio. Explore com documentos de exemplo e seus documentos. Use a visualização interativa, a lista de campos extraídos e a saída JSON para entender como o recurso funciona. Confira a Visão geral do modelo para saber mais e começar a trabalhar com o início rápido do SDK do Python para Fatura predefinida.

  • Modelos personalizados: os modelos personalizados da Informação de Documentos permitem extrair campos e valores dos modelos treinados com seus dados, adaptados aos seus formulários e documentos. Crie modelos personalizados independentes ou combine dois ou mais modelos personalizados para criar um modelo composto para extrair dados de vários tipos de formulário. Comece com o recurso de modelos personalizados do estúdio. Use o assistente online, a interface de rotulagem, a etapa de treinamento e as visualizações para entender como o recurso funciona. Teste o modelo personalizado com seus documentos de exemplo e itere para melhorar o modelo. Consulte a Visão geral dos modelos personalizados para saber mais.

  • Modelos de classificação personalizados: a classificação de documentos é um novo cenário com suporte da Informação de Documentos. A API do classificador de documentos dá suporte a cenários de classificação e divisão. Treine um modelo de classificação para identificar os diferentes tipos de documentos aos quais seu aplicativo dá suporte. O arquivo de entrada para o modelo de classificação pode conter vários documentos e classifica cada documento dentro de um intervalo de páginas associado. Veja modelos de classificação personalizados para saber mais.

  • Recursos de complemento: a Informação de Documentos agora dá suporte a recursos de análise mais sofisticados. Esses recursos opcionais podem ser habilitados e desabilitados no estúdio usando o botão Analze Options em cada página de modelo. Há quatro recursos de complemento disponíveis: recursos de extração highResolution, fórmula, fonte e código de barras. Consulte Recursos de complemento para saber mais.

Próximas etapas