Partilhar via


Estúdio de Inteligência de Documentação

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
  • A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
  • E.U.A. Leste
  • Oeste dos EUA2
  • Europa Ocidental

Este conteúdo aplica-se a:marca de verificação v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.1 (GA)Marca de verificação azul v3.0 (GA)

Este conteúdo aplica-se a: marca de verificação v3.1 (GA) | Última versão: marca de verificação roxav4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.0

Este conteúdo aplica-se a: marca de verificação v3.0 (GA) | Últimas versões: marca de verificação roxa v4.0 (pré-visualização)marca de verificação roxa v3.1

Importante

O Document Intelligence Studio é uma ferramenta online para explorar, compreender e integrar visualmente recursos do serviço Document Intelligence em seus aplicativos. Use o Document Intelligence Studio para:

  • Saiba mais sobre os diferentes recursos do Document Intelligence.
  • Use seu recurso Document Intelligence para testar modelos em documentos de amostra ou carregar seus próprios documentos.
  • Experimente diferentes funcionalidades adicionais e de pré-visualização para adaptar a saída às suas necessidades.
  • Treine modelos de classificação personalizados para classificar documentos.
  • Treine modelos de extração personalizados para extrair campos de documentos.
  • Obtenha um código de exemplo para o idioma específico SDKs para integrar em seus aplicativos.

Use o Guia de início rápido do Document Intelligence Studio para começar a analisar documentos com análise de documentos ou modelos pré-construídos. Crie modelos personalizados e faça referência aos modelos em seus aplicativos usando um dos tipos específicos SDKs de linguagem e outros inícios rápidos.

Introdução

Se você estiver visitando o Studio pela primeira vez, siga o guia de introdução para configurar o Studio para uso.

Analisar opções

  • O Document Intelligence suporta recursos sofisticados de análise. O Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos do complemento com facilidade.

  • Dependendo do cenário de extração de documentos, configure o intervalo de análise, o intervalo de páginas do documento, a deteção opcional e os recursos de deteção premium.

    Captura de tela da janela de diálogo de opções de análise.

    Nota

    A extração de fontes não é visualizada no Document Intelligence Studio. No entanto, você pode verificar a seção de estilos da saída JSON para obter os resultados da deteção de fontes.

✔️ Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou seus modelos treinados.

    Captura de tela animada mostrando a etiquetagem automática no Studio.

  • Para alguns documentos, é possível duplicar etiquetas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

    Captura de ecrã a mostrar aviso de etiqueta duplicada após etiquetagem automática.

✔️ Tabelas de etiquetagem automática

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

    Captura de tela animada mostrando a etiquetagem automática da tabela no Studio.

✔️ Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento

  • Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

  • Se uma pontuação de confiança baixa for retornada para alguns rótulos, verifique se eles estão rotulados corretamente. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.

Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados

  • Use a página de rotulagem de modelo de extração personalizada para navegar pelos documentos de treinamento com facilidade, usando o recurso de pesquisa, filtro e classificação por recurso.

  • Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.

    Captura de ecrã das opções e filtros da vista de lista de documentos.

✔️ Partilha de projetos

Suporte ao modelo de Document Intelligence

  • Leia: experimente o recurso Leitura do Document Intelligence para extrair linhas de texto, palavras, idiomas detetados e estilo manuscrito, se detetado. Comece com o recurso Studio Read. Explore com exemplos de documentos e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Consulte a Visão geral de Leitura para saber mais e começar a usar o Guia de início rápido do Python SDK para Layout.

  • Layout: experimente o recurso Layout do Document Intelligence para extrair texto, tabelas, marcas de seleção e informações de estrutura. Comece com o recurso Layout do Studio. Explore com exemplos de documentos e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Consulte a Visão geral do layout para saber mais e começar a usar o início rápido do Python SDK para layout.

  • Modelos pré-construídos: os modelos pré-construídos do Document Intelligence permitem que você adicione processamento inteligente de documentos aos seus aplicativos e fluxos sem ter que treinar e construir seus próprios modelos. Como exemplo, comece com o recurso Fatura do Studio. Explore com exemplos de documentos e seus documentos. Use a visualização interativa, a lista de campos extraídos e a saída JSON para entender como o recurso funciona. Consulte a visão geral de Modelos para saber mais e começar a usar o início rápido do Python SDK para fatura pré-construída.

  • Modelos de extração personalizados: os modelos personalizados do Document Intelligence permitem extrair campos e valores de modelos treinados com seus dados, adaptados aos seus formulários e documentos. Para extrair dados de vários tipos de formulário, crie modelos personalizados autônomos ou combine dois ou mais modelos personalizados e crie um modelo composto. Comece com o recurso de modelos personalizados do Studio. Use o assistente de ajuda, a interface de rotulagem, a etapa de treinamento e as visualizações para entender como o recurso funciona. Teste o modelo personalizado com seus documentos de exemplo e itere para melhorar o modelo. Para saber mais, consulte a Visão geral de modelos personalizados para saber mais.

  • Modelos de classificação personalizados: A classificação de documentos é um novo cenário suportado pelo Document Intelligence. a API do classificador de documentos suporta cenários de classificação e divisão. Treine um modelo de classificação para identificar os diferentes tipos de documentos suportados pelo seu aplicativo. O arquivo de entrada para o modelo de classificação pode conter vários documentos e classifica cada documento dentro de um intervalo de páginas associado. Para saber mais, consulte Modelos de classificação personalizados.

  • Recursos complementares: o Document Intelligence agora suporta recursos de análise mais sofisticados. Esses recursos opcionais podem ser ativados e desativados no estúdio usando o botão em cada página do Analze Options modelo. Há quatro recursos adicionais disponíveis: highResolution, fórmula, fonte e recursos de extração de código de barras. Para saber mais, consulte Recursos complementares.

Próximos passos