Modelo de contrato de Inteligência Documental

Artigo
05/23/2024

Importante

As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
E.U.A. Leste
Oeste dos EUA2
Europa Ocidental

Este conteúdo aplica-se a:v4.0 (preview) | Versão anterior:v3.1 (GA)

Este conteúdo aplica-se a:v3.1 (GA) | Última versão:v4.0 (visualização)

O modelo de contrato de Inteligência Documental usa poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) para analisar e extrair campos-chave e itens de linha de um grupo selecionado de entidades contratuais importantes. Os contratos podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como Partes, Jurisdições, ID do Contrato e Título; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos de documentos em inglês.

Tratamento automatizado de contratos

O processamento automatizado de contratos é o processo de extração de campos-chave do contrato a partir de documentos. Historicamente, o processo de análise de contratos é realizado manualmente e, portanto, muito demorado. A extração precisa de dados-chave de contratos é normalmente a primeira e uma das etapas mais críticas no processo de automação de contratos.

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-02-29-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de contrato	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	contrato pré-construído

O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de contrato	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	contrato pré-construído

O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de contrato	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	contrato pré-construído

Requisitos de entrada

Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

Formatos de ficheiro suportados:

Modelo	PDF	Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
Lida	✔	✔	✔
Esquema	✔	✔	✔ (2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
Documento Geral	✔	✔
Pré-criado	✔	✔
Extração personalizada	✔	✔
Classificação personalizada	✔	✔	✔ (2024-02-29-pré-visualização)

Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca 8de -ponto a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.
- Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Experimente a extração de dados de documentos de contrato

Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos dos contratos. Você precisa dos seguintes recursos:

Uma assinatura do Azure — você pode criar uma gratuitamente.
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Estúdio de Inteligência de Documentação

Na página inicial do Document Intelligence Studio, selecione Documentos fiscais.
Você pode analisar os documentos fiscais de exemplo ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

Experimente o Document Intelligence Studio

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.

Extração de campo

A seguir estão os campos extraídos de um contrato na resposta de saída JSON.

Nome	Tipo	Description	Exemplo de saída
Título	String	Título do contrato	Contrato de serviço
ContractId	String	Título do contrato	AB12956
Festas	Matriz	Lista de partes legais
Data de execução	Date	Data em que o acordo foi integralmente assinado e acordado por todas as partes	`On this twenty-third day of February two thousand and twenty two`
Data de validade	Date	Data em que o contrato termina para entrar em vigor	Um ano
Data de Renovação	Date	Data em que o contrato necessita de ser renovado	`On this twenty-third day of February two thousand and twenty two`
Jurisdições	Matriz	Lista de jurisdições

Os pares chave-valor do contrato e os itens de linha extraídos estão na documentResults seção da saída JSON.

Próximos passos

Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Partilhar via