Modelo personalizado da Informação de Documentos

Artigo
05/23/2024

Importante

As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
Leste dos EUA
Oeste dos EUA 2
Oeste da Europa

Este conteúdo se aplica a: v4.0 (versão prévia) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Este conteúdo se aplica a: v3.1 (GA) | Última versão: v4.0 (versão prévia) | Versões anteriores: v3.0 v2.1

Este conteúdo se aplica a: v3.0 (GA) | Últimas versões: v4.0 (versão prévia) v3.1 | Versão anterior: v2.1

Este conteúdo se aplica a: v2.1 | Última versão: v4.0 (versão prévia)

Modelos personalizados (anteriormente formulário personalizado) são modelos de documentos fáceis de treinar que extraem com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos usam indicações de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos personalizados compartilham o mesmo formato de rotulação e estratégia como modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Funcionalidades de modelo

Os modelos personalizados dão suporte a pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário	Marcas de seleção	Campos tabulares (Tabelas)	Assinatura	Regiões selecionadas
Com suporte	Compatível	Compatível	Compatível	Com suporte

Campos tabulares

Com o lançamento da versão 2022-06-30-preview da API, os modelos personalizados adicionarão suporte para campos tabulares (tabelas) entre páginas:

Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela entre as diferentes páginas da única tabela.
Como prática recomendada, verifique se o conjunto de dados contém exemplos das variações esperadas. Por exemplo, inclua casos em que a tabela inteira se encontra em apenas uma página e casos em que as tabelas abrangem duas ou mais páginas, se espera ver essas variações nos documentos.

Campos tabulares também são úteis ao extrair informações recorrentes de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção recorrente de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos dependem de um modelo visual definido e alterações no modelo resultam em precisão mais baixa. Nessas instâncias, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treinar um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como imagens e documentos PDF digitais, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

Formatos de arquivo com suporte:

Modelar	PDF	Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
Ler	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview ou anterior)
Documento geral	✔	✔
Predefinida	✔	✔
Personalizado	✔	✔

✱ Atualmente, não há suporte para arquivos do Microsoft Office para outros modelos ou versões.

Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

Treinando um modelo

Os modelos personalizados estão disponíveis para o público geral com a API v4.0. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar	API REST	.	Modelos de rótulo e teste
Template personalizado	v3.1 API	SDK da Informação de Documentos	Estúdio da Informação de Documentos

Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode para treinar um modelo personalizado e definir o buildMode como template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos personalizados estão disponíveis para o público geral com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar	API REST	.	Modelos de rótulo e teste
Template personalizado	v3.1 API	SDK da Informação de Documentos	Estúdio da Informação de Documentos

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades com suporte

Confira nossa página de Suporte ao idioma – modelos personalizados, para obter uma lista completa dos idiomas com suporte.

Os modelos (templates) personalizados geralmente estão disponíveis com a API v2.1.

Modelar	API REST	.	Modelos de rótulo e teste
Modelo personalizado (template)	Informação de Documentos 2.1	SDK da Informação de Documentos	Ferramenta de Rotulagem de Exemplo da Informação de Documentos

Próximas etapas

Saiba como criar e compor modelos personalizados:

Criar um modelo personalizadoCompor modelos personalizados

Compartilhar via