Modelo personalizado da Informação de Documentos

Artigo
10/16/2024

Importante

As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
A versão de visualização pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-07-31-preview.
Atualmente, a versão de visualização pública 2024-07-31-preview só está disponível nas regiões do Azure a seguir. Observe que o modelo generativo personalizado (extração de campos do documento) no Estúdio de IA está disponível somente na região Centro-Norte dos EUA:
- Leste dos EUA
- Oeste dos EUA 2
- Oeste da Europa
- Centro-Norte dos EUA

Esse conteúdo se aplica a: v4.0 (versão prévia) | Versões prévias: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Esse conteúdo se aplica a: v3.1 (GA) | Ultima versão: v4.0 (versão prévia) | Versões prévia: v3.0 v2.1

Esse conteúdo se aplica a: v3.0 (GA) | Ultimas versões: v4.0 (versão prévia) v3.1 | Versões prévia: v2.1

Esse conteúdo se aplica a: v2.1 | ais recente: v4.0 (versão prévia)

Modelos personalizados (anteriormente formulário personalizado) são modelos de documentos fáceis de treinar que extraem com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos usam indicações de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos personalizados compartilham o mesmo formato de rotulação e estratégia como modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Funcionalidades de modelo

Os modelos personalizados dão suporte a pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário	Marcas de seleção	Campos tabulares (Tabelas)	Assinatura	Regiões selecionadas	Campos sobrepostos
Com suporte	Compatível	Compatível	Compatível	Compatível	Incompatível

Campos tabulares

Com o lançamento das versões de API v3.0 e posteriores, os modelos do modelo personalizado adicionam suporte aos campos tabulares (tabelas) entre tabelas:

Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela entre as diferentes páginas da única tabela.
Como prática recomendada, verifique se o conjunto de dados contém exemplos das variações esperadas. Por exemplo, inclua casos em que a tabela inteira se encontra em apenas uma página e casos em que as tabelas abrangem duas ou mais páginas, se espera ver essas variações nos documentos.

Campos tabulares também são úteis ao extrair informações recorrentes de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção recorrente de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos dependem de um modelo visual definido e alterações no modelo resultam em precisão mais baixa. Nessas instâncias, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treinar um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como imagens e documentos PDF digitais, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

Formatos de arquivo com suporte:

Modelar	PDF	Imagem: J`PEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
Ler	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview ou anterior)
Documento geral	✔	✔
Predefinida	✔	✔
Personalizado	✔	✔

✱ Atualmente, não há suporte para arquivos do Microsoft Office para outros modelos ou versões.

Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto em 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

Treinando um modelo

Geralmente, os modelos dos modelos personalizados estão disponíveis a partir da API v2.0 e versões posteriores. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar	API REST	.	Modelos de rótulo e teste
Template personalizado	v3.1 API	SDK da Informação de Documentos	Estúdio da Informação de Documentos

Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode para treinar um modelo personalizado e definir o buildMode como template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos personalizados estão disponíveis para o público geral com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar	API REST	.	Modelos de rótulo e teste
Template personalizado	v3.1 API	SDK da Informação de Documentos	Estúdio da Informação de Documentos

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades com suporte

Confira nossa página de Suporte ao idioma – modelos personalizados, para obter uma lista completa dos idiomas com suporte.

Os modelos (templates) personalizados geralmente estão disponíveis com a API v2.1.

Modelar	API REST	.	Modelos de rótulo e teste
Modelo personalizado (template)	Informação de Documentos 2.1	SDK da Informação de Documentos	Ferramenta de Rotulagem de Exemplo da Informação de Documentos

Próximas etapas

Saiba como criar e compor modelos personalizados:

Criar um modelo personalizadoCompor modelos personalizados

Compartilhar via