Modelo de modelo personalizado do Document Intelligence

Artigo
10/16/2024

Importante

As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
- Centro-Norte dos EUA

Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1

Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1

Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)

Modelo personalizado (anteriormente formulário personalizado) é um modelo de documento fácil de treinar que extrai com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos de modelo usam pistas de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos de modelo personalizados compartilham o mesmo formato e estratégia de rotulagem que os modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Capacidades do modelo

Os modelos de modelo personalizados suportam pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário	Marcas de seleção	Campos tabulares (Tabelas)	Assinatura	Regiões selecionadas	Campos sobrepostos
Suportado	Suportado	Suportado	Suportado	Suportado	Não suportado

Campos tabulares

Com o lançamento das versões da API v3.0 e posteriores, os modelos de modelo personalizados adicionam suporte para campos tabulares entre páginas (tabelas):

Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela nas diferentes páginas em uma única tabela.
Como prática recomendada, certifique-se de que seu conjunto de dados contenha algumas amostras das variações esperadas. Por exemplo, inclua exemplos em que a tabela inteira está em uma única página e em que as tabelas abrangem duas ou mais páginas, se você espera ver essas variações nos documentos.

Os campos tabulares também são úteis ao extrair informações repetidas dentro de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção repetitiva de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos de modelo dependem de um modelo visual definido, as alterações no modelo resultam em menor precisão. Nesses casos, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treine um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como documentos PDF digitais e imagens, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

Formatos de ficheiro suportados:

Modelo	PDF	Imagem: J`PEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
Lida	✔	✔	✔
Esquema	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview ou posterior)
Documento Geral	✔	✔
Pré-criado	✔	✔
Personalizado	✔	✔

✱ Os ficheiros do Microsoft Office não são atualmente suportados para outros modelos ou versões.

Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a um texto de cerca 8de -ponto a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Formar um modelo

Os modelos de modelo personalizados estão geralmente disponíveis a partir da API v2.0 e versões posteriores. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo	API REST	SDK	Modelos de etiquetas e testes
Modelo personalizado	API v3.1	SDK de Inteligência Documental	Estúdio de Inteligência de Documentação

Com as APIs v3.0 e posteriores, a operação de compilação para treinar o modelo suporta uma nova buildMode propriedade, para treinar um modelo de modelo personalizado, defina como buildMode template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos de modelo personalizados estão geralmente disponíveis com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo	API REST	SDK	Modelos de etiquetas e testes
Modelo personalizado	API v3.1	SDK de Inteligência Documental	Estúdio de Inteligência de Documentação

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos personalizados para obter uma lista completa dos idiomas suportados.

Os modelos personalizados (modelo) estão geralmente disponíveis com a API v2.1.

Modelo	API REST	SDK	Modelos de etiquetas e testes
Modelo personalizado (modelo)	Inteligência Documental 2.1	SDK de Inteligência Documental	Document Intelligence Ferramenta de etiquetagem de exemplo

Próximos passos

Aprenda a criar e compor modelos personalizados:

Criar um modelopersonalizado Compor modelos personalizados

Partilhar via