Partilhar via


Modelo de modelo personalizado do Document Intelligence

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
  • A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
    • E.U.A. Leste
    • Oeste dos EUA2
    • Europa Ocidental
    • Centro-Norte dos EUA

Este conteúdo aplica-se a: marca de verificação v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.1 (GA) Marca de verificação azul v3.0 (GA) Marca de verificação azul v2.1 (GA)

Este conteúdo aplica-se a: marca de verificação v3.1 (GA) | Última versão:marca de verificação roxa v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.0Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v3.0 (GA) | Últimas versões: marca de verificação roxa v4.0 (preview) marca de verificação roxav3.1 | Versão anterior: Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v2.1 | Última versão: Marca de verificação azul v4.0 (pré-visualização)

Modelo personalizado (anteriormente formulário personalizado) é um modelo de documento fácil de treinar que extrai com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos de modelo usam pistas de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos de modelo personalizados compartilham o mesmo formato e estratégia de rotulagem que os modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Capacidades do modelo

Os modelos de modelo personalizados suportam pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário Marcas de seleção Campos tabulares (Tabelas) Assinatura Regiões selecionadas Campos sobrepostos
Suportado Suportado Suportado Suportado Suportado Não suportado

Campos tabulares

Com o lançamento das versões da API v3.0 e posteriores, os modelos de modelo personalizados adicionam suporte para campos tabulares entre páginas (tabelas):

  • Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela nas diferentes páginas em uma única tabela.
  • Como prática recomendada, certifique-se de que seu conjunto de dados contenha algumas amostras das variações esperadas. Por exemplo, inclua exemplos em que a tabela inteira está em uma única página e em que as tabelas abrangem duas ou mais páginas, se você espera ver essas variações nos documentos.

Os campos tabulares também são úteis ao extrair informações repetidas dentro de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção repetitiva de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos de modelo dependem de um modelo visual definido, as alterações no modelo resultam em menor precisão. Nesses casos, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treine um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como documentos PDF digitais e imagens, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lida
    Esquema ✔ (2024-02-29-preview, 2023-10-31-preview ou posterior)
    Documento Geral
    Pré-criado
    Personalizado

    ✱ Os ficheiros do Microsoft Office não são atualmente suportados para outros modelos ou versões.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a um texto de cerca 8de -ponto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

  • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.

  • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Formar um modelo

Os modelos de modelo personalizados estão geralmente disponíveis a partir da API v2.0 e versões posteriores. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado API v3.1 SDK de Inteligência Documental Estúdio de Inteligência de Documentação

Com as APIs v3.0 e posteriores, a operação de compilação para treinar o modelo suporta uma nova buildMode propriedade, para treinar um modelo de modelo personalizado, defina como buildMode template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos de modelo personalizados estão geralmente disponíveis com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado API v3.1 SDK de Inteligência Documental Estúdio de Inteligência de Documentação

Com as APIs v3.0 e posteriores, a operação de compilação para treinar o modelo suporta uma nova buildMode propriedade, para treinar um modelo de modelo personalizado, defina como buildMode template.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos personalizados para obter uma lista completa dos idiomas suportados.

Os modelos personalizados (modelo) estão geralmente disponíveis com a API v2.1.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado (modelo) Inteligência Documental 2.1 SDK de Inteligência Documental Document Intelligence Ferramenta de etiquetagem de exemplo

Próximos passos

Aprenda a criar e compor modelos personalizados: