Partilhar via


Modelo de modelo personalizado do Document Intelligence

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
  • A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
  • E.U.A. Leste
  • Oeste dos EUA2
  • Europa Ocidental

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização) | Versões anteriores:Marca de verificação azulv3.1 (GA)Marca de verificação azulv3.0 (GA)Marca de verificação azulv2.1 (GA)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.0Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov3.0 (GA) | Últimas versões:marca de verificação roxav4.0 (preview)marca de verificação roxav3.1 | Versão anterior:Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov2.1 | Última versão:Marca de verificação azulv4.0 (pré-visualização)

Modelo personalizado (anteriormente formulário personalizado) é um modelo de documento fácil de treinar que extrai com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos de modelo usam pistas de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos de modelo personalizados compartilham o mesmo formato e estratégia de rotulagem que os modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Capacidades do modelo

Os modelos de modelo personalizados suportam pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário Marcas de seleção Campos tabulares (Tabelas) Assinatura Regiões selecionadas
Suportado Suportado Suportado Suportado Suportado

Campos tabulares

Com o lançamento das versões de API 2022-06-30-preview e posteriores, os modelos de modelo personalizados adicionarão suporte para campos tabulares entre páginas (tabelas):

  • Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela nas diferentes páginas em uma única tabela.
  • Como prática recomendada, certifique-se de que seu conjunto de dados contenha algumas amostras das variações esperadas. Por exemplo, inclua exemplos em que a tabela inteira está em uma única página e em que as tabelas abrangem duas ou mais páginas, se você espera ver essas variações nos documentos.

Os campos tabulares também são úteis ao extrair informações repetidas dentro de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção repetitiva de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos de modelo dependem de um modelo visual definido, as alterações no modelo resultam em menor precisão. Nesses casos, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treine um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como documentos PDF digitais e imagens, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lida
    Esquema ✔ (2024-02-29-preview, 2023-10-31-preview ou posterior)
    Documento Geral
    Pré-criado
    Personalizado

    ✱ Os ficheiros do Microsoft Office não são atualmente suportados para outros modelos ou versões.

  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca 8de -ponto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

  • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.

  • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Formar um modelo

Os modelos de modelo personalizados estão geralmente disponíveis com a API v4.0. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado API v3.1 SDK de Inteligência Documental Estúdio de Inteligência de Documentação

Com as APIs v3.0 e posteriores, a operação de compilação para treinar o modelo suporta uma nova buildMode propriedade, para treinar um modelo de modelo personalizado, defina como buildModetemplate.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos de modelo personalizados estão geralmente disponíveis com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou v3.0 com o Document Intelligence Studio para treinar um modelo de modelo personalizado.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado API v3.1 SDK de Inteligência Documental Estúdio de Inteligência de Documentação

Com as APIs v3.0 e posteriores, a operação de compilação para treinar o modelo suporta uma nova buildMode propriedade, para treinar um modelo de modelo personalizado, defina como buildModetemplate.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos personalizados para obter uma lista completa dos idiomas suportados.

Os modelos personalizados (modelo) estão geralmente disponíveis com a API v2.1.

Modelo API REST SDK Modelos de etiquetas e testes
Modelo personalizado (modelo) Inteligência Documental 2.1 SDK de Inteligência Documental Document Intelligence Ferramenta de etiquetagem de exemplo

Próximos passos

Aprenda a criar e compor modelos personalizados: