Modelo personalizado da Informação de Documentos
Importante
- As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
- Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
- A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
- Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
- Leste dos EUA
- Oeste dos EUA 2
- Oeste da Europa
Este conteúdo se aplica a: v4.0 (versão prévia) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este conteúdo se aplica a: v3.1 (GA) | Última versão: v4.0 (versão prévia) | Versões anteriores: v3.0 v2.1
Este conteúdo se aplica a: v3.0 (GA) | Últimas versões: v4.0 (versão prévia) v3.1 | Versão anterior: v2.1
Este conteúdo se aplica a: v2.1 | Última versão: v4.0 (versão prévia)
Modelos personalizados (anteriormente formulário personalizado) são modelos de documentos fáceis de treinar que extraem com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos usam indicações de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.
Os modelos personalizados compartilham o mesmo formato de rotulação e estratégia como modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.
Funcionalidades de modelo
Os modelos personalizados dão suporte a pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.
Campos de formulário | Marcas de seleção | Campos tabulares (Tabelas) | Assinatura | Regiões selecionadas |
---|---|---|---|---|
Com suporte | Compatível | Compatível | Compatível | Com suporte |
Campos tabulares
Com o lançamento da versão 2022-06-30-preview da API, os modelos personalizados adicionarão suporte para campos tabulares (tabelas) entre páginas:
- Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela entre as diferentes páginas da única tabela.
- Como prática recomendada, verifique se o conjunto de dados contém exemplos das variações esperadas. Por exemplo, inclua casos em que a tabela inteira se encontra em apenas uma página e casos em que as tabelas abrangem duas ou mais páginas, se espera ver essas variações nos documentos.
Campos tabulares também são úteis ao extrair informações recorrentes de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção recorrente de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.
Lidar com variações
Os modelos dependem de um modelo visual definido e alterações no modelo resultam em precisão mais baixa. Nessas instâncias, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treinar um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como imagens e documentos PDF digitais, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.
Requisitos de entrada
Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Formatos de arquivo com suporte:
Modelar PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview ou anterior) Documento geral ✔ ✔ Predefinida ✔ ✔ Personalizado ✔ ✔ ✱ Atualmente, não há suporte para arquivos do Microsoft Office para outros modelos ou versões.
Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de
8
pontos a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é
1GB
com no máximo 10.000 páginas.
Treinando um modelo
Os modelos personalizados estão disponíveis para o público geral com a API v4.0. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.
Modelar | API REST | . | Modelos de rótulo e teste |
---|---|---|---|
Template personalizado | v3.1 API | SDK da Informação de Documentos | Estúdio da Informação de Documentos |
Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode
para treinar um modelo personalizado e definir o buildMode
como template
.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Os modelos personalizados estão disponíveis para o público geral com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.
Modelar | API REST | . | Modelos de rótulo e teste |
---|---|---|---|
Template personalizado | v3.1 API | SDK da Informação de Documentos | Estúdio da Informação de Documentos |
Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode
para treinar um modelo personalizado e definir o buildMode
como template
.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Idiomas e localidades com suporte
Confira nossa página de Suporte ao idioma – modelos personalizados, para obter uma lista completa dos idiomas com suporte.
Os modelos (templates) personalizados geralmente estão disponíveis com a API v2.1.
Modelar | API REST | . | Modelos de rótulo e teste |
---|---|---|---|
Modelo personalizado (template) | Informação de Documentos 2.1 | SDK da Informação de Documentos | Ferramenta de Rotulagem de Exemplo da Informação de Documentos |
Próximas etapas
Saiba como criar e compor modelos personalizados:
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de