Qual modelo devo escolher?

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
  • Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
  • Leste dos EUA
  • Oeste dos EUA 2
  • Oeste da Europa

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (disponibilidade geral)marca de seleção azulv3.0 (disponibilidade geral)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção roxav3.1

A Inteligência de Documentos da IA do Azure é compatível com uma ampla variedade de modelos que permitem adicionar processamento inteligente de documentos aos seus aplicativos e otimizar seus fluxos de trabalho. A seleção do modelo certo é essencial para garantir o sucesso da sua empresa. Nesse artigo, exploramos os modelos de Reconhecimento de Formulários disponíveis e fornecemos diretrizes sobre como escolher a melhor solução para seus projetos.

Os gráficos de decisão a seguir realçam os recursos de cada modelo compatíveis com o Reconhecimento de Formulários v3.0 e ajudam você a escolher o melhor modelo para atender às necessidades e requisitos do seu aplicativo.

Importante

Certifique-se de verificar a página Suporte de idiomas para obter informações sobre a extração de textos e campos de idiomas suportados por recurso.

Modelos de análise de documentos pré-treinados

Tipo de documento Exemplo Dados para extrair Sua melhor solução
Um documento genérico. Um contrato ou carta. Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados escritos ou impressos. Ler o modelo OCR
Um documento que inclui informações estruturais. Um relatório ou estudo. Além do texto escrito ou impresso, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. Modelo de análise de layout
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos (chaves) e valores. Um formulário ou documento que é um formato padronizado comumente usado em sua empresa ou setor, como um aplicativo de crédito ou pesquisa. Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. **Modelo de análise de layout com o parâmetro features=keyValuePairs de cadeia de caracteres de consulta opcional habilitado **

Modelos pré-treinados específicos do cenário

Tipo de documento Dados para extrair Sua melhor solução
Formulário W-2 dos impostos dos EUA Você quer extrair informações importantes, como salário, remunerações e impostos retidos. Modelo W-2 dos impostos dos EUA
Formulário 1098 de impostos dos EUA Você quer extrair os detalhes dos juros hipotecários, como diretor, pontos e impostos. Modelo 1098 de impostos dos EUA
Formulário 1098-E dos EUA Você quer extrair os detalhes dos juros do empréstimo estudantil, como credor e valor dos juros. Modelo 1098-E de impostos dos EUA
Formulário 1098T de impostos dos EUA Você deseja extrair detalhes de mensalidades qualificadas, como ajustes de bolsa de estudos, status do aluno e informações do credor. Modelo de imposto dos EUA 1098-T
Formulário de Imposto dos EUA 1099 (Variações) Você deseja extrair informações dos formulários 1099 e suas variações (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Modelo de imposto dos EUA 1099
Formulário de Imposto dos EUA 1040 (Variações) Você deseja extrair informações dos formulários 1040, e suas variações (Agenda 1, Agenda 2, Agenda 3, Agenda 8812, Agenda A e Agenda B, Agenda C, Agenda D, Agenda E, Agenda EIC, Agenda, F, Agenda H, Agenda J, Agenda R, Agenda ES, Agenda Sênior). Modelo de imposto dos EUA 1040
Contrato (contrato legal entre partes). Você deseja extrair detalhes do contrato, como partes, datas e intervalos. Modelo de contrato
Cartão do seguro de saúde ou ID do seguro de saúde. Você deseja extrair informações importantes, como seguradora, ID de membro, cobertura de prescrição e número do grupo. Número do cartão do plano de saúde
Cartão de crédito/débito . Você deseja extrair cartões bancários de informações importantes, como número do cartão e nome do banco. Modelo de cartão de crédito/débito
Certidão de casamento . Você deseja extrair informações importantes das certidões de casamento. Modelo de certificado de casamento
Fatura ou demonstrativo de cobrança. Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido. Modelo de fatura
Recibo, voucher ou recibo de hotel de página única. Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações. Modelo de recibo
Documento de identidade (ID) como uma carteira de motorista dos EUA ou passaporte internacional. Você deseja extrair informações importantes, como nome, sobrenome, data de nascimento, endereço e assinatura. Modelo de documento de ID (identidade)
Financiamento EUA 1003 . Você deseja extrair informações importantes do aplicativo de empréstimo residencial uniforme. Modelo de formulário 1003
Financiamento dos EUA 1008 . Você deseja extrair informações importantes do resumo de Subscrição Uniforme e Transmissão. Modelo de formulário 1008
Divulgação de fechamento hipotecas dos EUA . Você deseja extrair informações importantes de um formulário de divulgação de fechamento de hipotecas. Modelo de formulário de Divulgação de fechamento de hipotecas
Documentos de tipo misto com elementos estruturados, semiestruturados e/ou não estruturados. Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Modelo personalizado

Dica

  • Se você ainda não tiver certeza de qual modelo pré-treinado usar, experimente o modelo de layout com o parâmetro features=keyValuePairs de cadeia de caracteres de consulta opcional habilitado.
  • O modelo de layout é alimentado pelo mecanismo OCR de Leitura para detectar páginas, tabelas, estilos, texto, linhas, palavras, locais e idiomas.

Modelos de extração personalizados

Conjunto de treinamento Documentos de exemplo Sua melhor solução
Documentos estruturados, consistentes e com um layout estático. Formulários estruturados, como questionários ou aplicativos. Modelo de template personalizado
Documentos estruturados, semiestruturados e não estruturados. ● Estruturados → pesquisas
● Semiestruturados → faturas
● Não estruturados → cartas
Modelo neural personalizado
Uma coleção de vários modelos treinados em documentos de tipo semelhante. ● Ordens de compra de fornecedores
● Ordens de compra de equipamentos
● Ordens de compra de móveis
Tudo composto em um único modelo.
Modelo personalizado composto

Modelo de classificação personalizada

Conjunto de treinamento Documentos de exemplo Sua melhor solução
Pelo menos dois tipos diferentes de documentos. Formulários, cartas ou documentos Modelo de classificação personalizada

Próximas etapas