Que modelo devo escolher?

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
  • A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
  • E.U.A. Leste
  • Oeste dos EUA2
  • Europa Ocidental

Este conteúdo aplica-se a:marca de verificaçãov4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.1 (GA)Marca de verificação azulv3.0 (GA)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.0

Este conteúdo aplica-se a:marca de verificaçãov3.0 (GA) | Últimas versões:marca de verificação roxav4.0 (visualização)marca de verificação roxav3.1

O Azure AI Document Intelligence dá suporte a uma ampla variedade de modelos que permitem adicionar processamento inteligente de documentos aos seus aplicativos e otimizar seus fluxos de trabalho. Selecionar o modelo certo é essencial para garantir o sucesso do seu empreendimento. Neste artigo, exploramos os modelos de Document Intelligence disponíveis e fornecemos orientações sobre como escolher a melhor solução para os seus projetos.

Os gráficos de decisão a seguir destacam os recursos de cada modelo suportado pelo Document Intelligence v3.0 e ajudam você a escolher o melhor modelo para atender às necessidades e requisitos de seu aplicativo.

Importante

Certifique-se de verificar a página de suporte de idiomas para texto de idioma suportado e extração de campo por recurso.

Modelos de análise de documentos pré-treinados

Document type Exemplo Dados a extrair A sua melhor solução
Um documento genérico. Um contrato ou carta. Você deseja extrair principalmente linhas de texto escritas ou impressas, palavras, locais e idiomas detetados. Ler modelo OCR
Um documento que inclui informações estruturais. Um relatório ou estudo. Além do texto escrito ou impresso, você precisa extrair informações estruturais, como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. Modelo de análise de layout
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos (chaves) e valores. Um formulário ou documento que é um formato padronizado comumente usado em sua empresa ou setor, como um pedido de crédito ou pesquisa. Você deseja extrair campos e valores, incluindo aqueles não cobertos pelos modelos pré-construídos específicos do cenário, sem ter que treinar um modelo personalizado. **Modelo de análise de layout com o parâmetro features=keyValuePairs opcional de cadeia de caracteres de consulta ativado **

Modelos específicos de cenários pré-treinados

Document type Dados a extrair A sua melhor solução
Formulário de imposto W-2 dos EUA Você deseja extrair informações importantes, como salário, salários e impostos retidos. Modelo W-2 fiscal dos EUA
Formulário US Tax 1098 Você deseja extrair detalhes de juros de hipoteca, como principal, pontos e impostos. Imposto dos EUA modelo 1098
Formulário US Tax 1098-E Você deseja extrair detalhes de juros de empréstimos estudantis, como credor e valor de juros. Imposto dos EUA modelo 1098-E
Formulário US Tax 1098T Você deseja extrair detalhes de matrícula qualificados, como ajustes de bolsa, status de estudante e informações de credor. Imposto dos EUA modelo 1098-T
Formulário US Tax 1099(Variações) Você deseja extrair informações de 1099 formulários e suas variações (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Imposto dos EUA modelo 1099
Formulário US Tax 1040(Variações) Você deseja extrair informações de 1040 formulários e suas variações (Cronograma 1, Cronograma 2, Cronograma 3, Cronograma 8812, Cronograma A, Cronograma B, Cronograma C, Cronograma D, Cronograma E, Cronograma EIC, Cronograma F, Cronograma H, Cronograma J, Cronograma R, Cronograma SE, Cronograma Sênior). Imposto dos EUA modelo 1040
Contrato (acordo legal entre as partes). Você deseja extrair detalhes do contrato como partes, datas e intervalos. Modelo de contrato
Cartão de seguro de saúde ou ID de seguro de saúde. Você deseja extrair informações importantes, como seguradora, ID de membro, cobertura de prescrição e número do grupo. Modelo de cartão de seguro de saúde
Cartão de crédito/débito . Você deseja extrair informações importantes dos cartões bancários, como número do cartão e nome do banco. Modelo de cartão de crédito/débito
Certidão de Casamento . Você deseja extrair informações importantes das certidões de casamento. Modelo de certidão de casamento
Fatura ou extrato de faturação. Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido. Modelo de fatura
Recibo, voucher ou recibo de hotel de página única. Você deseja extrair informações importantes, como nome do comerciante, data da transação e total da transação. Modelo de recibo
Documento de identidade (ID), como uma carteira de motorista dos EUA ou passaporte internacional. Você deseja extrair informações importantes, como nome, sobrenome, data de nascimento, endereço e assinatura. Modelo de documento de identidade (ID)
Hipoteca dos EUA 1003 . Pretende extrair informação fundamental do pedido de empréstimo Uniform Housing. Modelo de formulário 1003
Hipoteca dos EUA 1008 . Você deseja extrair informações importantes do resumo de Subscrição Uniforme e Transmissão. Modelo de formulário 1008
Divulgação de Fechamento de Hipoteca dos EUA . Você deseja extrair informações importantes de um formulário de divulgação de fechamento de hipoteca. Modelo de formulário de divulgação de fechamento de hipoteca
Documento(s) de tipo misto com elementos estruturados, semi-estruturados e/ou não estruturados. Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documentos gerais ou pré-construídos. Modelo personalizado

Gorjeta

  • Se você ainda não tiver certeza de qual modelo pré-treinado usar, tente o modelo de layout com o parâmetro features=keyValuePairs opcional de cadeia de caracteres de consulta habilitado.
  • O modelo de layout é alimentado pelo mecanismo de leitura OCR para detetar páginas, tabelas, estilos, texto, linhas, palavras, locais e idiomas.

Modelos de extração personalizados

Conjunto de formação Exemplos de documentos A sua melhor solução
Documentos estruturados, consistentes, com um layout estático. Formulários estruturados, tais como questionários ou candidaturas. Modelo de modelo personalizado
Documentos estruturados, semi-estruturados e não estruturados. ● Pesquisas de → estruturadas● Faturas de → semiestruturadas
● Cartas → não estruturadas
Modelo neural personalizado
Uma coleção de vários modelos, cada um treinado em documentos de tipo semelhante. ● Ordens de compra
de fornecimento● Ordens
de compra de equipamentos● Ordens
de compra de móveis Todas compostas em um único modelo.
Modelo personalizado composto

Modelo de classificação personalizado

Conjunto de formação Exemplos de documentos A sua melhor solução
Pelo menos dois tipos diferentes de documentos. Formulários, cartas ou documentos Modelo de classificação personalizado

Próximos passos