Qual modelo devo escolher?
Importante
- As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
- Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
- A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
- Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
- Leste dos EUA
- Oeste dos EUA 2
- Oeste da Europa
Este conteúdo se aplica a: v4.0 (versão prévia) | Versões anteriores: v3.1 (GA) v3.0 (GA)
Este conteúdo se aplica a: v3.1 (GA) | Versão mais recente: v4.0 (versão prévia) | Versões anteriores: v3.0
Este conteúdo se aplica a: v3.0 (GA) | Versões mais recentes: v4.0 (versão prévia) v3.1
A Inteligência de Documentos da IA do Azure é compatível com uma ampla variedade de modelos que permitem adicionar processamento inteligente de documentos aos seus aplicativos e otimizar seus fluxos de trabalho. A seleção do modelo certo é essencial para garantir o sucesso da sua empresa. Nesse artigo, exploramos os modelos de Reconhecimento de Formulários disponíveis e fornecemos diretrizes sobre como escolher a melhor solução para seus projetos.
Os gráficos de decisão a seguir realçam os recursos de cada modelo compatíveis com o Reconhecimento de Formulários v3.0 e ajudam você a escolher o melhor modelo para atender às necessidades e requisitos do seu aplicativo.
Importante
Certifique-se de verificar a página Suporte de idiomas para obter informações sobre a extração de textos e campos de idiomas suportados por recurso.
Modelos de análise de documentos pré-treinados
Tipo de documento | Exemplo | Dados para extrair | Sua melhor solução |
---|---|---|---|
Um documento genérico. | Um contrato ou carta. | Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados escritos ou impressos. | Ler o modelo OCR |
Um documento que inclui informações estruturais. | Um relatório ou estudo. | Além do texto escrito ou impresso, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. | Modelo de análise de layout |
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos (chaves) e valores. | Um formulário ou documento que é um formato padronizado comumente usado em sua empresa ou setor, como um aplicativo de crédito ou pesquisa. | Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. | **Modelo de análise de layout com o parâmetro features=keyValuePairs de cadeia de caracteres de consulta opcional habilitado ** |
Modelos pré-treinados específicos do cenário
Tipo de documento | Dados para extrair | Sua melhor solução |
---|---|---|
Formulário W-2 dos impostos dos EUA | Você quer extrair informações importantes, como salário, remunerações e impostos retidos. | Modelo W-2 dos impostos dos EUA |
Formulário 1098 de impostos dos EUA | Você quer extrair os detalhes dos juros hipotecários, como diretor, pontos e impostos. | Modelo 1098 de impostos dos EUA |
Formulário 1098-E dos EUA | Você quer extrair os detalhes dos juros do empréstimo estudantil, como credor e valor dos juros. | Modelo 1098-E de impostos dos EUA |
Formulário 1098T de impostos dos EUA | Você deseja extrair detalhes de mensalidades qualificadas, como ajustes de bolsa de estudos, status do aluno e informações do credor. | Modelo de imposto dos EUA 1098-T |
Formulário de Imposto dos EUA 1099 (Variações) | Você deseja extrair informações dos formulários 1099 e suas variações (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Modelo de imposto dos EUA 1099 |
Formulário de Imposto dos EUA 1040 (Variações) | Você deseja extrair informações dos formulários 1040 , e suas variações (Agenda 1, Agenda 2, Agenda 3, Agenda 8812, Agenda A e Agenda B, Agenda C, Agenda D, Agenda E, Agenda EIC, Agenda, F, Agenda H, Agenda J, Agenda R, Agenda ES, Agenda Sênior). |
Modelo de imposto dos EUA 1040 |
Contrato (contrato legal entre partes). | Você deseja extrair detalhes do contrato, como partes, datas e intervalos. | Modelo de contrato |
Cartão do seguro de saúde ou ID do seguro de saúde. | Você deseja extrair informações importantes, como seguradora, ID de membro, cobertura de prescrição e número do grupo. | Número do cartão do plano de saúde |
Cartão de crédito/débito . | Você deseja extrair cartões bancários de informações importantes, como número do cartão e nome do banco. | Modelo de cartão de crédito/débito |
Certidão de casamento . | Você deseja extrair informações importantes das certidões de casamento. | Modelo de certificado de casamento |
Fatura ou demonstrativo de cobrança. | Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido. | Modelo de fatura |
Recibo, voucher ou recibo de hotel de página única. | Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações. | Modelo de recibo |
Documento de identidade (ID) como uma carteira de motorista dos EUA ou passaporte internacional. | Você deseja extrair informações importantes, como nome, sobrenome, data de nascimento, endereço e assinatura. | Modelo de documento de ID (identidade) |
Financiamento EUA 1003 . | Você deseja extrair informações importantes do aplicativo de empréstimo residencial uniforme. | Modelo de formulário 1003 |
Financiamento dos EUA 1008 . | Você deseja extrair informações importantes do resumo de Subscrição Uniforme e Transmissão. | Modelo de formulário 1008 |
Divulgação de fechamento hipotecas dos EUA . | Você deseja extrair informações importantes de um formulário de divulgação de fechamento de hipotecas. | Modelo de formulário de Divulgação de fechamento de hipotecas |
Documentos de tipo misto com elementos estruturados, semiestruturados e/ou não estruturados. | Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. | Modelo personalizado |
Dica
- Se você ainda não tiver certeza de qual modelo pré-treinado usar, experimente o modelo de layout com o parâmetro
features=keyValuePairs
de cadeia de caracteres de consulta opcional habilitado. - O modelo de layout é alimentado pelo mecanismo OCR de Leitura para detectar páginas, tabelas, estilos, texto, linhas, palavras, locais e idiomas.
Modelos de extração personalizados
Conjunto de treinamento | Documentos de exemplo | Sua melhor solução |
---|---|---|
Documentos estruturados, consistentes e com um layout estático. | Formulários estruturados, como questionários ou aplicativos. | Modelo de template personalizado |
Documentos estruturados, semiestruturados e não estruturados. | ● Estruturados → pesquisas ● Semiestruturados → faturas ● Não estruturados → cartas |
Modelo neural personalizado |
Uma coleção de vários modelos treinados em documentos de tipo semelhante. | ● Pedidos de compra de suprimentos ● Pedidos de compra de equipamentos ● Pedidos de compra de móveis Todos compostos em um único modelo. |
Modelo personalizado composto |
Modelo de classificação personalizada
Conjunto de treinamento | Documentos de exemplo | Sua melhor solução |
---|---|---|
Pelo menos dois tipos diferentes de documentos. | Formulários, cartas ou documentos | Modelo de classificação personalizada |
Próximas etapas
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de