O que é Azure Reconhecedor de Formulários?

Este artigo aplica-se a:Reconhecedor de Formulários marca de verificação v3.0Reconhecedor de Formulários v3.0. Versão anterior:Reconhecedor de Formulários v2.1

O Azure Reconhecedor de Formulários é um Serviço de IA Aplicado Azure baseado na nuvem para os desenvolvedores construirem soluções inteligentes de processamento de documentos. Reconhecedor de Formulários aplica o reconhecimento de caracteres óticos baseados na aprendizagem automática (OCR) e documenta tecnologias de compreensão para extrair texto, tabelas, estrutura e pares de valor-chave a partir de documentos. Também pode rotular e formar modelos personalizados para automatizar a extração de dados a partir de documentos estruturados, semi-estruturados e não estruturados. Para saber mais sobre cada modelo, consulte os artigos conceptuais:

Tipo de modelo Nome do modelo
Modelos de análise de documentos Leia o modelo
OCR ● Modelo
geral de documentoModelo de análise de layout
Modelos pré-construídos ● Modelo
de formulário W-2Modelo
de fatura● Modelo
de recibo● Modelo de documento
de identidade (ID) ● Modelo do cartão de visita
Modelos personalizados Modelo
personalizado● Modelo composto

Qual Reconhecedor de Formulários modelo devo usar?

Esta secção irá ajudá-lo a decidir qual Reconhecedor de Formulários modelo suportado v3.0 que deve utilizar para a sua aplicação:

Tipo de documento Dados a extrair Formato documental A sua melhor solução
Um documento genérico como um contrato ou carta. Pretende extrair principalmente linhas de texto, palavras, locais e línguas detetadas. O documento é escrito ou impresso numa língua suportada. Leia o modelo OCR
Um documento que inclui informações estruturais como um relatório ou estudo. Além do texto, é necessário extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, rubricas e subposições. O documento é escrito ou impresso numa língua apoiada Modelo de análise de layout
Um documento estruturado ou semi-estruturado que inclui conteúdoformado como campos e valores, como uma aplicação de crédito ou formulário de inquérito. Pretende extrair campos e valores, incluindo os não abrangidos pelos modelos pré-construídos específicos do cenário , sem ter de treinar um modelo personalizado. O formulário ou documento é um formato padronizado comumente utilizado no seu negócio ou indústria e impresso numa língua suportada. Modelo de documento geral
Formulário U.S. W-2 Você quer extrair informações-chave, tais como salários, salários e impostos retidos nos formulários de impostos do US W2. O documento W-2 está em Estados Unidos texto inglês (en-US). Modelo W-2
Fatura Pretende extrair informações chave como nome do cliente, endereço de faturação e valor devido a partir de faturas. O documento de fatura está escrito ou impresso numa língua suportada. Modelo de fatura
Recibo Pretende extrair informações-chave como nome de comerciante, data de transação e total de transações a partir de um recibo de hotel de uma página. O recibo está escrito ou impresso numa língua suportada. Modelo de recibo
Documento de identidade (ID) como passaporte ou carta de condução. Pretende extrair informações-chave como o primeiro nome, apelido e data de nascimento das licenças de condução dos EUA ou passaportes internacionais. O seu documento de ID é uma carta de condução dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de identidade (ID)
Cartão de visita Pretende extrair informações-chave como nome próprio, apelido, nome da empresa, endereço de e-mail e número de telefone dos cartões de visita. O documento do cartão de visita está em texto inglês ou japonês. Modelo de cartões de visita
Documentos de tipo misto Pretende extrair pares de valores-chave, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documentos pré-construídos ou gerais. Tem vários documentos com elementos estruturados, semi-estruturados e/ou não estruturados. Modelo personalizado

Dica

  • Se ainda não tiver a certeza de que modelo utilizar, experimente o modelo Do Documento Geral para extrair pares de valor-chave.
  • O modelo Documento Geral é alimentado pelo motor Read OCR para detetar linhas de texto, palavras, localizações e idiomas.
  • O documento geral também extrai os mesmos dados que o modelo de layout do documento (páginas, tabelas, estilos).

Modelos de processamento de documentos e opções de desenvolvimento

Nota

Os seguintes modelos de compreensão documental e opções de desenvolvimento são suportados pelo serviço de Reconhecedor de Formulários v3.0.

Pode utilizar Reconhecedor de Formulários para automatizar o processamento do seu documento em aplicações e fluxos de trabalho, melhorar estratégias baseadas em dados e enriquecer as capacidades de pesquisa de documentos. Utilize os links na tabela para saber mais sobre cada modelo e navegue nas referências API.

Modelação Descrição Casos de utilização de automatização Opções de desenvolvimento
Leia o modelo OCR Extrair linhas de texto, palavras, idiomas detetados e estilo manuscrito se detetado.
  • Processamento de contratos.
  • Processamento de relatórios financeiros ou médicos.
Modelo de documento geral Extrair texto, tabelas, estrutura e pares de valor-chave.
  • Extração de par de valor chave.
  • Processamento de formulários.
  • Recolha e análise de dados de pesquisa.
Modelo de análise de layout Extrair texto, marcas de seleção e estruturas de mesas, juntamente com as suas coordenadas de caixa de delimitação, a partir de formulários e documentos.

A API de layout foi atualizada para um modelo pré-construído.
  • Indexação e recuperação de documentos por estrutura.
  • Pré-processamento antes da análise do OCR.
Modelo personalizado (atualizado) Extração e análise de dados de formulários e documentos específicos para dados de negócio distintos e casos de utilização.

O modelo personalizado API v3.0 suporta a deteção de assinaturas para modelos personalizados (formulário personalizado).

O modelo personalizado API v3.0 suporta agora dois tipos de modelo:
  • Identificação e compilação de dados, exclusivas do seu negócio, impactados por uma mudança regulamentar ou evento de mercado.
  • Identificação e análise de dados únicos anteriormente negligenciados.
Estúdio Reconhecedor de Formulários
  • REPOUSO API
  • SDK C#
  • SDK Python
  • SDK Java
  • JavaScript
  • Formulário W-2 Extrair informações relatadas em cada caixa num formulário W-2.
    • Gestão automatizada de documentos fiscais.
    • Processamento de pedidos de empréstimo hipotecário.
    Modelo de fatura Processamento automatizado de dados e extração de informações-chave a partir de faturas de venda.
    • Processamento de contas a pagar.
    • Registo e reporte de impostos automatizados.
    Modelo de recibo (atualizado) Processamento automatizado de dados e extração de informações-chave a partir de recibos de venda.

    O modelo de recibo v3.0 suporta o processamento de recibos de hotéis de uma só página.
    • Gestão de despesas.
    • Análise de dados de comportamento do consumidor.
    • Programa de fidelização de clientes.
    • Processamento de devolução de mercadorias.
    • Registo e reporte de impostos automatizados.
    Modelo de documento de identidade (ID) (atualizado) Processamento automatizado de dados e extração de informações-chave a partir de cartas de condução dos EUA e passaportes internacionais.

    Documento de identificação pré-construído A API apoia a extração de averbamentos, restrições e classificações de veículos a partir das cartas de condução dos EUA.
    • Conheça o cumprimento das diretrizes dos serviços financeiros do seu cliente (KYC).
    • Gestão de conta médica.
    • Postos de controlo de identidade e portais.
    • Registo do hotel.
    Modelo de cartões de visita Processamento automatizado de dados e extração de informações-chave a partir de cartões de visita.
    • Liderança de vendas e gestão de marketing.

    Este artigo aplica-se a:Reconhecedor de Formulários marca de verificação v2.1Reconhecedor de Formulários v2.1. Versão posterior:Reconhecedor de Formulários v3.0

    O Azure Reconhecedor de Formulários é um Serviço de IA Aplicado Azure baseado na nuvem para os desenvolvedores construirem soluções inteligentes de processamento de documentos. Reconhecedor de Formulários aplica o reconhecimento de caracteres óticos baseados na aprendizagem automática (OCR) e documenta tecnologias de compreensão para extrair texto, tabelas, estrutura e pares de valor-chave a partir de documentos. Também pode rotular e formar modelos personalizados para automatizar a extração de dados a partir de documentos estruturados, semi-estruturados e não estruturados. Para saber mais sobre cada modelo, consulte os artigos conceptuais:

    Tipo de modelo Nome do modelo
    Modelo de análise de documentos Modelo de análise de layout
    Modelos pré-construídos Modelo
    de fatura● Modelo
    de receção● Modelo de documento de identidade (ID)Modelo do cartão de visita

    Modelos personalizados Modelo
    personalizado● Modelo composto

    Que modelo de processamento de documentos devo usar?

    Esta secção irá ajudá-lo a decidir qual Reconhecedor de Formulários modelo suportado v2.1 que deve utilizar para a sua aplicação:

    Tipo de documento Dados a extrair Formato documental A sua melhor solução
    Um documento que inclui informações estruturais como um relatório ou estudo. Além do texto, é necessário extrair informações estruturais como tabelas e marcas de seleção. O documento é escrito ou impresso numa língua apoiada Modelo de análise de layout
    Fatura Pretende extrair informações chave como nome do cliente, endereço de faturação e valor devido a partir de faturas. O documento de fatura está escrito ou impresso numa língua suportada. Modelo de fatura
    Recibo Pretende extrair informações-chave como nome de comerciante, data de transação e total de transações a partir de um recibo de hotel de uma página. O recibo está escrito ou impresso numa língua suportada. Modelo de recibo
    Documento de identidade (ID) como passaporte ou carta de condução. Pretende extrair informações-chave como o primeiro nome, apelido e data de nascimento das licenças de condução dos EUA ou passaportes internacionais. O seu documento de ID é uma carta de condução dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de ID
    Cartão de visita Pretende extrair informações-chave como nome próprio, apelido, nome da empresa, endereço de e-mail e número de telefone dos cartões de visita. O documento do cartão de visita está em texto inglês ou japonês. Modelo de cartões de visita
    Documentos de tipo misto Pretende extrair pares de valores-chave, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documentos pré-construídos ou gerais. Tem vários documentos com elementos estruturados, semi-estruturados e/ou não estruturados. Modelo personalizado

    Reconhecedor de Formulários modelos e opções de desenvolvimento

    Dica

    • Para uma experiência melhorada e qualidade avançada do modelo, experimente o Reconhecedor de Formulários v3.0 Studio.
    • O V3.0 Studio suporta qualquer modelo treinado com dados com rótulo V2.1.
    • Pode consultar o guia de migração da API para obter informações detalhadas sobre a migração de v2.1 para v3.0.

    Nota

    Os seguintes modelos e opções de desenvolvimento são suportados pelo serviço de Reconhecedor de Formulários v2.1.

    Utilize os links da tabela para saber mais sobre cada modelo e navegue nas referências API:

    Modelação Descrição Opções de desenvolvimento
    Análise de layout Extração e análise de texto, marcas de seleção, tabelas e coordenadas de caixa de delimitação, a partir de formulários e documentos.
    Modelo personalizado Extração e análise de dados de formulários e documentos específicos para dados de negócio distintos e casos de utilização.
    Modelo de fatura Processamento automatizado de dados e extração de informações-chave a partir de faturas de venda.
    Modelo de recibo Processamento automatizado de dados e extração de informações-chave a partir de recibos de venda.
    Modelo de documento de identidade (ID) Processamento automatizado de dados e extração de informações-chave a partir de cartas de condução dos EUA e passaportes internacionais.
    Modelo de cartões de visita Processamento automatizado de dados e extração de informações-chave a partir de cartões de visita.

    Privacidade e segurança dos dados

    Tal como acontece com todos os serviços de IA, os desenvolvedores que utilizam o serviço Reconhecedor de Formulários devem estar cientes das políticas Microsoft nos dados dos clientes. Consulte os nossos Dados, privacidade e segurança para Reconhecedor de Formulários página.

    Passos seguintes