O que é o Reconhecimento de Formulários do Azure?

Este artigo se aplica a:marca de seleção do Reconhecimento de Formulários v3.0Reconhecimento de Formulários v3.0. Versão anterior:Reconhecimento de Formulários v2.1

O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para extrair texto impresso e manuscrito, tabelas, estrutura e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

Tipo de modelo Nome do modelo
Modelos de análise de documentos Modelo de leitura OCR
Modelo de documento geral
Modelo de análise de layout
Modelos predefinidos Modelo de formulário W-2
Modelo de fatura
Modelo de recibo
Modelo de documento de ID (identidade)
Modelo de cartão de visita
Modelos personalizados Modelo personalizado
Modelo composto

Qual recurso do Reconhecimento de Formulários devo usar?

Esta seção ajuda você a decidir qual recurso com suporte ao Reconhecimento de Formulários v3.0 você deve usar para seu aplicativo:

Tipo de documento Dados para extrair Formato do documento Sua melhor solução
Um documento genérico como um contrato ou uma carta. Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados. O documento é escrito ou impresso em um idioma com suporte. Ler o modelo OCR
Um documento que inclui informações estruturais, como um relatório ou estudo. Além do texto, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. O documento é escrito ou impresso em um idioma com suporte Modelo de análise de layout
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos e valores, como um aplicativo de crédito ou formulário de pesquisa. Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. O formulário ou documento é um formato padronizado comumente usado em sua empresa ou setor e impresso em um idioma com suporte. Modelo de documento geral
Formulário W-2 dos EUA Você quer extrair informações importantes, como salário, remunerações e impostos retidos dos formulários fiscais W2 dos EUA. O documento W-2 está em Estados Unidos texto em inglês (en-US). Modelo W-2
Fatura Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. O documento é escrito ou impresso em um idioma com suporte. Modelo de fatura
Receipt Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. O documento é escrito ou impresso em um idioma com suporte. Modelo de recibo
Documento de ID (identidade) como um passaporte ou carteira de motorista. Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de ID (identidade)
Cartão de visita Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. O documento de cartão de visita está em inglês ou em japonês. Modelo de cartão de visita
Documentos de tipo misto Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. Modelo personalizado

Dica

  • Se você ainda não tiver certeza de qual modelo usar, experimente o modelo de Documento Geral para extrair pares chave-valor.
  • O modelo de Documento Geral é habilitado pelo mecanismo OCR de Leitura para detectar linhas de texto, palavras, locais e idiomas.
  • O documento geral também extrai os mesmos dados que o modelo de layout do documento (páginas, tabelas, estilos).

Modelos de processamento de documentos e opções de desenvolvimento

Observação

Há suporte para os modelos de reconhecimento de documento e opções de desenvolvimento a seguir no serviço Reconhecimento de Formulários v3.0.

Você pode usar o Reconhecimento de Formulários para automatizar o processamento de documento em aplicativos e fluxos de trabalho, aprimorar as estratégias controladas por dados e enriquecer as funcionalidades de pesquisa de documentos. Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API.

Modelar Descrição Casos de uso de automação Opções de desenvolvimento
Ler o modelo OCR Extrai linhas de texto, palavras, idiomas detectados e estilo manuscrito, se detectado.
  • Processamento de contrato.
  • Processamento de relatórios financeiros ou médicos.
Modelo de documento geral Extrai texto, tabelas, estrutura e pares chave-valor.
  • Extração de par chave-valor.
  • Processamento de formulários.
  • Coleta e análise de dados personalizadas.
Modelo de análise de layout Extraia texto, marcas de seleção e estrutura de tabelas de formulários e documentos, juntamente com as respectivas coordenadas de caixa delimitadora.

A API de Layout foi atualizada para um modelo predefinido.
  • Indexação e recuperação de documentos por estrutura.
  • Pré-processamento antes da análise do OCR.
Modelo personalizado (atualizado) Extração e análise de dados de formulários e documentos específicos para dados de negócios distintos e casos de uso.

A API de modelo personalizado v3.0 dá suporte à detecção de assinatura para modelos de modelo personalizado (formulário personalizado)..

A API de modelo personalizado v3.0 agora dá suporte a dois tipos de modelo:
  • Identificação e compilação de dados, exclusivos da sua empresa, afetados por uma alteração regulatória ou evento de mercado.
  • Identificação e análise de dados exclusivos ignorados anteriormente.
Estúdio do Reconhecimento de Formulários
  • REST API
  • SDK do C#
  • SDK do Python
  • Java SDK
  • JavaScript
  • Formulário W-2 Extrair informações relatadas em cada caixa em um formulário W-2.
    • Gerenciamento automatizado de documentos fiscais.
    • Processamento de pedido de empréstimo hipotecário.
    Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas.
    • Processamento de contas a pagar.
    • Registro e relatório de impostos automatizados.
    Modelo de recibo (atualizado) Processamento automatizado de dados e extração de informações importantes de recibos de vendas.

    O modelo de recibo v3.0 dá suporte ao processamento de
    .
    • Gerenciamento de despesas.
    • Análise de dados de comportamento do consumidor.
    • Programa de fidelidade do cliente.
    • Processamento de retorno de mercadorias.
    • Registro e relatório de impostos automatizados.
    Modelo de documento de identidade (ID) (atualizado) Processamento automatizado de dados e extração de informações importantes de carteiras de habilitação dos EUA e passaportes internacionais.

    A API de documento de ID pré-construída dá suporte à
    .
    • Diretrizes de Know Your Costumer (KYC) para serviços financeiros.
    • Gerenciamento de conta médica.
    • Pontos de verificação de identidade e gateways.
    • Registro de hotel.
    Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita.
    • Lead de vendas e gerenciamento de marketing.

    Este artigo aplica-se a:marca de seleção do Reconhecimento de Formulários v2.1Reconhecimento de Formulários v2.1. Versão posterior:Reconhecimento de Formulários v3.0

    O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para extrair texto impresso e manuscrito, tabelas, estrutura e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

    Tipo de modelo Nome do modelo
    Modelo de análise de documentos Modelo de análise de layout
    Modelos predefinidos Modelo de fatura
    Modelo de recibo
    Modelo de documento de ID (identidade)
    Modelo de cartão de visita
    Modelos personalizados Modelo personalizado
    Modelo composto

    Qual modelo de processamento de documentos devo usar?

    Esta seção ajuda você a decidir qual recurso do Reconhecimento de Formulários v2.1 você deve usar para seu aplicativo:

    Tipo de documento Dados para extrair Formato do documento Sua melhor solução
    Um documento que inclui informações estruturais, como um relatório ou estudo. Além do texto, você precisa extrair informações estruturais como tabelas e marcas de seleção. O documento é escrito ou impresso em um idioma com suporte Modelo de análise de layout
    Fatura Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. O documento é escrito ou impresso em um idioma com suporte. Modelo de fatura
    Receipt Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. O documento é escrito ou impresso em um idioma com suporte. Modelo de recibo
    Documento de ID (identidade) como um passaporte ou carteira de motorista. Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de identificação
    Cartão de visita Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. O documento de cartão de visita está em inglês ou em japonês. Modelo de cartão de visita
    Documentos de tipo misto Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. Modelo personalizado

    Recursos e opções de desenvolvimento do Reconhecimento de Formulários

    Dica

    • Para obter uma experiência aprimorada e qualidade avançada do modelo, experimente o Estúdio de Reconhecimento de Formulários v3.0.
    • O Studio v3.0 dá suporte a qualquer modelo treinado usando os dados rotulados da v2.1.
    • Você pode consultar o guia de migração de API para obter informações detalhadas sobre como migrar da v2.1 para a v3.0.

    Observação

    Há suporte para os recursos e as opções de desenvolvimento a seguir no serviço de Reconhecimento de Formulários v2.1.

    Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API:

    Modelar Descrição Opções de desenvolvimento
    Análise de layout Extração e análise de texto, marcas de seleção tabelas, e coordenadas de caixa delimitadora, a partir de formulários e documentos.
    Modelo personalizado Extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso.
    Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas.
    Modelo de recibo Processamento automatizado de dados e extração de informações importantes de recibos de vendas.
    Modelo de documento de ID (identidade) Processamento automatizado de dados e extração de informações importantes de carteiras de motorista dos EUA e passaportes internacionais.
    Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita.

    Segurança e privacidade de dados

    Assim como ocorre com todos os serviços de IA, os desenvolvedores que usam o serviço Reconhecimento de Formulários devem estar cientes das políticas da Microsoft referentes aos dados do cliente. Confira nossa página Dados, privacidade e segurança do Reconhecimento de Formulários.

    Próximas etapas