O que é o Reconhecimento de Formulários do Azure?

Este artigo se aplica a:marca de seleção do Reconhecimento de Formulários v3.0Reconhecimento de Formulários v3.0. Versão anterior:Reconhecimento de Formulários v2.1

O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para classificar documentos, extrair textos, tabelas, estruturas e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

Tipo de modelo Nome do modelo
Modelos de análise de documentos OCR de Leitura
Análise de layout
Documento geral
Modelos predefinidos Cartão de seguro de saúde
Formulário W-2
Fatura
Recibo
Documento de identidade (ID)
Cartão de visita
Modelos personalizados Visão geral do modelo personalizado

Modelos de extração
Modelo personalizado
Neural personalizado

Modelo classificador
Classificador personalizado

Modelo composto
Modelos de pré-visualização restritos

Para solicitar acesso aos modelos de pré-visualização restritos
no Estúdio de Reconhecimento de Formulários, preencha e envie o
formulário de solicitação de pré-visualização privada do Reconhecimento de Formulários.
Documento geral com campos de consulta
Contrato
Cartão de vacinação
Formulário fiscal dos EUA 1098
Formulário fiscal dos EUA 1098-E
Formulário fiscal dos EUA 1098-T

Qual recurso do Reconhecimento de Formulários devo usar?

Esta seção ajuda você a decidir qual modelo do Reconhecimento de Formulários v3.0 você deve usar no seu aplicativo:

Tipo de documento Dados para extrair Formato do documento Sua melhor solução
Um documento genérico como um contrato ou uma carta. Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados. O documento é escrito ou impresso em um idioma com suporte. Ler o modelo OCR
Um documento que inclui informações estruturais, como um relatório ou estudo. Além do texto, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. O documento é escrito ou impresso em um idioma com suporte Modelo de análise de layout
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos e valores, como um aplicativo de crédito ou formulário de pesquisa. Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. O formulário ou documento é um formato padronizado comumente usado em sua empresa ou setor e impresso em um idioma com suporte. Modelo de documento geral
Formulário W-2 dos EUA Você quer extrair informações importantes, como salário, remunerações e impostos retidos dos formulários fiscais W2 dos EUA. O documento W-2 está em Estados Unidos texto em inglês (en-US). Modelo W-2
Fatura Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. O documento é escrito ou impresso em um idioma com suporte. Modelo de fatura
Receipt Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. O documento é escrito ou impresso em um idioma com suporte. Modelo de recibo
Documento de ID (identidade) como um passaporte ou carteira de motorista. Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de ID (identidade)
Cartão de visita Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. O documento de cartão de visita está em inglês ou em japonês. Modelo de cartão de visita
Documentos específicos do aplicativo Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. Modelo de extração personalizado
Documentos de tipo misto Você deseja classificar documentos ou dividir um arquivo em documentos individuais. Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. Modelo de classificação personalizada

Dica

  • Se você ainda não tiver certeza de qual modelo usar, experimente o modelo de Documento Geral para extrair pares chave-valor.
  • O modelo de Documento Geral é habilitado pelo mecanismo OCR de Leitura para detectar linhas de texto, palavras, locais e idiomas.
  • O documento geral também extrai os mesmos dados que o modelo de layout do documento (páginas, tabelas, estilos).

Modelos de processamento de documentos e opções de desenvolvimento

Observação

Há suporte para os modelos de reconhecimento de documento e opções de desenvolvimento a seguir no serviço Reconhecimento de Formulários v3.0.

Você pode usar o Reconhecimento de Formulários para automatizar o processamento de documento em aplicativos e fluxos de trabalho, aprimorar as estratégias controladas por dados e enriquecer as funcionalidades de pesquisa de documentos. Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API.

Modelar Descrição Casos de uso de automação Opções de desenvolvimento
Ler o modelo OCR Extrai linhas de texto, palavras, idiomas detectados e estilo manuscrito, se detectado. ● Processamento de contrato.
● Processamento de relatórios financeiros ou médicos.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo de documento geral Extrai texto, tabelas, estrutura e pares chave-valor. ● Extração de pares chave-valor.
● Processamento de formulários.
● Coleta e análise de dados de pesquisa.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo de análise de layout Extraia texto, marcas de seleção e estrutura de tabelas de formulários e documentos, juntamente com as respectivas coordenadas de caixa delimitadora.

A API de Layout foi atualizada para um modelo predefinido.
● Indexação e recuperação de documentos por estrutura.
● Pré-processamento antes da análise de OCR.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo personalizado (atualizado) Classificação, extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso. A API de modelo personalizado v3.0 dá suporte a dois tipos de modelo:● O Modelo de Classificador Personalizado é usado para identificar e dividir tipos de documentos.
● O Modelo de Extração Personalizada é usado para analisar formulários ou documentos e extrair campos e tabelas específicos. Modelo personalizado e neural personalizado são os dois tipos de modelos de extração personalizados.
● Identificação e extração de dados de documentos exclusivos para sua empresa, afetados por uma mudança de regulamentação ou evento de mercado.
● Identificação e análise de dados exclusivos ignorados anteriormente.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Formulário W-2 Extrair informações relatadas em cada caixa em um formulário W-2. ● Gerenciamento automatizado de documentos fiscais.
● Processamento de pedido de empréstimo hipotecário.
Estúdio do Reconhecimento de FormuláriosAPI REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas. ● Processamento de contas a pagar.
● Registro e relatório de impostos automatizados.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
Modelo de recibo (atualizado) Processamento automatizado de dados e extração de informações importantes de recibos de vendas.

O modelo de recibo v3.0 dá suporte ao processamento de
.
● Gestão de despesas.
● Análise de dados de comportamento do consumidor.
● Programa de fidelização de clientes.
● Processamento de devolução de mercadorias.
● Registro e relatório de impostos automatizados.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo de documento de identidade (ID) (atualizado) Processamento automatizado de dados e extração de informações importantes de carteiras de habilitação dos EUA e passaportes internacionais.

A API de documento de ID pré-construída dá suporte à
.
● Conheça a conformidade com as diretrizes de serviços financeiros (KYC) do seu cliente.
● Gestão de contas médicas.
● Pontos de verificação de identidade e gateways.
● Registro no hotel.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript
Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita. ● Vendas potenciais e gestão de marketing. Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Este artigo aplica-se a:marca de seleção do Reconhecimento de Formulários v2.1Reconhecimento de Formulários v2.1. Versão posterior:Reconhecimento de Formulários v3.0

O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para extrair textos, tabelas, estruturas e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

Tipo de modelo Nome do modelo
Modelo de análise de documentos Modelo de análise de layout
Modelos predefinidos Modelo de fatura
Modelo de recibo
Modelo de documento de ID (identidade)
Modelo de cartão de visita
Modelos personalizados Modelo personalizado
Modelo composto

Qual modelo de processamento de documentos devo usar?

Esta seção ajuda você a decidir qual recurso do Reconhecimento de Formulários v2.1 você deve usar para seu aplicativo:

Tipo de documento Dados para extrair Formato do documento Sua melhor solução
Um documento que inclui informações estruturais, como um relatório ou estudo. Além do texto, você precisa extrair informações estruturais como tabelas e marcas de seleção. O documento é escrito ou impresso em um idioma com suporte Modelo de análise de layout
Fatura Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. O documento é escrito ou impresso em um idioma com suporte. Modelo de fatura
Receipt Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. O documento é escrito ou impresso em um idioma com suporte. Modelo de recibo
Documento de ID (identidade) como um passaporte ou carteira de motorista. Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). Modelo de documento de identificação
Cartão de visita Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. O documento de cartão de visita está em inglês ou em japonês. Modelo de cartão de visita
Documentos de tipo misto Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. Modelo personalizado

Recursos e opções de desenvolvimento do Reconhecimento de Formulários

Dica

  • Para obter uma experiência aprimorada e qualidade avançada do modelo, experimente o Estúdio de Reconhecimento de Formulários v3.0.
  • O Studio v3.0 dá suporte a qualquer modelo treinado usando os dados rotulados da v2.1.
  • Você pode consultar o guia de migração de API para obter informações detalhadas sobre como migrar da v2.1 para a v3.0.

Observação

Há suporte para os recursos e as opções de desenvolvimento a seguir no serviço de Reconhecimento de Formulários v2.1.

Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API:

Modelar Descrição Opções de desenvolvimento
Análise de layout Extração e análise de texto, marcas de seleção tabelas, e coordenadas de caixa delimitadora, a partir de formulários e documentos. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo personalizado Extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
Ferramenta de rotulagem de amostras
Contêiner do Docker do Reconhecimento de Formulários
Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de recibo Processamento automatizado de dados e extração de informações importantes de recibos de vendas. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de documento de ID (identidade) Processamento automatizado de dados e extração de informações importantes de carteiras de motorista dos EUA e passaportes internacionais. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários

Segurança e privacidade de dados

Assim como ocorre com todos os serviços de IA, os desenvolvedores que usam o serviço Reconhecimento de Formulários devem estar cientes das políticas da Microsoft referentes aos dados do cliente. Confira nossa página Dados, privacidade e segurança do Reconhecimento de Formulários.

Próximas etapas