O que é o Reconhecimento de Formulários do Azure?

Este artigo aplica-se a:marca de seleção do Reconhecimento de Formulários v3.0Reconhecimento de Formulários v3.0. Versão anterior:Reconhecimento de Formulários v2.1

O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure que permite criar soluções inteligentes de processamento de documentos. Grandes quantidades de dados, abrangendo uma ampla variedade de tipos de dados, são armazenadas em formulários e documentos. Reconhecimento de Formulários permite gerenciar efetivamente a velocidade com que os dados são coletados e processados e é fundamental para operações aprimoradas, decisões controladas por dados informados e inovação esclarecida.

| ✔️ Modelos de análise de documento | ✔️ Modelos predefinidos | ✔️ Modelos personalizados | ✔️Modelos de versão prévia restrita |

Modelos de análise de documentos

Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, o uso ou o progresso da sua organização.


Leitura |Extrair texto impresso
e manuscrito.


Layout | Extrair texto
e estrutura do documento.


Documento geral: | Extrai texto,
estrutura e pares chave-valor.

Modelos predefinidos

Os modelos predefinidos do Reconhecimento de Formulários do Azure permitem adicionar o processamento de documentos inteligente aos seus aplicativos e fluxos sem precisar treinar e criar seus próprios modelos.


Fatura | Extrair os detalhes do cliente
e do fornecedor.


Recibo | Extrair detalhes da transação de vendas
.


Identidade | Extrair detalhes de identificação
e verificação.


🆕 Cartão de seguro | Extrair detalhes do seguro de saúde.


W2 | Extrair detalhes de compensação tributáveis
.


Cartão de negócios | Extrair detalhes de contato comercial.


Contrato | Extrair detalhes do contrato
e da parte.

Modelos personalizados

Modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de formulários e documentos, específicos para seus casos de uso. Modelos personalizados autônomos podem ser combinados para criar modelos compostos.

Modelos de extração
Modelos de extração personalizados são treinados para extrair campos rotulados de documentos.


Modelo personalizado | Extrair dados de layouts estáticos.


Neural personalizado | Extrair dados de documentos de tipo misto.


Composto personalizado | Extrair dados usando uma coleção de modelos.

Modelo de classificação
Classificadores personalizados analisam documentos de entrada para identificar tipos de documentos antes de invocar um modelo de extração.


Classificador personalizado | Identifique os tipos de documento designados (classes) antes de invocar um modelo de extração.

Modelos de versão prévia restrita

As versões prévias do recurso Reconhecimento de Formulários Studio estão atualmente em versão prévia restrita. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base no feedback dos usuários. Preencha e envie o formulário de solicitação de versão prévia privada do Reconhecimento de Formulários para solicitar acesso.


Formulário de Imposto dos EUA 1098-E | Extrair detalhes de juros do empréstimo estudantil


Formulário de Imposto dos EUA 1098 | Extrair detalhes de juros da hipoteca.


Formulário de Imposto dos EUA 1098-T | Extrair detalhes de mensalidades qualificadas.

Modelos e opções de desenvolvimento

Observação

Há suporte para os modelos de reconhecimento de documento e opções de desenvolvimento a seguir no serviço Reconhecimento de Formulários v3.0.

Você pode usar o Reconhecimento de Formulários para automatizar o processamento de documento em aplicativos e fluxos de trabalho, aprimorar as estratégias controladas por dados e enriquecer as funcionalidades de pesquisa de documentos. Use os links da tabela para saber mais sobre cada modelo e procurar as opções de desenvolvimento.

Ler

Captura de tela de análise de modelo de leitura usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Ler o modelo OCR ● Extrair texto de documentos.
Extração de dados e campos
● Processamento de contrato.
● Processamento de relatórios financeiros ou médicos.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Layout

Captura de tela de análises de modelo de layout usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de análise de layout ● Extrair informações de texto e layout de documentos.
Extração de dados e campos
●A API de layout foi atualizada para um modelo predefinido.
● Indexação e recuperação de documentos por estrutura.
● Pré-processamento antes da análise de OCR.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Documentação Geral

Captura de tela da análise de documento geral no Estúdio de Reconhecimento de Formulários.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de documento geral ● Extrair pares de texto, layout e chave-valor de documentos.
Extração de dados e campos
● Extração de pares chave-valor.
● Processamento de formulários.
● Coleta e análise de dados de pesquisa.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Fatura

Captura de tela de análises de modelo de Fatura usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de fatura ● Extrair informações importantes de faturas.
Extração de dados e campos
● Processamento de contas a pagar.
● Registro e relatório de impostos automatizados.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Receipt

Captura de tela de análises de modelo de Recibos usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de recibo ● Extrair informações importantes de recibos.
Extração de dados e campos
● O modelo de recibo v3.0 dá suporte ao processamento de recibos de hotel de página única.
● Gestão de despesas.
● Análise de dados de comportamento do consumidor.
● Programa de fidelização de clientes.
● Processamento de devolução de mercadorias.
● Registro e relatório de impostos automatizados.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Identidade (ID)

Captura de tela da análise de documento de Identidade (ID) no Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de documento de ID (identidade) ● Extrai informações importantes de passaportes e cartões de identificação.
Tipos de documentação
●Extrai endossos, restrições e classificações de veículos de carteiras de motorista dos EUA.
● Conheça a conformidade com as diretrizes de serviços financeiros (KYC) do seu cliente.
● Gestão de contas médicas.
● Pontos de verificação de identidade e gateways.
● Registro no hotel.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

cartão do seguro de saúde

Captura de tela de análise de cartão do seguro de saúde no Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
cartão do seguro de saúde ● Extrair informações importantes de cartões de seguro de saúde dos EUA.
Extração de dados e campos
● Verificação de cobertura e qualificação.
● Modelagem preditiva.
● Análise baseada em valor.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

W-2

Captura de tela de análises de modelo de W-2 usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Formulário W-2 ● Extrair informações importantes dos formulários fiscais do IRS US W2 (ano 2018-2021).
Extração de dados e campos
● Gerenciamento automatizado de documentos fiscais.
● Processamento de pedido de empréstimo hipotecário.
Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Cartão de visita

Captura de tela de análises de modelo de cartão de Visita usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de cartão de visita ● Extrair informações importantes de cartões corporativos.
Extração de dados e campos
● Vendas potenciais e gestão de marketing. Estúdio do Reconhecimento de Formulários
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Visão geral do modelo personalizado

Captura de tela de treinamento de modelo Personalizado usando Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo personalizado Extrai informações de formulários e documentos em dados estruturados com base em um modelo criado a partir de um conjunto de formulários de treinamento representativos. Extrai dados de formulários e documentos específicos à sua empresa e casos de uso. Reconhecimento de Formulários Studio
API REST
SDK do C#
SDK do Java
SDK do JavaScript
SDK do Python

Template personalizado

Captura de tela de análises de modelo de Modelo Personalizado usando Reconhecimento de Formulários Studio.

Observação

Para treinar um modelo de modelo personalizado, defina a buildMode propriedade como template. Para obter mais informações, consulteTreinamento de um modelo de modelo de máquina virtual personalizado

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de modelo de máquina virtual personalizado O modelo personalizado extrai valores e campos rotulados de documentos estruturados e semiestruturados.
Extrai dados importantes de documentos altamente estruturados com modelos visuais definidos ou layouts visuais comuns, formulários. Reconhecimento de Formulários Studio
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript

Neural personalizado

Captura de tela de análises de modelo de Neural usando Reconhecimento de Formulários Studio.

Observação

Para treinar um modelo de modelo neural, defina a buildMode propriedade como neural. Para obter mais informações, consulteTreinamento de um modelo neural

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo neural personalizado O modelo neural personalizado é usado para extrair dados rotulados de documentos estruturados (pesquisas, questionários), semiestruturados (faturas, ordens de compra) e documentos não estruturados (contratos, cartas). Extrai dados de texto, caixas de seleção e campos tabulares de documentos estruturados e não estruturados. Reconhecimento de Formulários Studio
API REST
SDK do C#
SDK do Java
SDK do JavaScript
SDK do Python

Composto personalizado

Captura de tela de uma lista de modelo Composto Personalizado no Reconhecimento de Formulários Studio.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelos personalizados compostos Um modelo composto é criado com uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de tipos de formulário. Os modelos compostos são úteis quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulário semelhantes. Reconhecimento de Formulários Studio
API REST
SDK do C#
SDK do Java
SDK do JavaScript
SDK do Python

Modelo de classificação personalizada

{alt-text}

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelos de classificação compostos Os modelos de classificação personalizados combinam recursos de layout e linguagem para detectar, identificar e classificar documentos em um arquivo de entrada. ● Um aplicativo de empréstimo empacotado contendo formulário de aplicativo, contracheque e extrato bancário.
● Uma coleção de faturas digitalizadas.
Reconhecimento de Formulários Studio
API REST

Modelo de contrato (pré-visualização)

Captura de tela de extração de modelo de Contrato usando Reconhecimento de Formulários Studio.

Sobre Opções de desenvolvimento
Extrai o acordo de contrato e os detalhes da parte. Reconhecimento de Formulários Studio
API REST

Formulário de imposto dos EUA 1098 (pré-visualização)

Captura de tela do formulário de imposto dos EUA 1098 analisado pelo Reconhecedor de Formulário Studio.

Sobre Opções de desenvolvimento
Extrai informações e detalhes de juros da hipoteca. Reconhecimento de Formulários Studio
API REST

Formulário de imposto dos EUA 1098-E (pré-visualização)

Captura de tela do formulário de imposto dos EUA 1098-E analisado pelo Reconhecedor de Formulário Studio.

Sobre Opções de desenvolvimento
Extrai informações e detalhes do empréstimo estudantil. Reconhecimento de Formulários Studio
API REST

Formulário de imposto dos EUA 1098-T (versão prévia)

Captura de tela do formulário de imposto dos EUA 1098-T analisado pelo Reconhecedor de Formulário Studio.

Sobre Opções de desenvolvimento
Extrai informações e detalhes das mensalidades. Reconhecimento de Formulários Studio
API REST

O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para extrair textos, tabelas, estruturas e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

Tipo de modelo Nome do modelo
Modelo de análise de documentos Modelo de análise de layout
Modelos predefinidos Modelo de fatura
Modelo de recibo
Modelo de documento de ID (identidade)
Modelo de cartão de visita
Modelos personalizados Modelo personalizado
Modelo composto

Este artigo se aplica a:marca de seleção do Reconhecimento de Formulários v2.1Reconhecimento de Formulários v2.1. Versão posterior:Reconhecimento de Formulários v3.0

Recursos e opções de desenvolvimento do Reconhecimento de Formulários

Dica

  • Para obter uma experiência aprimorada e qualidade avançada do modelo, experimente o Estúdio de Reconhecimento de Formulários v3.0.
  • O Studio v3.0 dá suporte a qualquer modelo treinado usando os dados rotulados da v2.1.
  • Você pode consultar o guia de migração de API para obter informações detalhadas sobre como migrar da v2.1 para a v3.0.

Observação

Há suporte para os recursos e as opções de desenvolvimento a seguir no serviço de Reconhecimento de Formulários v2.1.

Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API:

Modelar Descrição Opções de desenvolvimento
Análise de layout Extração e análise de texto, marcas de seleção tabelas, e coordenadas de caixa delimitadora, a partir de formulários e documentos. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo personalizado Extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
Ferramenta de rotulagem de amostras
Contêiner do Docker do Reconhecimento de Formulários
Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de recibo Processamento automatizado de dados e extração de informações importantes de recibos de vendas. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de documento de ID (identidade) Processamento automatizado de dados e extração de informações importantes de carteiras de motorista dos EUA e passaportes internacionais. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários
Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita. Ferramenta de rotulagem do Reconhecimento de Formulários
API REST
SDK da biblioteca cliente
Contêiner do Docker do Reconhecimento de Formulários

Segurança e privacidade de dados

Assim como ocorre com todos os serviços de IA, os desenvolvedores que usam o serviço Reconhecimento de Formulários devem estar cientes das políticas da Microsoft referentes aos dados do cliente. Confira nossa página Dados, privacidade e segurança do Reconhecimento de Formulários.

Próximas etapas