O que é o Reconhecimento de Formulários do Azure?
Este artigo se aplica a:Reconhecimento de Formulários v3.0. Versão anterior:Reconhecimento de Formulários v2.1
O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para classificar documentos, extrair textos, tabelas, estruturas e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:
Tipo de modelo | Nome do modelo |
---|---|
Modelos de análise de documentos | ● OCR de Leitura ● Análise de layout ● Documento geral |
Modelos predefinidos | ● Cartão de seguro de saúde ● Formulário W-2 ● Fatura ● Recibo ● Documento de identidade (ID) ● Cartão de visita |
Modelos personalizados | ● Visão geral do modelo personalizado ● Modelos de extração ○ Modelo personalizado ○ Neural personalizado ● Modelo classificador ○ Classificador personalizado ● Modelo composto |
Modelos de pré-visualização restritos Para solicitar acesso aos modelos de pré-visualização restritos no Estúdio de Reconhecimento de Formulários, preencha e envie o formulário de solicitação de pré-visualização privada do Reconhecimento de Formulários. |
● Documento geral com campos de consulta ● Contrato ● Cartão de vacinação ● Formulário fiscal dos EUA 1098 ● Formulário fiscal dos EUA 1098-E ● Formulário fiscal dos EUA 1098-T |
Qual recurso do Reconhecimento de Formulários devo usar?
Esta seção ajuda você a decidir qual modelo do Reconhecimento de Formulários v3.0 você deve usar no seu aplicativo:
Tipo de documento | Dados para extrair | Formato do documento | Sua melhor solução |
---|---|---|---|
Um documento genérico como um contrato ou uma carta. | Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados. | O documento é escrito ou impresso em um idioma com suporte. | Ler o modelo OCR |
Um documento que inclui informações estruturais, como um relatório ou estudo. | Além do texto, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. | O documento é escrito ou impresso em um idioma com suporte | Modelo de análise de layout |
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos e valores, como um aplicativo de crédito ou formulário de pesquisa. | Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. | O formulário ou documento é um formato padronizado comumente usado em sua empresa ou setor e impresso em um idioma com suporte. | Modelo de documento geral |
Formulário W-2 dos EUA | Você quer extrair informações importantes, como salário, remunerações e impostos retidos dos formulários fiscais W2 dos EUA. | O documento W-2 está em Estados Unidos texto em inglês (en-US). | Modelo W-2 |
Fatura | Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. | O documento é escrito ou impresso em um idioma com suporte. | Modelo de fatura |
Receipt | Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. | O documento é escrito ou impresso em um idioma com suporte. | Modelo de recibo |
Documento de ID (identidade) como um passaporte ou carteira de motorista. | Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. | Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). | Modelo de documento de ID (identidade) |
Cartão de visita | Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. | O documento de cartão de visita está em inglês ou em japonês. | Modelo de cartão de visita |
Documentos específicos do aplicativo | Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. | Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. | Modelo de extração personalizado |
Documentos de tipo misto | Você deseja classificar documentos ou dividir um arquivo em documentos individuais. | Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. | Modelo de classificação personalizada |
Dica
- Se você ainda não tiver certeza de qual modelo usar, experimente o modelo de Documento Geral para extrair pares chave-valor.
- O modelo de Documento Geral é habilitado pelo mecanismo OCR de Leitura para detectar linhas de texto, palavras, locais e idiomas.
- O documento geral também extrai os mesmos dados que o modelo de layout do documento (páginas, tabelas, estilos).
Modelos de processamento de documentos e opções de desenvolvimento
Observação
Há suporte para os modelos de reconhecimento de documento e opções de desenvolvimento a seguir no serviço Reconhecimento de Formulários v3.0.
Você pode usar o Reconhecimento de Formulários para automatizar o processamento de documento em aplicativos e fluxos de trabalho, aprimorar as estratégias controladas por dados e enriquecer as funcionalidades de pesquisa de documentos. Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API.
Modelar | Descrição | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Ler o modelo OCR | Extrai linhas de texto, palavras, idiomas detectados e estilo manuscrito, se detectado. | ● Processamento de contrato. ● Processamento de relatórios financeiros ou médicos. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo de documento geral | Extrai texto, tabelas, estrutura e pares chave-valor. | ● Extração de pares chave-valor. ● Processamento de formulários. ● Coleta e análise de dados de pesquisa. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo de análise de layout | Extraia texto, marcas de seleção e estrutura de tabelas de formulários e documentos, juntamente com as respectivas coordenadas de caixa delimitadora. A API de Layout foi atualizada para um modelo predefinido. |
● Indexação e recuperação de documentos por estrutura. ● Pré-processamento antes da análise de OCR. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo personalizado (atualizado) | Classificação, extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso. A API de modelo personalizado v3.0 dá suporte a dois tipos de modelo:● O Modelo de Classificador Personalizado é usado para identificar e dividir tipos de documentos. ● O Modelo de Extração Personalizada é usado para analisar formulários ou documentos e extrair campos e tabelas específicos. Modelo personalizado e neural personalizado são os dois tipos de modelos de extração personalizados. |
● Identificação e extração de dados de documentos exclusivos para sua empresa, afetados por uma mudança de regulamentação ou evento de mercado. ● Identificação e análise de dados exclusivos ignorados anteriormente. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Formulário W-2 | Extrair informações relatadas em cada caixa em um formulário W-2. | ● Gerenciamento automatizado de documentos fiscais. ● Processamento de pedido de empréstimo hipotecário. |
● Estúdio do Reconhecimento de Formulários● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo de fatura | Processamento automatizado de dados e extração de informações importantes de faturas de vendas. | ● Processamento de contas a pagar. ● Registro e relatório de impostos automatizados. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python |
Modelo de recibo (atualizado) | Processamento automatizado de dados e extração de informações importantes de recibos de vendas. O modelo de recibo v3.0 dá suporte ao processamento de . |
● Gestão de despesas. ● Análise de dados de comportamento do consumidor. ● Programa de fidelização de clientes. ● Processamento de devolução de mercadorias. ● Registro e relatório de impostos automatizados. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo de documento de identidade (ID) (atualizado) | Processamento automatizado de dados e extração de informações importantes de carteiras de habilitação dos EUA e passaportes internacionais. A API de documento de ID pré-construída dá suporte à . |
● Conheça a conformidade com as diretrizes de serviços financeiros (KYC) do seu cliente. ● Gestão de contas médicas. ● Pontos de verificação de identidade e gateways. ● Registro no hotel. |
● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Modelo de cartão de visita | Processamento automatizado de dados e extração de informações importantes de cartões de visita. | ● Vendas potenciais e gestão de marketing. | ● Estúdio do Reconhecimento de Formulários ● API REST ● SDK do C# ● SDK do Python ● SDK do Java ● JavaScript |
Este artigo aplica-se a:Reconhecimento de Formulários v2.1. Versão posterior:Reconhecimento de Formulários v3.0
O Reconhecimento de Formulários do Azure é um Serviço de IA Aplicada do Azure baseado em nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Reconhecimento de Formulários aplica o OCR (reconhecimento óptico de caracteres) baseado em aprendizado de máquina e as tecnologias de compreensão de documentos para extrair textos, tabelas, estruturas e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:
Tipo de modelo | Nome do modelo |
---|---|
Modelo de análise de documentos | ● Modelo de análise de layout |
Modelos predefinidos | ● Modelo de fatura ● Modelo de recibo ● Modelo de documento de ID (identidade) ● Modelo de cartão de visita |
Modelos personalizados | ● Modelo personalizado ● Modelo composto |
Qual modelo de processamento de documentos devo usar?
Esta seção ajuda você a decidir qual recurso do Reconhecimento de Formulários v2.1 você deve usar para seu aplicativo:
Tipo de documento | Dados para extrair | Formato do documento | Sua melhor solução |
---|---|---|---|
Um documento que inclui informações estruturais, como um relatório ou estudo. | Além do texto, você precisa extrair informações estruturais como tabelas e marcas de seleção. | O documento é escrito ou impresso em um idioma com suporte | Modelo de análise de layout |
Fatura | Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido de faturas. | O documento é escrito ou impresso em um idioma com suporte. | Modelo de fatura |
Receipt | Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações de um recibo de hotel de página única ou vendas. | O documento é escrito ou impresso em um idioma com suporte. | Modelo de recibo |
Documento de ID (identidade) como um passaporte ou carteira de motorista. | Você deseja extrair informações importantes, como nome, sobrenome e data de nascimento de carteiras de motorista dos EUA ou passaportes internacionais. | Seu documento de identificação é uma carteira de motorista dos EUA ou a página biográfica de um passaporte internacional (não um visto). | Modelo de documento de identificação |
Cartão de visita | Você deseja extrair informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone de cartões de visita. | O documento de cartão de visita está em inglês ou em japonês. | Modelo de cartão de visita |
Documentos de tipo misto | Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. | Você tem vários documentos com elementos estruturados, semiestruturados e/ou não estruturados. | Modelo personalizado |
Recursos e opções de desenvolvimento do Reconhecimento de Formulários
Dica
- Para obter uma experiência aprimorada e qualidade avançada do modelo, experimente o Estúdio de Reconhecimento de Formulários v3.0.
- O Studio v3.0 dá suporte a qualquer modelo treinado usando os dados rotulados da v2.1.
- Você pode consultar o guia de migração de API para obter informações detalhadas sobre como migrar da v2.1 para a v3.0.
Observação
Há suporte para os recursos e as opções de desenvolvimento a seguir no serviço de Reconhecimento de Formulários v2.1.
Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API:
Segurança e privacidade de dados
Assim como ocorre com todos os serviços de IA, os desenvolvedores que usam o serviço Reconhecimento de Formulários devem estar cientes das políticas da Microsoft referentes aos dados do cliente. Confira nossa página Dados, privacidade e segurança do Reconhecimento de Formulários.
Próximas etapas
Experimente processar seus próprios formulários e documentos com o Estúdio de Reconhecimento de Formulários
Conclua um início rápido do Reconhecimento de Formulários e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Experimente processar seus próprios formulários e documentos com a Ferramenta de rotulagem de exemplo de Reconhecimento de Formulários
Conclua um início rápido do Reconhecimento de Formulários e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.