O que é a IA do Azure para Informação de Documentos?

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
  • Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
  • Leste dos EUA
  • Oeste dos EUA 2
  • Oeste da Europa

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (GA)marca de seleção azulv3.0 (GA)marca de seleção azulv2.1 (GA)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0marca de seleção azulv2.1

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

Observação

O Reconhecimento de Formulários passou a se chamar IA do Azure para Informação de Documentos!

  • A partir de julho de 2023, os serviços de IA do Azure passaram a abranger tudo o que antes era conhecido como Serviços Cognitivos e Serviços de IA Aplicada do Azure.
  • Não houve alterações nos preços.
  • Os nomes Serviços Cognitivos e IA Aplicada do Azure continuam a ser usados nas APIs de cobrança, análises de custo, listas de preços e preço do Azure.
  • Não há mudanças significativas nas APIs (interfaces de programação de aplicativo) ou SDKs na v3.1 ou anteriores. A partir da v4.0, as APIs e os SDKs são atualizados para o Informação de Documentos.
  • Algumas plataformas ainda estão aguardando a atualização de renomeação. Todas as menções ao Reconhecimento de Formulários ou à Informação de Documentos na nossa documentação se referem ao mesmo serviço do Azure.

A IA do Azure para Informação de Documentos é um Serviço de IA do Azure que permite que você crie soluções inteligentes de processamento de documentos. Grandes quantidades de dados, abrangendo uma ampla variedade de tipos de dados, são armazenadas em formulários e documentos. O serviço de Informação de Documentos permite que você gerencie com eficácia a velocidade com que os dados são coletados e processados e é fundamental para operações aprimoradas, decisões bem-fundamentadas orientadas por dados e uma inovação esclarecida.

| ✔️ Modelos de análise de documento | ✔️ Modelos predefinidos | ✔️ Modelos personalizados |

Modelos de análise de documentos

Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, o uso ou o progresso da sua organização.


Leitura |Extrair texto impresso
e manuscrito.


Layout | Extrair texto, tabelas
e estrutura do documento.


Leitura |Extrair texto impresso
e manuscrito.


Layout | Extrair texto, tabelas
e estrutura do documento.


Documento geral: | Extrai texto,
estrutura e pares chave-valor.

Modelos predefinidos

Os modelos predefinidos do Reconhecimento de Formulários do Azure permitem adicionar o processamento de documentos inteligente aos seus aplicativos e fluxos sem precisar treinar e criar seus próprios modelos.


Fatura | Extrair os detalhes do cliente
e do fornecedor.


Recibo | Extrair detalhes da transação de vendas
.


Identidade | Extrair detalhes de identificação
e verificação.


1003 EULA | Extraia detalhes da hipoteca.


Formulário 1008 | Extraia detalhes da hipoteca.


Divulgação de fechamento | Extraia detalhes da hipoteca.


Cartão do seguro de saúde | Extrair detalhes do
seguro de saúde.


Contrato | Extrair detalhes do contrato
e da parte.


Cartão de crédito/débito | Extraia informações de cartões bancários.


Certificado de casamento | Extraia informações de certificados de casamento.


Formulário W-2 de Imposto dos EUA | Extrair detalhes de compensação tributáveis
.


Formulário de Imposto dos EUA 1098 | Extrair detalhes de juros da hipoteca.


Formulário 1098-E de Imposto dos EUA | Extrair detalhes de juros do empréstimo estudantil.


Formulário de Imposto dos EUA 1098-T | Extrair detalhes de mensalidades qualificadas.


Formulário do Imposto dos EUA 1099 | Extraia as informações de variações do formulário 1099.


Formulário 1040 do Imposto dos EUA | Extraia informações de variações do formulário 1040.


Fatura | Extrair os detalhes do cliente
e do fornecedor.


Recibo | Extrair detalhes da transação de vendas
.


Identidade | Extrair detalhes de identificação
e verificação.


🆕 Cartão de seguro-saúde | Extrair detalhes do seguro-saúde.


Cartão de negócios | Extrair detalhes de contato comercial.


Contrato | Extrair detalhes do contrato
e da parte.


Formulário W-2 de Imposto dos EUA | Extrair detalhes de compensação tributáveis
.


Formulário de Imposto dos EUA 1098 | Extrair detalhes de juros da hipoteca.


Formulário 1098-E de Imposto dos EUA | Extrair detalhes de juros do empréstimo estudantil.


Formulário de Imposto dos EUA 1098-T | Extrair detalhes de mensalidades qualificadas.

Modelos personalizados

  • Modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de formulários e documentos, específicos para seus casos de uso.
  • Modelos personalizados autônomos podem ser combinados para criar modelos compostos.
  • Modelos de extração
    ✔️ Os modelos de extração personalizados são treinados para extrair campos rotulados de documentos.


Modelo personalizado | Extrair dados de layouts estáticos.


Neural personalizado | Extrair dados de documentos de tipo misto.


Composto personalizado | Extrair dados usando uma coleção de modelos.

  • Modelo de classificação
    ✔️ os classificadores personalizados identificam os tipos de documentos antes de invocar um modelo de extração.


Classificador personalizado | Identifica os tipos de documentos designados (classes)
antes de invocar um modelo de extração.

Funcionalidades de complemento

O Document Intelligence dá suporte a recursos opcionais que podem ser habilitados e desabilitados dependendo do cenário de extração de documentos. Os seguintes recursos de complemento estão disponíveis para 2023-07-31 (GA) e versões posteriores:

O Document Intelligence dá suporte a recursos opcionais que podem ser habilitados e desabilitados dependendo do cenário de extração de documentos. Os seguintes recursos de complemento estão disponíveis para2024-02-29-previewversões 2023-10-31-previewposteriores e posteriores:

Recursos de análise

ID do Modelo Extração de conteúdo Campos de consulta Parágrafos Funções de Parágrafo Marcas de Seleção Tabelas Pares Chave-Valor Idiomas Códigos de barras Análise de Documentos Fórmulas* Fonte de estilo* Alta Resolução*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variações) O O O O O
prebuilt-tax.us.1040(variações) O O O O O
{ customModelName } O O O O O

✓ – Habilitado
O – opcional
* – os recursos Premium incorrem em custos extras

Modelos e opções de desenvolvimento

Observação

Os modelos de reconhecimento de documentos e opções de desenvolvimento a seguir são compatíveis com o serviço de Informação de Documentos v3.0.

Use a Informação de Documentos para automatizar o processamento de dados em aplicativos e fluxos de trabalho, aprimorar as estratégias orientadas por dados e obter funcionalidades avançadas de pesquisa de documentos. Use os links da tabela para saber mais sobre cada modelo e procurar as opções de desenvolvimento.

Ler

Captura de tela de análise de modelo de Leitura usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-read ● Extração de texto de documentos.
Extração de dados
● Digitalização de qualquer documento.
● Conformidade e auditoria.
● Processamento de anotações manuscritas antes da tradução.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Layout

Captura de tela de análises de modelo de layout usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-layout ● Extração de informações de texto e layout de documentos.
Extração de dados
● Indexação e recuperação de documentos por estrutura.
● Análise de relatório financeiro e médico.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Documento geral (preterido na 2023-10-31-preview)

Captura de tela de análise de modelo de Documento Geral usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-document ● Extrair pares de texto, layout e chave-valor de documentos.
Extração de dados e campos
● Extração de pares chave-valor.
● Processamento de formulários.
● Coleta e análise de dados de pesquisa.
Estúdio de Informação de Documentos
API REST

Fatura

Captura de tela de análises de modelo de Fatura usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-invoice ● Extrair informações importantes de faturas.
Extração de dados e campos
● Processamento de contas a pagar.
● Registro e relatório de impostos automatizados.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Receipt

Captura de tela de análise de modelo de Recibo usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-receipt ● Extrair informações importantes de recibos.
Extração de dados e campos
● O modelo de recibo v3.0 dá suporte ao processamento de recibos de hotel de página única.
● Gestão de despesas.
● Análise de dados de comportamento do consumidor.
● Programa de fidelização de clientes.
● Processamento de devolução de mercadorias.
● Registro e relatório de impostos automatizados.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Identidade (ID)

Captura de tela de análise de modelo de Documento de Identidade (ID) usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-idDocument ● Extrai informações importantes de passaportes e cartões de identificação.
Tipos de documentação
●Extrai endossos, restrições e classificações de veículos de carteiras de motorista dos EUA.
● Conheça a conformidade com as diretrizes de serviços financeiros (KYC) do seu cliente.
● Gestão de contas médicas.
● Pontos de verificação de identidade e gateways.
● Registro no hotel.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

cartão do seguro de saúde

Captura de tela de análise de modelo de cartão do Seguro Saúde usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-healthInsuranceCard.us ● Extrair informações importantes de cartões de seguro de saúde dos EUA.
Extração de dados e campos
● Verificação de cobertura e qualificação.
● Modelagem preditiva.
● Análise baseada em valor.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Modelo de contrato

Captura de tela de extração de modelo de Contrato usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Opções de desenvolvimento
prebuilt-contract Extrai o acordo de contrato e os detalhes da parte. Estúdio de Informação de Documentos
API REST

Modelo W-2 de impostos dos EUA

Captura de tela de análise de modelo do Formulário W-2 (Receita Federal dos EUA) usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-tax.us.W-2 ● Extrair informações importantes dos formulários fiscais do IRS US W2 (ano 2018-2021).
Extração de dados e campos
● Gerenciamento automatizado de documentos fiscais.
● Processamento de pedido de empréstimo hipotecário.
Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Formulário EUA 1098

Captura de tela do formulário de declaração de imposto de renda dos EUA US 1098 analisado no Estúdio de Informação de Documentos.

ID do Modelo Descrição Opções de desenvolvimento
prebuilt-tax.us.1098 Extrai informações e detalhes de juros da hipoteca. Estúdio de Informação de Documentos
API REST

Formulário EUA 1098-E

Captura de tela do formulário de declaração de imposto de renda dos EUA US 1098-E analisado no Estúdio de Informação de Documentos.

ID do Modelo Descrição Opções de desenvolvimento
prebuilt-tax.us.1098E Extrai informações e detalhes do empréstimo estudantil. Estúdio de Informação de Documentos
API REST

Formulário EUA 1098-T

Captura de tela do formulário de declaração de imposto de renda dos EUA US 1098-T analisado no Estúdio de Informação de Documentos.

ID do Modelo Descrição Opções de desenvolvimento
prebuilt-tax.us.1098T Extrai informações e detalhes das mensalidades. Estúdio de Informação de Documentos
API REST

Formulário de imposto dos EUA 1099 (e Variações)

Captura de tela do formulário de declaração de imposto de renda dos EUA US 1099 analisado no Estúdio de Informação de Documentos.

ID do Modelo Descrição Opções de desenvolvimento
prebuilt-tax.us.1099(Variações) Extrair informações de variações do formulário 1099. Estúdio de Informação de Documentos
API REST

Cartão de visita

Captura de tela de análise de modelo de cartão de visitas usando o Estúdio de Informação de Documentos.

ID do Modelo Descrição Casos de uso de automação Opções de desenvolvimento
prebuilt-businessCard ● Extrair informações importantes de cartões corporativos.
Extração de dados e campos
● Vendas potenciais e gestão de marketing. Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Visão geral do modelo personalizado

Captura de tela de treinamento de modelo Personalizado usando o Estúdio de Informação de Documentos.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo personalizado Extrai informações de formulários e documentos em dados estruturados com base em um modelo criado a partir de um conjunto de formulários de treinamento representativos. Extrai dados de formulários e documentos específicos à sua empresa e casos de uso. Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Template personalizado

Captura de tela de análise de modelo de um Modelo Personalizado usando o Estúdio de Informação de Documentos.

Observação

Para treinar um modelo de modelo personalizado, defina a buildMode propriedade como template. Para obter mais informações, consulteTreinamento de um modelo de modelo de máquina virtual personalizado

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo de modelo de máquina virtual personalizado O modelo personalizado extrai valores e campos rotulados de documentos estruturados e semiestruturados.
Extrai dados importantes de documentos altamente estruturados com modelos visuais definidos ou layouts visuais comuns, formulários. Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Neural personalizado

Captura de tela de análise de modelo Neural Personalizado usando o Estúdio de Informação de Documentos.

Observação

Para treinar um modelo de modelo neural, defina a buildMode propriedade como neural. Para obter mais informações, consulteTreinamento de um modelo neural

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelo neural personalizado O modelo neural personalizado é usado para extrair dados rotulados de documentos estruturados (pesquisas, questionários), semiestruturados (faturas, ordens de compra) e documentos não estruturados (contratos, cartas). Extrai dados de texto, caixas de seleção e campos tabulares de documentos estruturados e não estruturados. Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Composto personalizado

Captura de tela de uma lista de modelos Personalizados Compostos no Estúdio de Informação de Documentos.

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelos personalizados compostos Um modelo composto é criado com uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de tipos de formulário. Os modelos compostos são úteis quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulário semelhantes. Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
JavaScript

Modelo de classificação personalizada

{alt-text}

Sobre Descrição Casos de uso de automação Opções de desenvolvimento
Modelos de classificação compostos Os modelos de classificação personalizados combinam recursos de layout e linguagem para detectar, identificar e classificar documentos em um arquivo de entrada. ● Um aplicativo de empréstimo empacotado contendo formulário de aplicativo, contracheque e extrato bancário.
● Uma coleção de faturas digitalizadas.
Estúdio de Informação de Documentos
API REST

A IA do Azure para Informação de Documentos é um serviço de IA Aplicada do Azure baseado em nuvem para os desenvolvedores criarem soluções inteligentes de processamento de documentos. O serviço de Informação de Documentos aplica o reconhecimento óptico de caracteres (OCR) baseado em aprendizado de máquina e as tecnologias de reconhecimento de documentos para extrair textos, tabelas, estruturas e pares de chave-valor dos documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, confira as páginas de conceitos:

Tipo de modelo Nome do modelo
Modelo de análise de documentos Modelo de análise de layout
Modelos predefinidos Modelo de fatura
Modelo de recibo
Modelo de documento de ID (identidade)
Modelo de cartão de visita
Modelos personalizados Modelo personalizado
Modelo composto

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

Modelos e opções de desenvolvimento do recurso Informação de Documentos

Dica

  • Para obter uma experiência aprimorada e modelos de qualidade avançada, experimente o Estúdio de Informação de Documentos v3.0.
  • O Studio v3.0 dá suporte a qualquer modelo treinado usando os dados rotulados da v2.1.
  • Você pode consultar o guia de migração de API para obter informações detalhadas sobre como migrar da v2.1 para a v3.0.

Observação

Os modelos e opções de desenvolvimento a seguir são compatíveis com o recurso Informação de Documentos v2.1.

Use os links da tabela para saber mais sobre cada modelo e navegar pelas referências de API:

Modelar Descrição Opções de desenvolvimento
Análise de layout Extração e análise de texto, marcas de seleção tabelas, e coordenadas de caixa delimitadora, a partir de formulários e documentos. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos
Modelo personalizado Extração e análise de dados de formulários e documentos específicos de dados corporativos distintos e casos de uso. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
Amostra da ferramenta de rotulagem
Contêiner do Docker da Informação de Documentos
Modelo de fatura Processamento automatizado de dados e extração de informações importantes de faturas de vendas. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos
Modelo de recibo Processamento automatizado de dados e extração de informações importantes de recibos de vendas. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos
Modelo de documento de ID (identidade) Processamento automatizado de dados e extração de informações importantes de carteiras de motorista dos EUA e passaportes internacionais. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos
Modelo de cartão de visita Processamento automatizado de dados e extração de informações importantes de cartões de visita. Ferramenta de rotulagem do recurso Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos

Segurança e privacidade de dados

Assim como ocorre com todos os serviços de IA, os desenvolvedores que usam o serviço de Informação de Documentos devem estar cientes das políticas da Microsoft relativas aos dados de clientes. Confira a nossa página de Dados, privacidade e segurança para Informação de Documentos.

Próximas etapas