Modelo de recibo da Informação de Documentos

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
  • Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
  • Leste dos EUA
  • Oeste dos EUA 2
  • Oeste da Europa

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (GA)marca de seleção azulv3.0 (GA)marca de seleção azulv2.1 (GA)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0marca de seleção azulv2.1

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

O modelo de recibo da Informação de Documentos combina recursos avançados de OCR (Reconhecimento Óptico de Caracteres) com modelos de aprendizado profundo para analisar e extrair informações importantes dos recibos de vendas. Os recibos podem ser de vários formatos e qualidade, incluindo recibos impressos e manuscritos. A API extrai informações importantes, como o nome do comerciante, o número de telefone do comerciante, a data da transação, o imposto e o total da transação e retorna os dados JSON estruturados.

Tipos de recibo com suporte:

  • Térmico
  • Cartão de crédito
  • Gasolina
  • Estacionamento
  • Hotel
  • Transporte
  • Comunicação
  • Entretenimento
  • Voo
  • Treinamento
  • Farmácia/Médico

Extração de dados de recibo

A digitalização de recibos abrange a transformação de vários tipos de recibos, incluindo cópias digitalizadas, fotografadas e impressas, em um formato digital para processamento downstream simplificado. Os exemplos incluem gerenciamento de despesas, análise de comportamento do consumidor, automação de impostos etc. O uso da Informação de Documentos com a tecnologia OCR (Reconhecimento Óptico de Caracteres) pode extrair e interpretar dados desses diversos formatos de recibo. O processamento da Informação de Documentos simplifica o processo de conversão, mas também reduz significativamente o tempo e o esforço necessários, facilitando assim o gerenciamento e a recuperação de dados eficientes.

Recibo de exemplo processado com o Estúdio da Informação de Documentos:

Captura de tela do exemplo de recibo processado no Estúdio da Informação de Documentos.

Opções de desenvolvimento

A Informação de Documentos v4.0 (2024-02-29-preview, 2023-10-31-preview) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de recibo Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-receipt

A Informação de Documentos v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de recibo Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-receipt

A Informação de Documentos v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de recibo Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-receipt

O Document Intelligence v2.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo de recibo Ferramenta de rotulagem da Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos

Requisitos de entrada

  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Formatos de arquivo com suporte:

    Modelar PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Ler
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-preview)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

  • Formatos de arquivo com suporte: JPEG, PNG, PDF e TIFF.
  • Permissão de página com suporte para PDF e TIFF, a Informação de Documentos s pode processar até 2.000 mil páginas para assinantes da camada Standard ou apenas as duas primeiras páginas para assinantes da camada gratuita.
  • Tamanho do arquivo com suporte: inferior a 50 MB; mínimo de pixels 50 x 50 px; máximo de pixels: 10.000 x 10.000 px.

Extração de dados do modelo de recibo

Veja como a Informação de Documentos extrai dados dos recibos, incluindo a hora e a data das transações, as informações do comerciante e os valores totais. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Observação

O Estúdio da Informação de Documentos está disponível com APIs v3.1 e v3.0 e versões posteriores.

  1. Na página inicial da Informação de Documentos Studio, selecione Recibos.

  2. Você pode analisar o documento de amostra ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Ferramenta de Rotulagem de Amostra da Informação de Documentos

  1. Navegue até a Ferramenta de Exemplo da Informação de Documentos.

  2. Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.

    Captura de tela do processo de análise de resultados do modelo de layout.

  3. Selecione o Tipo de Formulário que deseja analisar no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:

  5. No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.

    Captura de tela do menu suspenso do local de origem.

  6. No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.

  7. No campo chave, cole a chave obtida do recurso Informação de Documentos.

    Captura de tela do menu suspenso de tipo seleção de tipo de formulário.

  8. Selecione Executar análise. A ferramenta de rotulagem de exemplo da Informação de Documentos chamará a API predefinida Analisar e analisará o documento.

  9. Veja os resultados: confira os pares chave-valor extraídos, os itens de linha, o texto realçado extraído e as tabelas detectadas.

    Captura de tela da operação de análise de resultados do modelo de layout.

Observação

A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.

Idiomas e localidades com suporte

Confira nossa página Suporte ao idioma – modelos predefinidos, para obter uma lista completa dos idiomas compatíveis.

Extração de campo

Nome Tipo Descrição Saída padronizada
ReceiptType String Tipo de recibo de vendas Itemizado
MerchantName String Nome do comerciante que está emitindo o recibo
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante +1 xxx xxx xxxx
MerchantAddress String Endereço listado do comerciante
Data da transação Data Data em que o recibo foi emitido aaaa-mm-dd
TransactionTime Hora Hora em que o recibo foi emitido hh-mm-ss (24 horas)
Total Número (USD) Total de transações completas do recibo Float com duas casas decimais
Subtotal Número (USD) Subtotal do recibo, geralmente antes da aplicação de impostos Float com duas casas decimais
Imposto Número (USD) Imposto total no recibo (geralmente imposto sobre vendas ou equivalente). Renomeado para "TotalTax" na versão 2022-06-30-preview. Float com duas casas decimais
Dica Número (USD) Gorjeta incluída pelo comprador Float com duas casas decimais
Itens Matriz de objetos Itens de linha extraídos, com nome, quantidade, preço unitário e preço total extraído
Nome String Descrição do item. Renomeado para "Description" na versão 2022-06-30.
Quantidade Número Quantidade de cada item Float com duas casas decimais
Preço Número Preço individual de cada unidade de item Float com duas casas decimais
TotalPrice Número Preço total do item de linha Float com duas casas decimais

A Informação de Documentos v3.0 e versões posteriores apresentam vários novos recursos e recursos. Além dos recibos térmicos, o modelo Recibo dá suporte ao processamento de recibo de hotel de página única e à extração de detalhes fiscais para todos os tipos de recibo.

A Informação de Documento v4.0 e versões posteriores introduzem suporte para moeda em todos os campos relacionados a preços para recibos térmicos e de hotéis.

Recebimento

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
TransactionDate date Data em que o recibo foi emitido 06 de junho de 2019
TransactionTime time Hora em que o recibo foi emitido 16h49
Subtotal number Subtotal do recibo, geralmente antes da aplicação de impostos US$ 12,34
TotalTax number Imposto no recibo, geralmente o imposto sobre vendas, ou equivalente $2.00
Tip number Gorjeta incluída pelo comprador US$ 1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item US$ 999,00
Items.*.ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
TaxDetails.*.Amount currency O valor do detalhe do imposto US$ 999,00

receipt.retailMeal

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
TransactionDate date Data em que o recibo foi emitido 06 de junho de 2019
TransactionTime time Hora em que o recibo foi emitido 16h49
Subtotal number Subtotal do recibo, geralmente antes da aplicação de impostos US$ 12,34
TotalTax number Imposto no recibo, geralmente o imposto sobre vendas, ou equivalente $2.00
Tip number Gorjeta incluída pelo comprador US$ 1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item US$ 999,00
Items.*.ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
TaxDetails.*.Amount currency O valor do detalhe do imposto US$ 999,00

receipt.creditCard

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
TransactionDate date Data em que o recibo foi emitido 06 de junho de 2019
TransactionTime time Hora em que o recibo foi emitido 16h49
Subtotal number Subtotal do recibo, geralmente antes da aplicação de impostos US$ 12,34
TotalTax number Imposto no recibo, geralmente o imposto sobre vendas, ou equivalente $2.00
Tip number Gorjeta incluída pelo comprador US$ 1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item US$ 999,00
Items.*.ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
TaxDetails.*.Amount currency O valor do detalhe do imposto US$ 999,00

receipt.gas

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
TransactionDate date Data em que o recibo foi emitido 06 de junho de 2019
TransactionTime time Hora em que o recibo foi emitido 16h49
Subtotal number Subtotal do recibo, geralmente antes da aplicação de impostos US$ 12,34
TotalTax number Imposto no recibo, geralmente o imposto sobre vendas, ou equivalente $2.00
Tip number Gorjeta incluída pelo comprador US$ 1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item US$ 999,00
Items.*.ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
TaxDetails.*.Amount currency O valor do detalhe do imposto US$ 999,00

receipt.parking

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
TransactionDate date Data em que o recibo foi emitido 06 de junho de 2019
TransactionTime time Hora em que o recibo foi emitido 16h49
Subtotal number Subtotal do recibo, geralmente antes da aplicação de impostos US$ 12,34
TotalTax number Imposto no recibo, geralmente o imposto sobre vendas, ou equivalente $2.00
Tip number Gorjeta incluída pelo comprador US$ 1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item US$ 999,00
Items.*.ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
TaxDetails.*.Amount currency O valor do detalhe do imposto US$ 999,00

receipt.hotel

Campo Type Descrição Exemplo
MerchantName string Nome do comerciante que está emitindo o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-310
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total de transações completas do recibo US$ 14,34
ArrivalDate date Data de chegada 27Mar21
DepartureDate date Data de partida 28Mar21
Currency string Unidade de moeda dos valores de recibo (ISO 4217), ou "MIXED" se forem encontrados vários valores USD
MerchantAliases array
MerchantAliases.* string Nome alternativo do comerciante Contoso (R)
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
US$ 999,00
US$ 999,00
Items.*.TotalPrice number Preço total do item de linha US$ 999,00
Items.*.Description string Descrição do item Encargo de Sala
Items.*.Date date Data do item 27Mar21
Items.*.Category string Categoria do item Sala

Guia de migração e API REST v3.1

Próximas etapas