Modelo de recibo de Document Intelligence

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
  • A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
  • E.U.A. Leste
  • Oeste dos EUA2
  • Europa Ocidental

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização) | Versões anteriores:Marca de verificação azulv3.1 (GA)Marca de verificação azulv3.0 (GA)Marca de verificação azulv2.1 (GA)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.0Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov3.0 (GA) | Últimas versões:marca de verificação roxav4.0 (preview)marca de verificação roxav3.1 | Versão anterior:Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov2.1 | Última versão:Marca de verificação azulv4.0 (pré-visualização)

O modelo de recibo Document Intelligence combina poderosas capacidades de Reconhecimento Ótico de Carateres (OCR) com modelos de aprendizagem profunda para analisar e extrair informações importantes dos recibos de vendas. Os recibos podem ser de vários formatos e qualidade, incluindo recibos impressos e manuscritos. A API extrai informações importantes, como nome do comerciante, número de telefone do comerciante, data da transação, impostos e total da transação e retorna dados JSON estruturados.

Tipos de recibos suportados:

  • Térmica
  • Cartão de Crédito
  • Gás
  • Estacionamento
  • Hotel
  • Transportes
  • Comunicação
  • Entretenimento
  • Voo
  • Formação
  • Farmácia/Medicina

Extração de dados de recibo

A digitalização de recibos engloba a transformação de vários tipos de recibos, incluindo cópias digitalizadas, fotografadas e impressas, em um formato digital para processamento simplificado a jusante. Exemplos incluem gestão de despesas, análise do comportamento do consumidor, automação fiscal, etc. O uso da inteligência documental com a tecnologia OCR (Optical Character Recognition) pode extrair e interpretar dados desses diversos formatos de recebimento. O processamento de Inteligência Documental simplifica o processo de conversão, mas também reduz significativamente o tempo e o esforço necessários, facilitando assim o gerenciamento e a recuperação eficientes de dados.

Exemplo de recibo processado com o Document Intelligence Studio:

Captura de tela de um recibo de amostra processado no Document Intelligence Studio.

Recibo de amostra processado com a ferramenta Document Intelligence Sample Labeling:

Captura de ecrã de um recibo de amostra processado com a ferramenta Etiquetagem de Amostra de Formulário.

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v2.1 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos
Modelo de recibo • Ferramenta
de etiquetagem de Inteligência Documental• API REST
SDK
de biblioteca cliente• Contêiner Docker de Inteligência Documental

Requisitos de entrada

  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lida
    Esquema ✔ (2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
    Documento Geral
    Pré-criado
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-pré-visualização)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca 8de -ponto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

  • Formatos de ficheiro suportados: JPEG, PNG, PDF e TIFF.
  • Permissão de página suportada para PDF e TIFF: o Document Intelligence pode processar até 2.000 páginas para assinantes de nível padrão ou apenas as duas primeiras páginas para assinantes de nível gratuito.
  • Tamanho do ficheiro suportado: menos de 50 MB; pixels mínimos: 50 x 50 px; máximo de pixels 10.000 x 10.000 px.

Extração de dados do modelo de recibo

Veja como o Document Intelligence extrai dados, incluindo hora e data das transações, informações do comerciante e totais de valores dos recibos. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Nota

O Document Intelligence Studio está disponível com APIs v3.1 e v3.0 e versões posteriores.

  1. Na home page do Document Intelligence Studio, selecione Recibos.

  2. Você pode analisar o recibo de amostra ou fazer upload de seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

    Captura de tela dos botões Executar análise e Analisar opções no Document Intelligence Studio.

Ferramenta de etiquetagem de exemplo de inteligência de documentos

  1. Navegue até a Ferramenta de Exemplo de Inteligência de Documentos.

  2. Na página inicial da ferramenta de exemplo, selecione o bloco Usar modelo pré-criado para obter dados .

    Captura de tela do processo de análise de resultados do modelo de layout.

  3. Selecione o Tipo de formulário a ser analisado no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar a partir das opções abaixo:

  5. No campo Origem, selecione URL no menu suspenso, cole o URL selecionado e selecione o botão Buscar.

    Captura de ecrã do menu pendente da localização de origem.

  6. No campo Ponto de extremidade do serviço de Inteligência Documental, cole o ponto de extremidade obtido com sua assinatura do Document Intelligence.

  7. No campo chave, cole a chave obtida do recurso Document Intelligence.

    Captura de tela do menu suspenso select-form-type.

  8. Selecione Executar análise. A ferramenta Document Intelligence Sample Labeling chama a API Analyze Prebuilt e analisa o documento.

  9. Exibir os resultados - veja os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detetadas.

    Captura de tela do modelo de layout analisar a operação de resultados.

Nota

A ferramenta Exemplo de etiquetagem não suporta o formato de ficheiro BMP. Esta é uma limitação da ferramenta e não do Serviço de Inteligência Documental.

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.

Extração de campo

Nome Tipo Description Saída padronizada
Tipo de recibo String Tipo de recibo de venda Discriminado
MerchantName String Nome do comerciante que emite o recibo
Número de telefone do comerciante phoneNumber Número de telefone listado do comerciante +1 xxx xxx xxxx
MerchantAddress String Endereço listado do comerciante
TransactionDate Date Data de emissão do recibo AAAA-MM-DD
TransactionTime Hora Hora de emissão do recibo HH-MM-SS (24 horas)
Total Número (USD) Total total de recebimento da transação Flutuação de duas casas decimais
Subtotal Número (USD) Subtotal do recebimento, muitas vezes antes da aplicação dos impostos Flutuação de duas casas decimais
Imposto Número (USD) Total de impostos no recebimento (geralmente imposto sobre vendas ou equivalente). Renomeado para "TotalTax" na versão 2022-06-30. Flutuação de duas casas decimais
Gorjeta Número (USD) Dica incluída pelo comprador Flutuação de duas casas decimais
Items Matriz de objetos Itens de linha extraídos, com nome, quantidade, preço unitário e preço total extraído
Nome Cadeia (de carateres) Descrição do artigo. Renomeado para "Descrição" na versão 2022-06-30.
Quantidade Número Quantidade de cada item Flutuação de duas casas decimais
Preço Número Preço individual de cada unidade de item Flutuação de duas casas decimais
PreçoTotal Número Preço total do item de linha Flutuação de duas casas decimais

Document Intelligence v3.0 e versões posteriores introduzem vários novos recursos e capacidades. Além dos recibos térmicos, o modelo de recibo suporta o processamento de recibos de hotel de página única e a extração de detalhes fiscais para todos os tipos de recibos.

O Document Intelligence v4.0 e versões posteriores introduz suporte para moeda para todos os campos relacionados a preços para recibos térmicos e de hotel.

Recibo

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
TransactionDate date Data de emissão do recibo Junho 06, 2019
TransactionTime time Hora de emissão do recibo 16:49
Subtotal number Subtotal do recebimento, muitas vezes antes da aplicação dos impostos $12.34
TotalTax number Imposto sobre o recebimento, muitas vezes imposto sobre vendas, ou equivalente 2,00 $
Tip number Dica incluída pelo comprador $1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item $999.00
Items.*.ProductCode string Código do produto, número do produto ou SKU associado ao item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency O valor do detalhe fiscal $999.00

recibo.retailMeal

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
TransactionDate date Data de emissão do recibo Junho 06, 2019
TransactionTime time Hora de emissão do recibo 16:49
Subtotal number Subtotal do recebimento, muitas vezes antes da aplicação dos impostos $12.34
TotalTax number Imposto sobre o recebimento, muitas vezes imposto sobre vendas, ou equivalente 2,00 $
Tip number Dica incluída pelo comprador $1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item $999.00
Items.*.ProductCode string Código do produto, número do produto ou SKU associado ao item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency O valor do detalhe fiscal $999.00

receipt.creditCard

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
TransactionDate date Data de emissão do recibo Junho 06, 2019
TransactionTime time Hora de emissão do recibo 16:49
Subtotal number Subtotal do recebimento, muitas vezes antes da aplicação dos impostos $12.34
TotalTax number Imposto sobre o recebimento, muitas vezes imposto sobre vendas, ou equivalente 2,00 $
Tip number Dica incluída pelo comprador $1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item $999.00
Items.*.ProductCode string Código do produto, número do produto ou SKU associado ao item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency O valor do detalhe fiscal $999.00

receipt.gas

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
TransactionDate date Data de emissão do recibo Junho 06, 2019
TransactionTime time Hora de emissão do recibo 16:49
Subtotal number Subtotal do recebimento, muitas vezes antes da aplicação dos impostos $12.34
TotalTax number Imposto sobre o recebimento, muitas vezes imposto sobre vendas, ou equivalente 2,00 $
Tip number Dica incluída pelo comprador $1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item $999.00
Items.*.ProductCode string Código do produto, número do produto ou SKU associado ao item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency O valor do detalhe fiscal $999.00

recibo.estacionamento

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-3210
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
TransactionDate date Data de emissão do recibo Junho 06, 2019
TransactionTime time Hora de emissão do recibo 16:49
Subtotal number Subtotal do recebimento, muitas vezes antes da aplicação dos impostos $12.34
TotalTax number Imposto sobre o recebimento, muitas vezes imposto sobre vendas, ou equivalente 2,00 $
Tip number Dica incluída pelo comprador $1,00
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Surface Pro 6
Items.*.Quantity number Quantidade de cada item 1
Items.*.Price number Preço individual de cada unidade de item $999.00
Items.*.ProductCode string Código do produto, número do produto ou SKU associado ao item de linha específico A123
Items.*.QuantityUnit string Unidade de quantidade de cada item
TaxDetails array
TaxDetails.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency O valor do detalhe fiscal $999.00

recibo.hotel

Campo Tipo Description Exemplo
MerchantName string Nome do comerciante que emite o recibo Contoso
MerchantPhoneNumber phoneNumber Número de telefone listado do comerciante 987-654-310
MerchantAddress address Endereço listado do comerciante 123 Main St. Redmond, Washington 98052
Total number Total total de recebimento da transação $14.34
ArrivalDate date Data de chegada 27Mar21
DepartureDate date Data de partida 28Mar21
Currency string Unidade monetária dos montantes de recebimento (ISO 4217), ou «MISTA» se forem encontrados vários valores USD
MerchantAliases array
MerchantAliases.* string Nome alternativo do comerciante Contoso (R)
Items array
Items.* object Item de linha extraído 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Preço total do item de linha $999.00
Items.*.Description string Descrição do artigo Taxa do quarto
Items.*.Date date Data do artigo 27Mar21
Items.*.Category string Categoria do item Sala

Guia de migração e API REST v3.1

  • Siga nosso guia de migração do Document Intelligence v3.1 para saber como usar a versão v3.1 em seus aplicativos e fluxos de trabalho.

Próximos passos

  • Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.

  • Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.