Modello di ricevuta di Intelligence sui documenti
Importante
- Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
- L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali2
- Europa occidentale
Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versioni precedenti:v3.0v2.1
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Il modello di ricevuta di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati.
Tipi di ricevuta supportati:
- Termica
- Carta di credito
- Gas
- Parcheggio
- Hotel
- Trasporto
- Comunicazione
- Entertainment
- Biglietto aereo
- Formazione
- Farmacia/Medico
Estrazione dati delle ricevute
La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie digitalizzate, fotografate e stampate, in un formato digitale per un'elaborazione downstream semplificata. Alcuni esempi includono gestione delle spese, analisi del comportamento dei consumatori, automazione fiscale e così via. L'uso di Document Intelligence con la tecnologia OCR (Optical Character Recognition) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L'elaborazione di Intelligence sui documenti semplifica il processo di conversione, ma riduce notevolmente il tempo e il lavoro richiesto, semplificando così una gestione efficiente dei dati e il recupero.
Conferma di esempio elaborata con Document Intelligence Studio:
Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio di Document Intelligence:
Opzioni di sviluppo
Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di ricevuta | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di ricevuta | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di ricevuta | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di ricevuta | • Strumento di etichettatura di Document Intelligence• API REST• SDK della libreria client• Contenitore Docker di Document Intelligence |
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
- Formati di file supportati: JPEG, PNG, PDF e TIFF.
- Supporto per pdf e TIFF: Document Intelligence può elaborare fino a 2.000 pagine per sottoscrittori di livello standard o solo le prime due pagine per i sottoscrittori di livello gratuito.
- Dimensioni del file supportate: minore di 50 MB; pixel minimo 50 x 50 px; pixel massimi 10.000 x 10.000 px.
Estrazione dei dati del modello di ricevuta
Scopri in che modo Document Intelligence estrae i dati, inclusi l'ora e la data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Nota
Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.
Nella home page di Document Intelligence Studio selezionare Ricevute.
È possibile analizzare la ricevuta di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:
Strumento di etichettatura di esempio di Document Intelligence
Passare allo strumento di esempio di intelligence per i documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.
Selezionare il Tipo di modulo da analizzare nel menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.
Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.
Estrazione di campi
Nome | Tipo | Descrizione | Output standardizzato |
---|---|---|---|
ReceiptType | String | Tipo di ricevuta di vendita | Dettagliata |
MerchantName | String | Nome del commerciante che emette la ricevuta | |
MerchantPhoneNumber | phoneNumber | Numero di telefono nell'elenco del commerciante | +1 xxx xxx xxxx |
MerchantAddress | String | Indirizzo nell'elenco del commerciante | |
TransactionDate | Data | Data di emissione della ricevuta | aaaa-mm-gg |
TransactionTime | Ora | Ora di emissione della ricevuta | hh-mm-ss (24 ore) |
Totali | Numero (USD) | Totale di transazioni complete della ricevuta | Due decimali con virgola mobile |
Subtotale | Numero (USD) | Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | Due decimali con virgola mobile |
Imposta | Numero (USD) | Imposta totale sulla ricevuta (spesso iva o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30. | Due decimali con virgola mobile |
Suggerimento | Numero (USD) | Suggerimento incluso dall'acquirente | Due decimali con virgola mobile |
Articoli | Matrice di oggetti | Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto | |
Nome | string | Descrizione dell'articolo. Rinominato in "Description" nella versione 2022-06-30. | |
Quantità | Numero | Quantità di ogni articolo | Due decimali con virgola mobile |
Price | Numero | Prezzo singolo di ogni unità articolo | Due decimali con virgola mobile |
TotalPrice | Numero | Prezzo totale della voce | Due decimali con virgola mobile |
Document Intelligence v3.0 e versioni successive introducono diverse nuove funzionalità e funzionalità. Oltre alle ricevute termiche, il modello Ricevuta supporta l'elaborazione delle ricevute di hotel a pagina singola e l'estrazione dei dettagli fiscali per tutti i tipi di ricevuta.
Document Intelligence v4.0 e versioni successive introduce il supporto per la valuta per tutti i campi correlati al prezzo per le ricevute termiche e alberghiere.
Ricevuta
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-3210 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
TransactionDate |
date |
Data di emissione della ricevuta | 06 giugno 2019 |
TransactionTime |
time |
Ora di emissione della ricevuta | 16:49 |
Subtotal |
number |
Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | $ 12,34 |
TotalTax |
number |
Imposta sulla ricevuta, spesso iva o equivalente | $2,00 |
Tip |
number |
Suggerimento incluso dall'acquirente | $ 1,00 |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Surface Pro 6 |
Items.*.Quantity |
number |
Quantità di ogni articolo | 1 |
Items.*.Price |
number |
Prezzo singolo di ogni unità articolo | $ 999,00 |
Items.*.ProductCode |
string |
Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Items.*.QuantityUnit |
string |
Unità di quantità di ogni articolo | |
TaxDetails |
array |
||
TaxDetails.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
TaxDetails.*.Amount |
currency |
Importo del dettaglio fiscale | $ 999,00 |
receipt.retailMeal
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-3210 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
TransactionDate |
date |
Data di emissione della ricevuta | 06 giugno 2019 |
TransactionTime |
time |
Ora di emissione della ricevuta | 16:49 |
Subtotal |
number |
Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | $ 12,34 |
TotalTax |
number |
Imposta sulla ricevuta, spesso iva o equivalente | $2,00 |
Tip |
number |
Suggerimento incluso dall'acquirente | $ 1,00 |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Surface Pro 6 |
Items.*.Quantity |
number |
Quantità di ogni articolo | 1 |
Items.*.Price |
number |
Prezzo singolo di ogni unità articolo | $ 999,00 |
Items.*.ProductCode |
string |
Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Items.*.QuantityUnit |
string |
Unità di quantità di ogni articolo | |
TaxDetails |
array |
||
TaxDetails.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
TaxDetails.*.Amount |
currency |
Importo del dettaglio fiscale | $ 999,00 |
receipt.creditCard
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-3210 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
TransactionDate |
date |
Data di emissione della ricevuta | 06 giugno 2019 |
TransactionTime |
time |
Ora di emissione della ricevuta | 16:49 |
Subtotal |
number |
Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | $ 12,34 |
TotalTax |
number |
Imposta sulla ricevuta, spesso iva o equivalente | $2,00 |
Tip |
number |
Suggerimento incluso dall'acquirente | $ 1,00 |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Surface Pro 6 |
Items.*.Quantity |
number |
Quantità di ogni articolo | 1 |
Items.*.Price |
number |
Prezzo singolo di ogni unità articolo | $ 999,00 |
Items.*.ProductCode |
string |
Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Items.*.QuantityUnit |
string |
Unità di quantità di ogni articolo | |
TaxDetails |
array |
||
TaxDetails.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
TaxDetails.*.Amount |
currency |
Importo del dettaglio fiscale | $ 999,00 |
receipt.gas
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-3210 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
TransactionDate |
date |
Data di emissione della ricevuta | 06 giugno 2019 |
TransactionTime |
time |
Ora di emissione della ricevuta | 16:49 |
Subtotal |
number |
Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | $ 12,34 |
TotalTax |
number |
Imposta sulla ricevuta, spesso iva o equivalente | $2,00 |
Tip |
number |
Suggerimento incluso dall'acquirente | $ 1,00 |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Surface Pro 6 |
Items.*.Quantity |
number |
Quantità di ogni articolo | 1 |
Items.*.Price |
number |
Prezzo singolo di ogni unità articolo | $ 999,00 |
Items.*.ProductCode |
string |
Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Items.*.QuantityUnit |
string |
Unità di quantità di ogni articolo | |
TaxDetails |
array |
||
TaxDetails.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
TaxDetails.*.Amount |
currency |
Importo del dettaglio fiscale | $ 999,00 |
receipt.parking
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-3210 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
TransactionDate |
date |
Data di emissione della ricevuta | 06 giugno 2019 |
TransactionTime |
time |
Ora di emissione della ricevuta | 16:49 |
Subtotal |
number |
Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | $ 12,34 |
TotalTax |
number |
Imposta sulla ricevuta, spesso iva o equivalente | $2,00 |
Tip |
number |
Suggerimento incluso dall'acquirente | $ 1,00 |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Surface Pro 6 |
Items.*.Quantity |
number |
Quantità di ogni articolo | 1 |
Items.*.Price |
number |
Prezzo singolo di ogni unità articolo | $ 999,00 |
Items.*.ProductCode |
string |
Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Items.*.QuantityUnit |
string |
Unità di quantità di ogni articolo | |
TaxDetails |
array |
||
TaxDetails.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
TaxDetails.*.Amount |
currency |
Importo del dettaglio fiscale | $ 999,00 |
receipt.hotel
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
MerchantName |
string |
Nome del commerciante che emette la ricevuta | Contoso |
MerchantPhoneNumber |
phoneNumber |
Numero di telefono nell'elenco del commerciante | 987-654-310 |
MerchantAddress |
address |
Indirizzo nell'elenco del commerciante | 123 Main St. Redmond, Washington 98052 |
Total |
number |
Totale di transazioni complete della ricevuta | $ 14,34 |
ArrivalDate |
date |
Data di arrivo | 27Mar21 |
DepartureDate |
date |
Data di partenza | 28Mar21 |
Currency |
string |
Unità valuta degli importi ricevuti (ISO 4217) o 'MIXED' se vengono trovati più valori | USD |
MerchantAliases |
array |
||
MerchantAliases.* |
string |
Nome alternativo del commerciante | Contoso (R) |
Items |
array |
||
Items.* |
object |
Voce estratta | 1 Surface Pro 6 $ 999,00 $ 999,00 |
Items.*.TotalPrice |
number |
Prezzo totale della voce | $ 999,00 |
Items.*.Description |
string |
Descrizione articolo | Costo della camera |
Items.*.Date |
date |
Data articolo | 27Mar21 |
Items.*.Category |
string |
Categoria articolo | Club |
Guida alla migrazione e API REST v3.1
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per