Modello di fattura di Document Intelligence
Importante
- Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
- L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali2
- Europa occidentale
Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versioni precedenti:v3.0v2.1
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Il modello di fattura di Document Intelligence usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave ed elementi di riga da fatture di vendita, fatture di utilità e ordini di acquisto. Le fatture possono essere di vari formati e qualità, tra cui immagini acquisite al telefono, documenti digitalizzati e PDF digitali. L'API consente di analizzare il testo delle fatture, estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto, e restituire una rappresentazione dei dati JSON strutturati. Il modello supporta attualmente le fatture in 27 lingue.
Tipi di documenti supportati:
- Fatture
- Bollette
- Ordini cliente
- Ordini fornitore
Elaborazione automatizzata delle fatture
L'elaborazione automatizzata delle fatture è il processo di estrazione dei campi dei conti fornitore dai documenti degli account di fatturazione. I dati estratti includono le voci delle fatture integrate con i flussi di lavoro dei conti fornitori per revisioni e pagamenti. Storicamente, il processo di contabilità pagabile viene eseguito manualmente e, di conseguenza, molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture è in genere il primo e uno dei passaggi più critici del processo di automazione delle fatture.
Fattura di esempio elaborata con Document Intelligence Studio:
Esempio di fattura elaborata con lo strumento di etichettatura di esempio di Document Intelligence:
Opzioni di sviluppo
Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di fattura | • Strumento di etichettatura di Document Intelligence• API REST• SDK della libreria client• Contenitore Docker di Document Intelligence |
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
- Formati di file supportati: JPEG, PNG, PDF e TIFF.
- PDF e TIFF supportati, vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
- Le dimensioni del file supportate devono essere inferiori a 50 MB e dimensioni almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.
Estrazione dei dati del modello di fattura
Vedere in che modo i dati, incluse le informazioni sul cliente, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Nella home page di Document Intelligence Studio selezionare Fatture.
È possibile analizzare la fattura di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :
Strumento di etichettatura di esempio di Document Intelligence
Passare allo strumento di esempio di intelligence per i documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.
Selezionare il Tipo di modulo da analizzare nel menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.
Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.
Estrazione di campi
Il modello prebuilt-invoice
di fattura di Document Intelligence estrae i campi seguenti.
Nome | Tipo | Descrizione | Output standardizzato |
---|---|---|---|
CustomerName | string | Cliente fatturato | Microsoft Corp |
CustomerId | string | ID di riferimento cliente | CID-12345 |
PurchaseOrder | string | Numero di riferimento dell'ordine di acquisto | PO-3333 |
InvoiceId | string | ID per questa fattura specifica (spesso numero di fattura) | INV-100 |
DataFattura | data | data di emissione della fattura | mm-gg-a |
DueDate | data | data di scadenza del pagamento della fattura | mm-gg-a |
VendorName | string | Fornitore che ha creato la fattura | CONTOSO LTD. |
VendorAddress | address | L'indirizzo postale del fornitore | 123 456th St, New York, NY 10001 |
VendorAddressRecipient | string | Nome associato a VendorAddress | Contoso Headquarters |
CustomerAddress | address | Indirizzo postale per il cliente | 123 Altro St, Redmond WA, 98052 |
CustomerAddressRecipient | string | Nome associato a CustomerAddress | Microsoft Corp |
BillingAddress | address | Indirizzo di fatturazione esplicito per il cliente | 123 Bill St, Redmond WA, 98052 |
BillingAddressRecipient | string | Nome associato a BillingAddress | Microsoft Services |
ShippingAddress | address | Indirizzo di spedizione esplicito per il cliente | 123 Nave St, Redmond WA, 98052 |
ShippingAddressRecipient | string | Nome associato a ShippingAddress | Microsoft Delivery |
SubTotale | Valuta | Campo del subtotale identificato nella fattura | $ 100,00 |
TotalDiscount | Valuta | Lo sconto totale applicato a una fattura | € 5,00 |
TotalTax | Valuta | Campo del totale imposte identificato nella fattura | $10,00 |
InvoiceTotal | Valuta | Totale nuovi addebiti associati alla fattura | $10,00 |
AmountDue | Valuta | Importo totale dovuto al fornitore | $610 |
PreviousUnpaidBalance | Valuta | Saldo esplicito non pagato in precedenza | $ 500,00 |
RemittanceAddress | address | Indirizzo esplicito di rimessa o pagamento per il cliente | 123 Remit St New York, NY, 10001 |
RemittanceAddressRecipient | string | Nome associato a RemittanceAddress | Contoso Billing |
ServiceAddress | address | Indirizzo esplicito del servizio o indirizzo della proprietà per il cliente | 123 Service St, Redmond WA, 98052 |
ServiceAddressRecipient | string | Nome associato a ServiceAddress | Microsoft Services |
ServiceStartDate | data | Prima data per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) | mm-gg-a |
ServiceEndDate | data | Data di fine per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) | mm-gg-a |
VendorTaxId | string | Codice fiscale associato al fornitore | 123456-7 |
CustomerTaxId | string | Codice fiscale associato al cliente | 765432-1 |
PaymentTerm | string | Termini di pagamento per la fattura | Net90 |
KVKNumber | string | Identificatore univoco per le imprese registrate nei Paesi Bassi (solo NL) | 12345678 |
CurrencyCode | string | Il codice di valuta associato all'importo estratto | |
PaymentDetails | array | Matrice che contiene i dettagli dell'opzione di pagamento, IBAN ad esempio ,SWIFT BPayBillerCode(AU) ,BPayReference(AU) |
|
TaxDetails | array | Matrice che contiene dettagli fiscali come importo e tasso | |
TaxDetails | array | Una matrice contenente informazioni sulle imposte aggiunte, ad esempio CGST , IGST e SGST . Questa voce è attualmente disponibile solo per le impostazioni locali Germania (de ), Spagna (es ), Portogallo (pt ) e Canada inglese (en-CA ) |
Matrice di elementi riga
Di seguito sono riportate le voci estratte da una fattura nella risposta di output JSON. L'output seguente usa questa fattura di esempio:
Nome | Tipo | Descrizione | Valore (output standardizzato) |
---|---|---|---|
Periodo | Valuta | L'importo della voce | $60.00 |
Data | data | Data corrispondente a ogni voce. Spesso è la data in cui è stato spedito l'articolo | 3/4/2021 |
Descrizione | stringa | La descrizione di testo per la voce della fattura | Servizio di consulenza |
Quantità | Numero | La quantità per la voce della fattura | 2 |
ProductCode | string | Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 |
Imposta | Valuta | Imposta associata a ogni voce. I valori possibili includono l'importo dell'imposta e se è o meno inclusa | € 6,00 |
TaxRate | string | Aliquota fiscale associata a ogni voce. | 18% |
Unità | string | L'unità della voce, ad esempio kg, lb e così via. | Ore |
UnitPrice | Numero | Il prezzo netto o lordo (a seconda dell'impostazione nella fattura lorda) di un'unità di questo articolo | $30,00 |
Le coppie chiave-valore e le voci della fattura estratte si trovano nella sezione documentResults
dell'output JSON.
Coppie chiave-valore
La fattura predefinita 2022-06-30 e versioni successive supporta la restituzione facoltativa di coppie chiave-valore. Per impostazione predefinita, la restituzione di coppie chiave-valore è disabilitata. Le coppie chiave-valore sono intervalli specifici all'interno della fattura che identificano un'etichetta o una chiave e la risposta o il valore associato. In una fattura, queste coppie possono essere l'etichetta e il valore immessi dall'utente per tale campo o il numero di telefono. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi, formati e strutture di documenti.
Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave senza alcun valore associato o quando vengono elaborati campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).
Campi estratti
Il servizio Fatture estrae il testo, le tabelle e 26 campi della fattura. Di seguito sono riportati i campi estratti da una fattura nella risposta di output JSON. L'output seguente usa questa fattura di esempio.
Nome | Tipo | Descrizione | Testo | Valore (output standardizzato) |
---|---|---|---|---|
CustomerName | string | Cliente fatturato | Microsoft Corp | |
CustomerId | string | ID di riferimento per il cliente | CID-12345 | |
PurchaseOrder | string | Numero di riferimento dell'ordine di acquisto | PO-3333 | |
InvoiceId | string | ID per la fattura specifica (spesso "Numero fattura") | INV-100 | |
DataFattura | data | Data di emissione della fattura | 15/11/2019 | 2019-11-15 |
DueDate | data | Data di scadenza del pagamento della fattura | 15/12/2019 | 2019-12-15 |
VendorName | string | Fornitore che ha creato la fattura | CONTOSO | |
VendorAddress | string | Indirizzo postale per il fornitore | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | string | Nome associato a VendorAddress | Contoso Headquarters | |
CustomerAddress | string | Indirizzo postale per il cliente | 123 Other Street, Redmond, Washington, 98052 | |
CustomerAddressRecipient | string | Nome associato a CustomerAddress | Microsoft Corp | |
BillingAddress | string | Indirizzo di fatturazione esplicito per il cliente | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | string | Nome associato a BillingAddress | Microsoft Services | |
ShippingAddress | string | Indirizzo di spedizione esplicito per il cliente | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | string | Nome associato a ShippingAddress | Microsoft Delivery | |
SubTotale | Numero | Campo del subtotale identificato nella fattura | $ 100,00 | 100 |
TotalTax | Numero | Campo del totale imposte identificato nella fattura | $10,00 | 10 |
InvoiceTotal | Numero | Totale nuovi addebiti associati alla fattura | $110.00 | 110 |
AmountDue | Numero | Importo totale dovuto al fornitore | $610.00 | 610 |
ServiceAddress | string | Indirizzo esplicito del servizio o indirizzo della proprietà per il cliente | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | string | Nome associato a ServiceAddress | Microsoft Services | |
RemittanceAddress | string | Indirizzo esplicito di rimessa o pagamento per il cliente | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | string | Nome associato a RemittanceAddress | Contoso Billing | |
ServiceStartDate | data | Prima data per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | data | Data di fine per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | Numero | Saldo esplicito non pagato in precedenza | $ 500,00 | 500 |
Di seguito sono riportate le voci estratte da una fattura nella risposta di output JSON e viene usata questa fattura di esempio:
Nome | Tipo | Descrizione | Testo (voce 1) | Valore (output standardizzato) |
---|---|---|---|---|
Articoli | string | Stringa di testo completa della voce | 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00 | |
Periodo | Numero | L'importo della voce | $60.00 | 100 |
Descrizione | stringa | La descrizione di testo per la voce della fattura | Servizio di consulenza | Servizio di consulenza |
Quantità | Numero | La quantità per la voce della fattura | 2 | 2 |
UnitPrice | Numero | Il prezzo netto o lordo (a seconda dell'impostazione nella fattura lorda) di un'unità di questo articolo | $30,00 | 30 |
ProductCode | string | Codice prodotto, numero di prodotto o SKU associato alla voce specifica | A123 | |
Unità | string | L'unità della voce, ad esempio kg, lb e così via. | ore | |
Data | data | Data corrispondente a ogni voce. Spesso è la data in cui è stato spedito l'articolo | 3/4/2021 | 2021-03-04 |
Imposta | Numero | Imposta associata a ogni voce. I valori possibili includono l'importo dell'imposta, l'aliquota e se è o meno inclusa | 10% |
Di seguito sono riportati campi complessi estratti da una fattura nella risposta di output JSON:
TaxDetails
Dettagli fiscali mira a suddividere le diverse imposte applicate al totale della fattura.
Nome | Tipo | Descrizione | Testo (voce 1) | Valore (output standardizzato) |
---|---|---|---|---|
Articoli | string | Riga di testo stringa completa dell'articolo fiscale | V.A.T. 15% $ 60,00 | |
Periodo | number | Importo dell'imposta dell'articolo fiscale | 60.00 | 60 |
Tariffa | string | Aliquota d'imposta dell'articolo fiscale | 15% |
PaymentDetails
Elencare tutte le opzioni di pagamento rilevate nel campo.
Nome | Tipo | Descrizione | Testo (voce 1) | Valore (output standardizzato) |
---|---|---|---|---|
IBAN | string | Numero conto bancario interno | GB33BUKB20201555555555 | |
SWIFT | string | Codice SWIFT | BUKBGB22 | |
BPayBillerCode | string | Codice di fatturazione australiano B-Pay | 12345 | |
BPayReference | string | Codice di riferimento australiano B-Pay | 98765432100 |
Output JSON
L'output JSON ha tre parti:
- Il nodo
"readResults"
contiene tutto il testo e i segni di selezione riconosciuti. Il testo è organizzato in base alla pagina, quindi alla riga, infine in base a singole parole. "pageResults"
il nodo contiene le tabelle e le celle estratte con i rettangoli delimitatori, l'attendibilità e un riferimento alle righe e alle parole in readResults.- Il nodo
"documentResults"
contiene i valori specifici della fattura individuati dal modello. È la posizione in cui trovare tutti i campi della fattura, ad esempio l'ID fattura, l'indirizzo di spedizione, l'indirizzo di fatturazione, il cliente, il totale, le voci e molto altro ancora.
Guida alla migrazione
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per