Modello di fattura di Document Intelligence

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
  • La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
  • L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali2
  • Europa occidentale

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)segno di spunta bluv3.0 (GA)segno di spunta bluv2.1 (GA)

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav3.0 (GA) | Versioni più recenti:segno di spunta violav4.0 (anteprima)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav2.1 | Versione più recente:segno di spunta bluv4.0 (anteprima)

Il modello di fattura di Document Intelligence usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave ed elementi di riga da fatture di vendita, fatture di utilità e ordini di acquisto. Le fatture possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti analizzati e PDF digitali. L'API analizza il testo della fattura; estrae le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto; e restituisce una rappresentazione di dati JSON strutturata. Il modello supporta attualmente le fatture in 27 lingue.

Tipi di documento supportati:

  • Fatture
  • Bollette
  • Ordini cliente
  • Ordini fornitore

Elaborazione automatica delle fatture

L'elaborazione automatica delle fatture è il processo di estrazione dei campi dei conti chiave pagabili dai documenti dell'account di fatturazione. I dati estratti includono le voci delle fatture integrate con i flussi di lavoro dei conti pagabili (AP) per revisioni e pagamenti. Storicamente, il processo di contabilità pagabile viene eseguito manualmente e, di conseguenza, molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture è in genere il primo e uno dei passaggi più critici del processo di automazione delle fatture.

Fattura di esempio elaborata con Document Intelligence Studio:

Screenshot di una fattura di esempio analizzata in Document Intelligence Studio.

Esempio di fattura elaborata con lo strumento di etichettatura di esempio di Document Intelligence:

Screenshot di una fattura di esempio.

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di fattura Strumento di etichettatura
di Document Intelligence• API
REST• SDK
della libreria client• Contenitore Docker di Document Intelligence

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • PDF e TIFF supportati, vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
  • Le dimensioni del file supportate devono essere inferiori a 50 MB e dimensioni almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.

Estrazione dei dati del modello di fattura

Vedere in che modo i dati, incluse le informazioni sui clienti, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

  1. Nella home page di Document Intelligence Studio selezionare Fatture.

  2. È possibile analizzare la fattura di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa percorso di origine.

  6. Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.

    Screenshot che mostra il menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione di campi

Nome Tipo Descrizione Output standardizzato
CustomerName string Cliente con fattura Microsoft Corp
CustomerId string ID riferimento cliente CID-12345
PurchaseOrder string Numero di riferimento dell'ordine di acquisto PO-3333
InvoiceId string ID per questa fattura specifica (spesso numero di fattura) INV-100
DataFattura data data di emissione della fattura mm-gg-a
DueDate data data di scadenza del pagamento della fattura mm-gg-a
VendorName string Fornitore che ha creato la fattura CONTOSO LTD.
VendorAddress address Indirizzo postale fornitore 123 456th St, New York, NY 10001
VendorAddressRecipient string Nome associato a VendorAddress Sede centrale di Contoso
CustomerAddress address Indirizzo postale per il cliente 123 Altro St, Redmond WA, 98052
CustomerAddressRecipient string Nome associato a CustomerAddress Microsoft Corp
BillingAddress address Indirizzo di fatturazione esplicito per il cliente 123 Bill St, Redmond WA, 98052
BillingAddressRecipient string Nome associato a BillingAddress Microsoft Services
ShippingAddress address Indirizzo di spedizione esplicito per il cliente 123 Nave St, Redmond WA, 98052
ShippingAddressRecipient string Nome associato a ShippingAddress Recapito Microsoft
Totale parziale Valuta Campo subtotale identificato nella fattura $ 100,00
TotalDiscount Valuta Sconto totale applicato a una fattura € 5,00
TotalTax Valuta Campo iva totale identificato nella fattura $10,00
InvoiceTotal Valuta Totale nuovi addebiti associati alla fattura $10,00
AmountDue Valuta Importo totale dovuto al fornitore $610
PreviousUnpaidBalance Valuta Saldo precedentemente non pagato esplicito $ 500,00
RemittanceAddress address Indirizzo esplicito di rimessa o pagamento per il cliente 123 Rimessa St New York, NY, 10001
RemittanceAddressRecipient string Nome associato a RimessaAddress Fatturazione contoso
ServiceAddress address Indirizzo esplicito del servizio o indirizzo della proprietà per il cliente 123 Service St, Redmond WA, 98052
ServiceAddressRecipient string Nome associato a ServiceAddress Microsoft Services
ServiceStartDate data Prima data per il periodo di servizio (ad esempio, un periodo di servizio della fattura dell'utilità) mm-gg-a
ServiceEndDate data Data di fine per il periodo di servizio (ad esempio, un periodo di servizio della fattura dell'utilità) mm-gg-a
VendorTaxId string Numero di contribuente associato al fornitore 123456-7
CustomerTaxId string Numero di contribuente associato al cliente 765432-1
PaymentTerm string Condizioni di pagamento per la fattura Net90
KVKNumber string Identificatore univoco per le imprese registrate nei Paesi Bassi (solo NL) 12345678
CurrencyCode string Codice di valuta associato all'importo estratto
PaymentDetails array Matrice che contiene i dettagli dell'opzione di pagamento, IBANad esempio ,SWIFTBPayBillerCode(AU) ,BPayReference(AU)
TaxDetails array Matrice che contiene dettagli fiscali come importo e tasso
TaxDetails array Matrice che contiene informazioni fiscali aggiunte, ad CGSTesempio , IGSTe SGST. Questa voce è attualmente disponibile solo per le impostazioni locali Germania (de), Spagna (es), Portogallo (pt) e Canada inglese (en-CA)

Matrice di elementi riga

Di seguito sono riportate le voci estratte da una fattura nella risposta di output JSON. L'output seguente usa questa fattura di esempio:

Nome Tipo Descrizione Valore (output standardizzato)
Periodo Valuta Quantità dell'elemento della riga $ 60,00
Data data Data corrispondente a ogni voce. Spesso è una data in cui è stato spedito l'articolo 3/4/2021
Descrizione stringa Descrizione del testo per l'elemento della riga della fattura Servizio di consulenza
Quantità number Quantità per l'articolo della riga della fattura 2
ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Imposta Valuta Imposta associata a ogni voce. I valori possibili includono l'importo fiscale e l'imposta Y/N € 6,00
TaxRate string Tasso d'imposta associato a ogni voce. 18%
Unità string Unità della voce, ad esempio kg, lb e così via. Ore
UnitPrice number Prezzo netto o lordo (a seconda dell'impostazione della fattura lorda della fattura) di un'unità di questo articolo $30,00

Le coppie chiave-valore della fattura e gli elementi di riga estratti sono nella documentResults sezione dell'output JSON.

Coppie chiave-valore

La fattura predefinita 2022-06-30 e versioni successive supporta la restituzione facoltativa di coppie chiave-valore. Per impostazione predefinita, la restituzione di coppie chiave-valore è disabilitata. Le coppie chiave-valore sono intervalli specifici all'interno della fattura che identificano un'etichetta o una chiave e la risposta o il valore associato. In una fattura, queste coppie possono essere l'etichetta e il valore immesso dall'utente per tale campo o numero di telefono. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documento, formati e strutture.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).

Campi estratti

Il servizio Fatture estrae il testo, le tabelle e 26 campi della fattura. Di seguito sono riportati i campi estratti da una fattura nella risposta di output JSON (l'output seguente usa questa fattura di esempio).

Nome Tipo Descrizione Testo Valore (output standardizzato)
CustomerName string Cliente fatturato Microsoft Corp
CustomerId string ID di riferimento per il cliente CID-12345
PurchaseOrder string Un numero di riferimento per l'ordine di acquisto PO-3333
InvoiceId string ID per questa fattura specifica (spesso "Numero fattura") INV-100
DataFattura data Data di emissione della fattura 15/11/2019 2019-11-15
DueDate data Data di scadenza del pagamento della fattura 15/12/2019 2019-12-15
VendorName string Fornitore che ha creato la fattura CONTOSO
VendorAddress string Indirizzo postale per il fornitore 123 456th St New York, NY, 10001
VendorAddressRecipient string Nome associato a VendorAddress Sede centrale di Contoso
CustomerAddress string Indirizzo postale per il cliente 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient string Nome associato a CustomerAddress Microsoft Corp
BillingAddress string Indirizzo di fatturazione esplicito per il cliente 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient string Nome associato a BillingAddress Microsoft Services
ShippingAddress string Indirizzo di spedizione esplicito per il cliente 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient string Nome associato a ShippingAddress Recapito Microsoft
Totale parziale number Campo subtotale identificato nella fattura $ 100,00 100
TotalTax number Campo iva totale identificato nella fattura $10,00 10
InvoiceTotal number Totale nuovi addebiti associati alla fattura $ 110,00 110
AmountDue number Importo totale dovuto al fornitore $ 610,00 610
ServiceAddress string Indirizzo esplicito del servizio o indirizzo della proprietà per il cliente 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient string Nome associato a ServiceAddress Microsoft Services
RemittanceAddress string Indirizzo esplicito di rimessa o pagamento per il cliente 123 Rimessa St New York, NY, 10001
RemittanceAddressRecipient string Nome associato a RimessaAddress Fatturazione contoso
ServiceStartDate data Prima data per il periodo di servizio (ad esempio, un periodo di servizio della fattura dell'utilità) 10/14/2019 2019-10-14
ServiceEndDate data Data di fine per il periodo di servizio (ad esempio, un periodo di servizio della fattura dell'utilità) 11/14/2019 2019-11-14
PreviousUnpaidBalance number Saldo precedentemente non pagato esplicito $ 500,00 500

Di seguito sono riportate le voci estratte da una fattura nella risposta di output JSON e viene usata questa fattura di esempio:

Nome Tipo Descrizione Testo (voce n. 1) Valore (output standardizzato)
Articoli string Riga di testo stringa completa dell'elemento della riga 3/4/2021 A123 Consulting Services 2 ore $ 30,00 10% $ 60,00
Periodo number Quantità dell'elemento della riga $ 60,00 100
Descrizione stringa Descrizione del testo per l'elemento della riga della fattura Servizio di consulenza Servizio di consulenza
Quantità number Quantità per l'articolo della riga della fattura 2 2
UnitPrice number Prezzo netto o lordo (a seconda dell'impostazione della fattura lorda della fattura) di un'unità di questo articolo $30,00 30
ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Unità string Unità della voce, ad esempio kg, lb e così via. ore
Data data Data corrispondente a ogni voce. Spesso è una data in cui è stato spedito l'articolo 3/4/2021 2021-03-04
Imposta number Imposta associata a ogni voce. I valori possibili includono l'importo delle imposte, l'imposta %e l'imposta Y/N 10%

Di seguito sono riportati campi complessi estratti da una fattura nella risposta di output JSON:

TaxDetails

Dettagli fiscali mira a suddividere le diverse imposte applicate al totale della fattura.

Nome Tipo Descrizione Testo (voce n. 1) Valore (output standardizzato)
Articoli string Riga di testo stringa completa dell'articolo fiscale V.A.T. 15% $ 60,00
Periodo number Importo dell'imposta dell'articolo fiscale 60.00 60
Tariffa string Aliquota d'imposta dell'articolo fiscale 15%

PaymentDetails

Elencare tutte le opzioni di pagamento rilevate nel campo.

Nome Tipo Descrizione Testo (voce n. 1) Valore (output standardizzato)
IBAN string Numero conto bancario interno GB33BUKB20201555555555
SWIFT string Codice SWIFT BUKBGB22
BPayBillerCode string Codice di fatturazione australiano B-Pay 12345
BPayReference string Codice di riferimento australiano B-Pay 98765432100

Output JSON

L'output JSON ha tre parti:

  • "readResults" node contiene tutti i segni di testo e selezione riconosciuti. Il testo è organizzato tramite pagina, quindi per riga, quindi per singole parole.
  • "pageResults" il nodo contiene le tabelle e le celle estratte con i rettangoli delimitatori, l'attendibilità e un riferimento alle righe e alle parole in readResults.
  • "documentResults" node contiene i valori e gli elementi di riga specifici della fattura individuati dal modello. È la posizione in cui trovare tutti i campi della fattura, ad esempio l'ID fattura, la spedizione, la fattura, il cliente, il totale, gli articoli di riga e molto altro ancora.

Guida alla migrazione

  • Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.

  • Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.