Modelli di elaborazione di documenti

2024-12-12

Questo contenuto si applica a:v4.0 (GA) | Versioni precedenti: v3.1 (GA) v3.0 (GA)v2.1 (GA)v2.1 (GA)

Questo contenuto si applica a:v3.1 (GA) | Versione più recente: v4.0 (GA) | Versioni precedenti: v3.0v2.1

Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti: v4.0 (GA) v3.1 | Versione precedente:v2.1

Questo contenuto si applica a:versione 2.1 | più recente:v4.0 (GA)

Informazioni sui documenti di Azure AI supporta un'ampia gamma di modelli che consentono di aggiungere funzionalità di elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello specifico del dominio oppure eseguire il training di un modello personalizzato in base alle esigenze aziendali e ai casi d'uso specifici. Informazioni sui documenti può essere usato con l'API REST o le librerie client Python, C#, Java e JavaScript.

Nota

I progetti di elaborazione dei documenti che coinvolgono dati finanziari, dati sanitari protetti, dati personali o dati altamente sensibili richiedono un'attenzione particolare.
Assicurarsi di rispettare tutti i requisiti nazionali/regionali e specifici del settore.

Panoramica dei modelli

La tabella seguente illustra i modelli disponibili per ogni API stabile:

Tipo di modello	Modello	• 2024-11-30 (GA)	31-07-2023 - (DISPONIBILITÀ GENERALE)	2022-08-31 (Disponibilità generale)	v2.1 (DISPONIBILITÀ GENERALE)
Modelli di analisi dei documenti	Lettura	✔️	✔️	✔️	n/d
Modelli di analisi dei documenti	Layout	✔️	✔️	✔️	✔️
Modelli di analisi dei documenti	Documento generale	spostato nel layout**	✔️	✔️	n/d
Modelli predefiniti	Assegno bancario	✔️	n/d	n/d	n/d
Modelli predefiniti	Rendiconto bancario	✔️	n/d	n/d	n/d
Modelli predefiniti	Paystub	✔️	n/d	n/d	n/d
Modelli predefiniti	Contratto	✔️	✔️	n/d	n/d
Modelli predefiniti	Tessera sanitaria	✔️	✔️	✔️	n/d
Modelli predefiniti	Documento di identità	✔️	✔️	✔️	✔️
Modelli predefiniti	Fattura	✔️	✔️	✔️	✔️
Modelli predefiniti	Ricevuta	✔️	✔️	✔️	✔️
Modelli predefiniti	Imposta USA unificata*	✔️	n/d	n/d	n/d
Modelli predefiniti	Imposta statunitense 1040*	✔️	✔️	n/d	n/d
Modelli predefiniti	US 1095 Tax*	✔️	n/d	n/d	n/d
Modelli predefiniti	Imposta statunitense 1098*	✔️	n/d	n/d	n/d
Modelli predefiniti	Imposta statunitense 1099*	✔️	n/d	n/d	n/d
Modelli predefiniti	Imposta statunitense W2	✔️	✔️	✔️	n/d
Modelli predefiniti	Imposta US W4	✔️	n/d	n/d	n/d
Modelli predefiniti	Ipoteca statunitense 1003 URLA	✔️	n/d	n/d	n/d
Modelli predefiniti	Mutuo 1004 Stati Uniti URAR	✔️	n/d	n/d	n/d
Modelli predefiniti	Mutuo 1005 Stati Uniti	✔️	n/d	n/d	n/d
Modelli predefiniti	Riepilogo ipoteca statunitense 1008	✔️	n/d	n/d	n/d
Modelli predefiniti	Informativa sulla chiusura delle ipoteche statunitensi	✔️	n/d	n/d	n/d
Modelli predefiniti	Certificato di matrimonio	✔️	n/d	n/d	n/d
Modelli predefiniti	Carta di credito	✔️	n/d	n/d	n/d
Modelli predefiniti	Biglietto da visita	deprecated	✔️	✔️	✔️
Modello di classificazione personalizzato	Classificatore personalizzato	✔️	✔️	n/d	n/d
Modello di estrazione personalizzato	Neurale personalizzato	✔️	✔️	✔️	n/d
Modello di estrazione personalizzato	Modello personalizzato	✔️	✔️	✔️	✔️
Modello di estrazione personalizzato	Composto personalizzato	✔️	✔️	✔️	✔️
Tutti i modelli	Funzionalità dei componenti aggiuntivi	✔️	✔️	n/d	n/d

* - Contiene sottomodelli. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.
**- Tutte le funzionalità del modello documento generale sono disponibili nel modello di layout. Il modello generale non è più supportato.

Latenza

La latenza è il tempo necessario per un server API per gestire ed elaborare una richiesta in ingresso e recapitare la risposta in uscita al client. Il tempo necessario per analizzare un documento dipende dalle dimensioni, ad esempio il numero di pagine, e dal contenuto associato in ogni pagina. Informazioni sui documenti è un servizio multi-tenant in cui la latenza per documenti simili è paragonabile, ma non sempre identica. La variabilità occasionale in termini di latenza e prestazioni è intrinseca nei servizi asincroni senza stato basati su microservizi che elaborano immagini e documenti di grandi dimensioni su larga scala. Anche se l'hardware, la capacità e le funzionalità di ridimensionamento vengono continuamente aumentati, è possibile che si verifichino ancora problemi di latenza in fase di esecuzione.

Funzionalità del componente aggiuntivo

Di seguito sono riportate le funzionalità del componente aggiuntivo disponibili nell'intelligence per i documenti. Per tutti i modelli, ad eccezione del modello di biglietto da visita, Informazioni sui documenti supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. Queste funzionalità facoltative possono essere abilitate e disabilitate a seconda dello scenario di estrazione dei documenti. Sono disponibili sette funzionalità aggiuntive per 2023-07-31 (DISPONIBILITÀ GENERALE) e versioni successive dell'API:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
queryFields Not available with the US.Tax models
searchablePDF Only available for Read Model

Funzionalità del componente aggiuntivo	Componente aggiuntivo/gratuito	• 2024-11-30 (GA)	`2023-07-31` (GA)	`2022-08-31` (GA)	v2.1 (GA)
Estrazione delle proprietà dei caratteri	Componente aggiuntivo	✔️	✔️	n/d	n/d
Estrazione di formule	Componente aggiuntivo	✔️	✔️	n/d	n/d
Estrazione ad alta risoluzione	Componente aggiuntivo	✔️	✔️	n/d	n/d
Estrazione del codice a barre	Gratuito	✔️	✔️	n/d	n/d
Rilevamento lingua	Gratuito	✔️	✔️	n/d	n/d
Coppie chiave-valore	Gratuito	✔️	n/d	n/d	n/d
Campi di query	Componente aggiuntivo*	✔️	n/d	n/d	n/d
PDF ricercabile	Componente aggiuntivo*	✔️	n/d	n/d	n/d

Funzionalità dell'analisi dei modelli

Model ID	Estrazione di contenuto	Campi di query	Paragrafi	Ruoli di paragrafo	Segni di selezione	Tabelle	Coppie chiave-valore	Lingue	Codici a barre	Analisi dei documenti	Formule*	Carattere stile*	Alta risoluzione*	PDF ricercabile
prebuilt-read	✓		✓					O	O		O	O	O	O
prebuilt-layout	✓	✓	✓	✓	✓	✓	O	O	O		O	O	O
prebuilt-contract	✓	✓	✓	✓	✓			O	O	✓	O	O
prebuilt-healthInsuranceCard.us	✓	✓						O	O	✓	O	O	O
prebuilt-idDocument	✓	✓						O	O	✓	O	O	O
prebuilt-invoice	✓	✓			✓	✓	O	O	O	✓	O	O	O
prebuilt-receipt	✓	✓						O	O	✓	O	O	O
prebuilt-marriageCertificate.us	✓	✓			✓			O	O	✓	O	O	O
prebuilt-creditCard	✓	✓						O	O	✓	O	O	O
prebuilt-check.us	✓	✓						O	O	✓	O	O	O
prebuilt-payStub.us	✓	✓						O	O	✓	O	O	O
prebuilt-bankStatement	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.1003	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1004	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1005	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1008	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.closingDisclosure	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.w2	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.w4	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1040 (vari)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1095A	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1095C	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1098	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098E	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098T	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099 (vari)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099SSA	✓	✓						O	O	✓	O	O	O
{ customModelName }	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ - Abilitato
O - facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi

Componente aggiuntivo* - I campi di query vengono distribuiti in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per informazioni dettagliate, vedere i prezzi.

Rettangolo delimitatore e coordinate poligono

Un rettangolo delimitatore (polygon in versione 3.0 e versioni successive) è un rettangolo astratto che circonda gli elementi di testo in un documento usato come punto di riferimento per il rilevamento degli oggetti.

Il rettangolo di selezione specifica la posizione usando un piano di coordinate x e y presentato in una matrice di quattro coppie numeriche. Ogni coppia rappresenta un angolo della casella nell'ordine seguente: in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra.
Le coordinate per un'immagine sono in pixel. Per un PDF, le coordinate sono presentate in pollici.

Supporto di versioni in lingue diverse

I modelli universali basati su Deep Learning di Informazioni sui documenti supportano molte lingue che possono estrarre testo multilingue dalle immagini e dai documenti, incluse le righe di testo con lingue miste. Il supporto linguistico varia in base alla funzionalità del servizio Informazioni sui documenti. Per l'elenco completo, vedere i seguenti articoli:

Disponibilità a livello di area

Informazioni sui documenti è disponibile a livello generale in molte delle oltre 60 aree di infrastruttura globale di Azure.

Per altre informazioni, vedere la pagina aree geografiche di Azure per scegliere l'area migliore per l'utente e i clienti.

Dettagli del modello

Questa sezione descrive l'output previsto da ogni modello. È possibile estendere l'output della maggior parte dei modelli con funzionalità del componente aggiuntivo.

Read OCR

L'API Lettura analizza ed estrae righe, parole, posizioni, lingue rilevate e stile scritto a mano, se rilevato.

Documento di esempio elaborato usando Document Intelligence Studio:

Screenshot dello screenshot del documento di esempio elaborato con Document Intelligence Studio Read

Altre informazioni: modello Lettura

Analisi del layout

Il modello di analisi del layout consente di analizzare ed estrarre testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina, piè di pagina e altro ancora.

Documento di esempio elaborato con Document Intelligence Studio:

Screenshot della pagina del giornale di esempio elaborata con Document Intelligence Studio Read.

Altre informazioni: modello Layout

Modello di tessera di assicurazione sanitaria

Il modello di tessera sanitaria combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle tessere sanitarie USA.

Tessera sanitaria USA di esempio elaborata con Document Intelligence Studio:

Altre informazioni: modello Tessera sanitaria

Documenti fiscali statunitensi

I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:

Modello	Descrizione	ModelID
Imposta statunitense W-2	Estrae i dettagli della retribuzione imponibile.	prebuilt-tax.us.w2
Imposta STATUNITENSE W-4	Estrae i dettagli della retribuzione imponibile.	prebuilt-tax.us.w4
Imposta statunitense 1040	Estrae i dettagli degli interessi ipotecari.	prebuilt-tax.us.1040(varianti)
Imposta USA 1095	Estrarre i dettagli dell'assicurazione sanitaria.	prebuilt-tax.us.1095(varianti)
Imposta statunitense 1098	Estrae i dettagli degli interessi ipotecari.	prebuilt-tax.us.1098(varianti)
Imposta USA 1099	Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro.	prebuilt-tax.us.1099(varianti)

Documento di esempio W-2 elaborato con Document Intelligence Studio:

Screenshot di un esempio di W-2.

Altre informazioni: Modelli di documento fiscale

Documenti ipotecari statunitensi

I modelli di documento ipotecario statunitense analizzano ed estraggono i campi chiave, inclusi i mutuatari, i prestiti e le informazioni sulle proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:

Modello	Descrizione	ModelID
Contratto di licenza con l'utente finale 1003 (EULA)	Estrarre prestiti, mutuatari, dettagli di proprietà.	prebuilt-mortgage.us.1003
1004 Rapporto di valutazione residenziale uniforme (URAR))	Estrarre prestiti, mutuatari, dettagli di proprietà.	prebuilt-mortgage.us.1004
1005 Verifica dell'impiego	Estrarre prestiti, mutuatari, dettagli di proprietà.	prebuilt-mortgage.us.1005
Documento di riepilogo 1008	Estrarre i dettagli del mutuatario, del venditore, della proprietà, del mutuo e della sottoscrizione.	prebuilt-mortgage.us.1008
Informativa sulla chiusura	Estrarre i dettagli di chiusura, transazioni e prestito.	prebuilt-mortgage.us.closingDisclosure

Documento di esempio di informativa sulla chiusura elaborato con Document Intelligence Studio:

Screenshot di una informativa di chiusura di esempio.

Altre informazioni: modelli di documenti ipotecari statunitensi

Contract

Il modello di contratto analizza ed estrae i campi chiave e gli elementi riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.

Contratto di esempio elaborato con Document Intelligence Studio:

Screenshot dell'estrazione del modello di contratto con Document Intelligence Studio.

Altre informazioni: modello di contratto

Assegno bancario degli Stati Uniti

Il modello di contratto analizza ed estrae i campi chiave dal controllo, inclusi i dettagli del controllo, i dettagli del conto, l'importo, la nota, viene estratto dai controlli bancari degli Stati Uniti.

Assegno bancario di esempio elaborato con Document Intelligence Studio:

Screenshot dell'estrazione del modello di controllo bancario con Document Intelligence Studio.

Altre informazioni: modello di contratto

Estratto conto bancario degli Stati Uniti

Il modello di estratto conto bancario analizza ed estrae i campi chiave e gli elementi di riga dal numero di conto bancario degli Stati Uniti, i dettagli bancari, i dettagli dell'estratto conto e i dettagli delle transazioni.

Estratto conto bancario di esempio elaborato con Document Intelligence Studio:

Screenshot dell'estrazione del modello di estratto conto bancario con Document Intelligence Studio.

Altre informazioni: modello di contratto

PayStub

Il modello paytub analizza ed estrae campi chiave ed elementi riga da documenti e file con informazioni correlate al pagamento.

Esempio di paystub elaborato con Document Intelligence Studio:

Screenshot dell'estrazione di modelli stub con pagamento in Document Intelligence Studio.

Altre informazioni: modello di contratto

Fattura

Il modello di fattura consente di automatizzare l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto, le voci e altri dati chiave.

Fattura di esempio elaborata con Document Intelligence Studio:

Altre informazioni: modello Fattura

Ricevuta

Usare il modello di ricevuta per digitalizzare le ricevute di vendita ed estrarre il nome del commerciante, le date, le voci, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione delle ricevute di hotel a pagina singola.

Ricevuta di esempio elaborata con Document Intelligence Studio:

Altre informazioni: modello Ricevuta

Documento di identità (ID)

Usare il modello documento di identità (ID) per elaborare le patenti di guida USA (tutti i 50 stati e District of Columbia) e le pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio) al fine di estrarre i campi chiave.

Esempio degli Stati Uniti. Patente di guida elaborata utilizzando Document Intelligence Studio:

Altre informazioni: modello Documento di identità

Certificato di matrimonio

Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre campi chiave, tra cui le persone, la data e l’area geografica.

Certificato di matrimonio statunitense di esempio elaborata con Document Intelligence Studio:

Altre informazioni: modello Documento di identità

Carta di credito

Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.

Carta di credito di esempio elaborata con Document Intelligence Studio:

Altre informazioni: modello Documento di identità

Modelli personalizzati

I modelli personalizzati possono essere classificati a grandi linee in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.

Diagramma dei tipi di modelli personalizzati e delle modalità di compilazione del modello associate.

I modelli di documenti personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. Riconoscono i campi moduli all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, è necessario solo un esempio del tipo di modulo.

I modelli personalizzati della versione v3.0 e successive supporta il rilevamento delle firme nei modelli personalizzati (modulo) e nelle tabelle tra pagine sia nei modelli di tipo modello che nei modelli neurali. Il rilevamento della firma verifica se è presente una firma, non verifica l'identità della persona che firma il documento. Se il modello restituisce unsigned per il rilevamento delle firme, il modello non ha trovato una firma nel campo definito.

Modello personalizzato di esempio elaborato con Document Intelligence Studio:

Screenshot della finestra analizza-un-documento-personalizzato dello strumento Informazioni sui documenti.

Altre informazioni: modello personalizzato

Estrazione personalizzata

Il modello di estrazione personalizzato può essere uno dei due tipi, modello personalizzato, neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello sul set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.

Estrazione personalizzata di esempio elaborata con Document Intelligence Studio:

Screenshot dell'analisi del modello di estrazione personalizzata in Document Intelligence Studio.

Altre informazioni: modello personalizzato

Altre informazioni: modello neurale personalizzato

Classificatore personalizzato

Il modello di classificazione personalizzato consente di identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA). Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque esempi per classe.

Altre informazioni: modello di classificazione personalizzato

Modelli composti

Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 200 modelli personalizzati sottoposti a training.

Finestra di dialogo Modello composto in Document Intelligence Studio:

Screenshot della finestra di dialogo Componi modello personalizzato di Document Intelligence Studio.

Altre informazioni: modello personalizzato

Requisiti di input

Formati di file supportati:

Modello	PDF	Immagine: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lettura	✔	✔	✔
Layout	✔	✔	✔
Documento generale	✔	✔
Predefinito	✔	✔
Estrazione personalizzata	✔	✔
Classificazione personalizzata	✔	✔	✔

Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).
Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
- Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.
- Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.

Migrazione della versione

Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo Guida alla migrazione di Informazioni sui documenti v3.1

Modello	Descrizione
Analisi dei documenti
Layout	Estrarre testo e informazioni sul layout dai documenti.
Predefinita
Fattura	Estrarre le informazioni chiave dalle fatture in inglese e spagnolo.
Ricevuta	Estrarre le informazioni chiave dalle ricevute in inglese.
Documento di identità	Estrarre le informazioni chiave da patenti di guida USA e passaporti internazionali.
Biglietto da visita	Estrarre le informazioni chiave dai biglietti da visita in inglese.
Personalizzazione
Personalizzazione	Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici.
Modello composto	Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello creato dai tipi di modulo.