Informazioni sui modelli predefiniti
I modelli predefiniti in Informazioni sui documenti di Azure AI consentono di estrarre dati da moduli e documenti comuni senza eseguire il training di modelli personalizzati.
Nella società di sondaggi i moduli per i sondaggi sono univoci per ogni progetto, ma si usano anche fatture e ricevute per registrare le transazioni finanziarie ed esistono molti documenti non strutturati. Si vuole sapere quanto lavoro è necessario per estrarre nomi, indirizzi, importi e altre informazioni da questi documenti.
In questa unità si apprenderà come i modelli predefiniti consentono di analizzare i tipi di documento comuni.
Che cosa sono i modelli predefiniti?
L'approccio generale usato nelle soluzioni di intelligenza artificiale prevede di fornire una grande quantità di dati di esempio e quindi eseguire il training di un modello ottimizzato provando diverse caratteristiche dei dati, parametri e trattamenti statistici. La combinazione che consente di ottenere la previsione ottimale dei valori a cui si è interessati costituisce il modello sottoposto a training ed è possibile usarlo per stimare i valori dai nuovi dati.
Molti dei moduli usati quotidianamente dalle aziende rientrano in alcune tipologie comuni. Ad esempio, la maggior parte delle aziende emette o riceve fatture e ricevute. Tutte le aziende che hanno dipendenti negli Stati Uniti devono usare il modulo di dichiarazione fiscale W-2. Inoltre, spesso si hanno documenti più generali da cui si desidera estrarre i dati. Microsoft offre supporto per questi casi, fornendo modelli predefiniti. I modelli predefiniti sono già stati sottoposti a training su un numero elevato di moduli del tipo di destinazione.
Se si vuole usare Document Intelligence per estrarre dati da uno di questi moduli o documenti comuni, è possibile scegliere di usare un modello predefinito e non è necessario eseguire il training del proprio. Poiché Microsoft ha eseguito il training di questi modelli su un ampio insieme di esempi, è possibile aspettarsi che forniscano risultati accurati e affidabili quando si gestiscono i moduli previsti.
Diversi modelli predefiniti sono stati sottoposti a training per tipi di modulo specifici:
- Modello di fattura. Estrae i campi comuni e i relativi valori dalle fatture.
- Modello di ricevuta. Estrae i campi comuni e i relativi valori dalle ricevute.
- Modello fiscale degli Stati Uniti. Modello fiscale degli Stati Uniti unificato che può estrarre da moduli come W-2, 1098, 1099 e 1040.
- Modello di documento di identità. Estrae i campi comuni e i relativi valori dalle patenti statunitensi, dai documenti ID e dalle patenti di guida dell'Unione europea e dai passaporti internazionali.
- Modello di biglietto da visita. Estrae i campi comuni e i relativi valori dai biglietti da visita.
- Modello di tessera di assicurazione sanitaria. Estrae i campi comuni e i relativi valori dalle tessere di assicurazione sanitaria.
- Certificato di matrimonio. Estrae informazioni dai certificati di matrimonio.
- Modello di carta di credito/debito. Estrae informazioni comuni dalle carte bancarie.
- Documenti ipotecari. Estrae informazioni dall'informativa di chiusura del mutuo, richiesta di finanziamento residenziale uniforme (modulo 1003), valutazione (modulo 1004), convalida dell'occupazione (modulo 1005) e riepilogo di sottoscrizione e trasmissione uniforme (modulo 1008).
- Modello di estratto conto bancario. Estrae le informazioni sul conto, inclusi i saldi iniziali e finali ei dettagli delle transazioni dagli estratti conto bancari.
- Modello di busta paga. Estrae retribuzioni, ore, detrazioni, retribuzione netta e altri campi comuni della busta paga.
- Controllare il modello. Estrae il beneficiario, l'importo, la data e altre informazioni rilevanti dai controlli.
Gli altri modelli sono progettati per estrarre valori dai documenti con strutture meno specifiche:
- Modello di lettura. Estrae testo e lingue dai documenti.
- Modello di documento generale. Estrarre testo, chiavi, valori, entità e opzioni di selezione dai documenti.
- Modello di layout. Estrae testo e informazioni sulla struttura dai documenti.
Funzionalità dei modelli predefiniti
I modelli predefiniti sono progettati per estrarre diversi tipi di dati dai documenti e dai moduli inviati dagli utenti. Per selezionare il modello appropriato per gli specifici requisiti, è necessario comprendere queste funzionalità:
- Estrazione del testo. Tutti i modelli predefiniti estraggono righe di testo e parole da testo scritto a mano e stampato.
- Coppie chiave-valore. Gli intervalli di testo all'interno di un documento che identificano un'etichetta o una chiave e la relativa risposta o il relativo valore vengono estratti da molti modelli come coppie chiave-valore. Ad esempio, una chiave tipica può essere Peso e il relativo valore potrebbe essere 31 kg.
- Entità. Il testo che include strutture di dati comuni e più complesse può essere estratto come entità. I tipi di entità includono persone, posizioni e date.
- Opzioni di selezione. Gli intervalli di testo che indicano una scelta possono essere estratti da alcuni modelli come opzioni di selezione. Queste opzioni includono pulsanti di opzione e caselle di controllo.
- Tabelle. Molti modelli possono estrarre tabelle in moduli digitalizzati inclusi i dati contenuti nelle celle, i numeri di colonne e righe e le intestazioni di colonna e di riga. Sono supportate le tabelle con celle unite.
- Campi. I modelli sottoposti a training per un tipo di modulo specifico identificano i valori di un set fisso di campi. Ad esempio, il modello di fattura include i campi CustomerName e InvoiceTotal.
Tenere anche presente che i modelli predefiniti sono progettati e sottoposti a training per tipi di documento e modulo generici. Se si dispone di un tipo di modulo specifico del settore o univoco usato spesso, è possibile ottenere risultati più affidabili e prevedibili usando un modello personalizzato. Tuttavia, per lo sviluppo di modelli personalizzati è richiesto tempo perché è necessario investire tempo e risorse per eseguirne il training su moduli di esempio prima di poterli usare. Maggiore è il numero di moduli di esempio forniti per il training, più accurata sarà la previsione del contenuto del modulo con il modello.
Requisiti di input
I modelli predefiniti sono molto flessibili, ma è possibile aiutarli a restituire risultati accurati e utili inviando una foto chiara o una scansione di alta qualità per ogni documento.
È anche necessario rispettare questi requisiti quando si invia un modulo per l'analisi:
- Il file deve essere in formato JPEG, PNG, BMP, TIFF o PDF. Inoltre, il modello di Lettura può accettare i file di Microsoft Office.
- Il file deve avere dimensioni minori di 500 MB per il livello standard e di 4 MB per il livello gratuito.
- Le immagini devono avere dimensioni comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
- I documenti PDF devono avere dimensioni inferiori a 17 x 17 pollici o A3.
- I documenti PDF non devono essere protetti con una password.
Nota
Se possibile, inviare file PDF con testo incorporato perché eliminano gli errori nel riconoscimento dei caratteri.
I file PDF e TIFF possono avere un numero qualsiasi di pagine, ma nel livello standard vengono analizzate solo le prime 2000 pagine. Nel livello gratuito vengono analizzate solo le prime due pagine.
Provare i modelli predefiniti con Azure AI Document Intelligence Studio
Informazioni sui documenti di Azure AI è progettato come servizio Web che è possibile chiamare usando codice in applicazioni personalizzate. Tuttavia, spesso è utile esplorare visivamente i modelli e il loro comportamento con i moduli. È possibile eseguire tali esperimenti usando Azure AI Document Intelligence Studio e sfruttare questa esperienza per progettare e scrivere il codice.
È possibile scegliere uno dei modelli predefiniti in Azure AI Document Intelligence Studio. Microsoft fornisce alcuni documenti di esempio da usare con ogni modello oppure si possono aggiungere documenti personalizzati e analizzarli.
Chiamata di modelli predefiniti usando le API
Poiché Informazioni sui documenti di Azure AI implementa servizi Web RESTful, è possibile usare le chiamate al servizio Web da qualsiasi linguaggio che le supporti. Tuttavia, quando si usano le API di Informazioni sui documenti di Azure AI di Microsoft, la gestione della sicurezza e della sessione è semplificata ed è necessario scrivere meno codice.
Sono disponibili API per:
- C# e altri linguaggi .NET.
- Java.
- Python.
- JavaScript.
Ogni volta che si vuole chiamare Informazioni sui documenti di Azure AI, è necessario iniziare connettendosi al servizio nella sottoscrizione di Azure con la relativa autenticazione. Per stabilire tale connessione, è necessario:
- Endpoint del servizio. Questo valore è l'URL in cui viene pubblicato il servizio.
- La chiave API. Questo valore è una chiave univoca che concede l'accesso.
È possibile ottenere entrambi i valori nel portale di Azure.
Poiché il servizio può richiedere alcuni secondi per rispondere, è consigliabile usare chiamate asincrone per inviare un modulo e poi ottenere i risultati dell'analisi:
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-layout", fileUri);
AnalyzeResult result = operation.Value;
poller = document_analysis_client.begin_analyze_document(
"prebuilt-layout", AnalyzeDocumentRequest(url_source=docUrl
))
result: AnalyzeResult = poller.result()
I dettagli che è possibile estrarre da questi risultati dipendono dal modello usato.