Quale modello occorre scegliere?
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Informazioni sui documenti è la versione dell'API REST 2024-02-29-preview.
- La versione di anteprima pubblica 2024-02-29-preview è al momento disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti:
v3.1 (disponibilità generale)
v3.0 (disponibilità generale)
Questo contenuto si applica a: v3.1 (disponibilità generale) | Ultima versione:
v4.0 (anteprima) | Versioni precedenti:
v3.0
Questo contenuto si applica a: v3.0 (disponibilità generale) | Ultime versioni:
v4.0 (anteprima)
v3.1
Informazioni sui documenti di Azure AI supporta un'ampia gamma di modelli che consentono di aggiungere funzionalità di elaborazione intelligente dei documenti alle applicazioni e ottimizzare i flussi di lavoro. La selezione del modello corretto è essenziale per garantire il raggiungimento degli obiettivi aziendali. In questo articolo vengono esaminati i modelli di Informazioni sui documenti disponibili e vengono fornite indicazioni su come scegliere la soluzione migliore in base ai progetti.
I grafici decisionali seguenti evidenziano le funzionalità di ogni modello di Informazioni sui documenti v3.0 supportato e consentono di scegliere il modello migliore per soddisfare le esigenze e i requisiti dell'applicazione.
Importante
Assicurarsi di controllare la pagina supporto per la lingua per il testo della lingua e l'estrazione dei campi supportati per funzionalità.
Modelli di analisi dei documenti con training preliminare
Tipo di documento | Esempio | Dati da estrarre | Soluzione ottimale |
---|---|---|---|
Documento generico. | Contratto o lettera. | Si desidera estrarre principalmente righe di testo scritte o stampate, parole, posizioni e lingue rilevate. | Modello Lettura OCR |
Documento che include informazioni strutturali. | Report o studio. | Oltre a testo scritto o stampato, è necessario estrarre informazioni strutturali come tabelle, indicatori di selezione, paragrafi, titoli, intestazioni e sottotitoli. | Modello di analisi layout |
Documento strutturato o semistrutturato che include il contenuto formattato come campi (chiavi) e valori. | Un modulo o un documento che è un formato standardizzato comunemente usato nell'azienda o nel settore, ad esempio una richiesta di credito o un sondaggio. | Si vogliono estrarre campi e valori, inclusi quelli non coperti dai modelli predefiniti specifici dello scenario senza dover eseguire il training di un modello personalizzato. | **Modello di analisi del layout con il parametro della stringa di query facoltativo features=keyValuePairs abilitato ** |
Modelli specifici dello scenario con training preliminare
Tipo di documento | Dati da estrarre | Soluzione ottimale |
---|---|---|
Modulo fiscale W-2 Stati Uniti | Si vogliono estrarre informazioni chiave come stipendio, retribuzioni e imposte trattenute. | Modello fiscale W-2 Stati Uniti |
Modulo fiscale 1098 Stati Uniti | Si vogliono estrarre i dettagli degli interessi ipotecari, ad esempio capitale, punti e imposte. | Modello fiscale 1098 Stati Uniti |
Modulo fiscale 1098-E Stati Uniti | Si vogliono estrarre i dettagli degli interessi dei prestiti agli studenti, ad esempio il creditore e l'importo degli interessi. | Modello fiscale 1098-E Stati Uniti |
Modulo fiscale 1098T Stati Uniti | Si vogliono estrarre i dettagli idonei relativi a rette scolastiche, ad esempio modifiche a borse di studio, stato degli studenti e informazioni sul creditore. | Modello fiscale 1098-T Stati Uniti |
Modulo fiscale 1099 (variazioni) Stati Uniti | Si vogliono estrarre informazioni dai moduli 1099 e dalle relative variazioni (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Modello fiscale 1099 Stati Uniti |
Modulo fiscale 1040 (variazioni) Stati Uniti | Si vogliono estrarre informazioni dai moduli 1040 e dalle relative variazioni (Pianificazione 1, Pianificazione 2, Pianificazione 3, Pianificazione 8812, Pianificazione A, Pianificazione B, Pianificazione C, Pianificazione D, Pianificazione E, Pianificazione EIC, Pianificazione F, Pianificazione H, Pianificazione J, Pianificazione R, Pianificazione SE, Pianificazione Senior). |
Modello fiscale 1040 Stati Uniti |
Contratto (accordo legale tra le parti). | Si vogliono estrarre i dettagli del contratto, ad esempio parti, date e intervalli. | Modello di contratto |
Scheda assicurazione sanitaria o ID assicurazione sanitaria. | Si desidera estrarre informazioni chiave come assicuratore, ID membro, copertura assicurativa e numero di gruppo. | Modello per schede assicurazione sanitaria |
Carta di credito/debito. | Si vogliono estrarre le informazioni chiave delle carte bancarie, ad esempio il numero di carta e il nome della banca. | Modello di carta di credito/debito |
Certificato di matrimonio. | Si vogliono estrarre le informazioni chiave dai certificati di matrimonio. | Modello di certificato di matrimonio |
Fattura o estratto conto. | Si vogliono estrarre le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione e l'importo dovuto. | Modello di fattura |
Ricevuta, voucher o ricevuta di hotel a pagina singola. | Si vogliono estrarre le informazioni chiave, ad esempio il nome del fornitore di servizi, la data della transazione e il totale delle transazioni. | Modello per ricevute |
Documento di identità come una patente di guida statunitense o un passaporto internazionale. | Si vogliono estrarre le informazioni chiave, ad esempio nome, cognome, data di nascita, indirizzo e firma. | Modello Documento di identità (ID) |
Mutuo 1003 Stati Uniti. | Si vogliono estrarre le informazioni chiave dalla richiesta di finanziamento residenziale uniforme. | Modello di modulo 1003 |
Mutuo 1008 Stati Uniti. | Si vogliono estrarre le informazioni chiave dal riepilogo di sottoscrizione e trasmissione uniforme. | Modello di modulo 1008 |
Divulgazione di chiusura mutuo Stati Uniti. | Si vogliono estrarre le informazioni chiave da un modulo di divulgazione di chiusura mutuo. | Modello di modulo di divulgazione di chiusura mutuo |
Documenti di tipo misto con elementi strutturati, semistrutturati e/o non strutturati. | Si vogliono estrarre coppie chiave-valore, indicatori di selezione, tabelle, campi di firma e aree selezionate non estratte da modelli di documento predefiniti o generali. | Modello personalizzato |
Suggerimento
- Se non si è certi del modello con training preliminare da usare, provare il modello di layout con il parametro della stringa di query facoltativo
features=keyValuePairs
abilitato. - Il modello di layout è basato sul motore OCR di lettura per rilevare pagine, tabelle, stili, testo, righe, parole, posizioni e lingue.
Modelli di estrazione personalizzati
Set di training | Documenti di esempio | Soluzione ottimale |
---|---|---|
Documenti strutturati, coerenti e con layout statico. | Moduli strutturati, ad esempio questionari o richieste. | Modello personalizzato |
Documenti strutturati, semistrutturati e non strutturati. | ● Strutturati → sondaggi ● Semistrutturati → fatture ● Non strutturati → lettere |
Modello neurale personalizzato |
Raccolta di diversi modelli sottoposti a training su documenti di tipo simile. | ● Ordini di acquisto di forniture ● Ordini di acquisto attrezzature ● Ordini di acquisto mobili Tutti composti in un unico modello. |
Modello personalizzato composto |
Modello di classificazione personalizzato
Set di training | Documenti di esempio | Soluzione ottimale |
---|---|---|
Almeno due tipi diversi di documenti. | Moduli, lettere o documenti | Modello di classificazione personalizzato |
Passaggi successivi
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per