Che cos'è Riconoscimento modulo di Azure?

Questo articolo si applica a:Riconoscimento modulo segno di spunta v3.0Riconoscimento modulo v3.0. Versione precedente:Riconoscimento modulo v2.1

Azure Riconoscimento modulo è un servizio di intelligenza artificiale applicato al cloud che consente agli sviluppatori di creare soluzioni intelligenti per l'elaborazione di documenti. Riconoscimento modulo applica il riconoscimento ottico dei caratteri (OCR) basato su Machine Learning e le tecnologie di comprensione dei documenti per estrarre coppie di testo scritto a mano, tabelle, struttura e coppie chiave-valore. È anche possibile etichettare ed eseguire il training di modelli personalizzati per automatizzare l'estrazione dei dati da documenti strutturati, semistrutturati e non strutturati. Per altre informazioni su ogni modello, vedere gli articoli Concetti:

Tipo di modello Nome modello
Modelli di analisi dei documenti Leggere il modello
OCR ● Modello
di documento generaleModello di analisi del layout
Modelli predefiniti ● Modello di modulo
W-2● Modello di fattura
● Modello di ricevuta
Modello di documento
Identità (ID) ● Modello di biglietto da visita
Modelli personalizzati Modello personalizzato
Modello composto

Quale modello Riconoscimento modulo è consigliabile usare?

Questa sezione consente di decidere quale modello supportato Riconoscimento modulo v3.0 da usare per l'applicazione:

Tipo di documento Dati da estrarre Formato documento La soluzione migliore
Un documento generico , ad esempio un contratto o una lettera. Si vogliono estrarre principalmente righe di testo, parole, posizioni e lingue rilevate. Il documento viene scritto o stampato in una lingua supportata. Leggere il modello OCR
Documento che include informazioni strutturali come un report o uno studio. Oltre al testo, è necessario estrarre informazioni strutturali come tabelle, segni di selezione, paragrafi, titoli, intestazioni e sottotitoli. Il documento viene scritto o stampato in una lingua supportata Modello di analisi del layout
Documento strutturato o semistrutturato che include il contenuto formattato come campi e valori, ad esempio un modulo di richiesta di credito o sondaggio. Si vogliono estrarre campi e valori, inclusi quelli non coperti dai modelli predefiniti specifici dello scenario senza dover eseguire il training di un modello personalizzato. Il modulo o il documento è un formato standardizzato comunemente usato nell'azienda o nel settore e stampato in una lingua supportata. Modello di documento generale
Modulo U.S. W-2 Si vogliono estrarre informazioni chiave come stipendio, salari e imposte trattenute dai moduli fiscali US W2. Il documento W-2 è in testo Stati Uniti inglese (en-US). Modello W-2
Fattura Si vogliono estrarre le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione e l'importo dovuto dalle fatture. Il documento della fattura viene scritto o stampato in una lingua supportata. Modello di fattura
Ricevuta Si vogliono estrarre informazioni sulla chiave, ad esempio il nome del commerciante, la data della transazione e il totale delle transazioni da una ricevuta di vendita o di hotel a pagina singola. La ricevuta viene scritta o stampata in una lingua supportata. Modello di ricevuta
Documento di identità (ID) come una patente di passaporto o di guida. Si desidera estrarre informazioni chiave, ad esempio nome, cognome e data di nascita dalle licenze dei conducenti statunitensi o passaporti internazionali. Il documento id è una patente di guida statunitense o la pagina biografica da un passaporto internazionale (non un visto). Modello di documento di identità (ID)
Tessera business Si vogliono estrarre informazioni chiave, ad esempio nome, cognome, nome della società, indirizzo di posta elettronica e numero di telefono dai biglietti da visita. Il documento del biglietto da visita è in testo inglese o giapponese. Modello di biglietto da visita
Documenti di tipo misto Si vogliono estrarre coppie chiave-valore, segni di selezione, tabelle, campi firma e aree selezionate non estratte da modelli di documento predefiniti o generali. Sono disponibili vari documenti con elementi strutturati, semistrutturati e/o non strutturati. Modello personalizzato

Suggerimento

  • Se non si è ancora certi del modello da usare, provare il modello Documento generale per estrarre coppie chiave-valore.
  • Il modello Documento generale è basato sul motore OCR di lettura per rilevare righe di testo, parole, posizioni e lingue.
  • Il documento generale estrae anche gli stessi dati del modello di layout del documento (pagine, tabelle, stili).

Modelli di elaborazione documenti e opzioni di sviluppo

Nota

I modelli di analisi dei documenti e le opzioni di sviluppo seguenti sono supportati dal servizio Riconoscimento modulo v3.0.

È possibile usare Riconoscimento modulo per automatizzare l'elaborazione dei documenti in applicazioni e flussi di lavoro, migliorare le strategie basate sui dati e arricchire le funzionalità di ricerca dei documenti. Usare i collegamenti nella tabella per altre informazioni su ogni modello ed esplorare i riferimenti all'API.

Modellare Descrizione Casi d'uso di Automazione Opzioni di sviluppo
Leggere il modello OCR Estrarre righe di testo, parole, lingue rilevate e stile scritto a mano, se rilevato.
  • Elaborazione del contratto.
  • Elaborazione di report finanziari o medici.
Modello di documento generale Estrarre coppie di testo, tabelle, struttura e chiave-valore.
  • Estrazione di coppie chiave-valore.
  • Elaborazione dei moduli.
  • Raccolta e analisi dei dati del sondaggio.
Modello di analisi del layout Estrarre testo, segni di selezione e strutture di tabelle, insieme alle coordinate del rettangolo delimitatore, da moduli e documenti.

L'API di layout è stata aggiornata a un modello predefinito.
  • Indicizzazione e recupero di documenti in base alla struttura.
  • Pre-elaborazione prima dell'analisi OCR.
Modello personalizzato (aggiornato) Estrazione e analisi dei dati da moduli e documenti specifici per dati aziendali distinti e casi d'uso.

L'API modello personalizzato v3.0 supporta il rilevamento delle firme per i modelli di modello personalizzato (modulo personalizzato).

L'API del modello personalizzato v3.0 supporta ora due tipi di modello:
  • Identificazione e compilazione dei dati, univoci per l'azienda, interessati da un cambiamento normativo o da un evento di mercato.
  • Identificazione e analisi dei dati univoci precedentemente trascurati.
Riconoscimento modulo Studio
  • API REST
  • SDK per C#
  • Python SDK
  • SDK per Java
  • JavaScript
  • Modulo W-2 Estrarre le informazioni segnalate in ogni casella in un modulo W-2.
    • Gestione automatica dei documenti fiscali.
    • Trattamento delle richieste di prestito ipotecario.
    Modello di fattura Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle fatture di vendita.
    • Elaborazione dei conti pagabili.
    • Registrazione e creazione di report fiscali automatizzati.
    Modello di ricevuta (aggiornato) Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle ricevute di vendita.

    Il modello di ricevuta v3.0 supporta l'elaborazione di ricevute di hotel a pagina singola.
    • Gestione delle spese.
    • Analisi dei dati sul comportamento del consumer.
    • Programma fedeltà dei clienti.
    • Elaborazione dei resi della merce.
    • Registrazione e creazione di report fiscali automatizzati.
    Modello di documento di identità (ID) (aggiornato) Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle licenze e dai passaporti internazionali dei conducenti statunitensi.

    L'API documento ID predefinito supporta l'estrazione di approvazioni, restrizioni e classificazioni dei veicoli dalle licenze dei conducenti degli Stati Uniti.
    • Conoscere la conformità dei servizi finanziari del cliente (KYC).
    • Gestione dell'account medico.
    • Checkpoint di identità e gateway.
    • Registrazione dell'hotel.
    Modello di biglietto da visita Elaborazione e estrazione automatizzate di informazioni chiave dai biglietti da visita.
    • Responsabile vendite e gestione marketing.

    Questo articolo si applica a:Riconoscimento modulo v2.1 segno di spuntaRiconoscimento modulo v2.1. Versione successiva:Riconoscimento modulo v3.0

    Azure Riconoscimento modulo è un servizio di intelligenza artificiale applicato al cloud che consente agli sviluppatori di creare soluzioni intelligenti per l'elaborazione di documenti. Riconoscimento modulo applica il riconoscimento ottico dei caratteri (OCR) basato su Machine Learning e le tecnologie di comprensione dei documenti per estrarre coppie di testo scritto a mano, tabelle, struttura e coppie chiave-valore. È anche possibile etichettare ed eseguire il training di modelli personalizzati per automatizzare l'estrazione dei dati da documenti strutturati, semistrutturati e non strutturati. Per altre informazioni su ogni modello, vedere gli articoli Concetti:

    Tipo di modello Nome modello
    Modello di analisi dei documenti Modello di analisi del layout
    Modelli predefiniti Modello di fattura
    ● Modello di ricevuta
    Modello di documento di identità (ID)
    Modello di biglietto da visita
    Modelli personalizzati Modello personalizzato
    Modello composto

    Quale modello di elaborazione dei documenti è necessario usare?

    Questa sezione consente di decidere quale modello supportato Riconoscimento modulo v2.1 da usare per l'applicazione:

    Tipo di documento Dati da estrarre Formato documento La soluzione migliore
    Documento che include informazioni strutturali come un report o uno studio. Oltre al testo, è necessario estrarre informazioni strutturali come tabelle e segni di selezione. Il documento viene scritto o stampato in una lingua supportata Modello di analisi del layout
    Fattura Si vogliono estrarre le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione e l'importo dovuto dalle fatture. Il documento della fattura viene scritto o stampato in una lingua supportata. Modello di fattura
    Ricevuta Si vogliono estrarre informazioni sulla chiave, ad esempio il nome del commerciante, la data della transazione e il totale delle transazioni da una ricevuta di vendita o di hotel a pagina singola. La ricevuta viene scritta o stampata in una lingua supportata. Modello di ricevuta
    Documento di identità (ID) come una patente di passaporto o di guida. Si desidera estrarre informazioni chiave, ad esempio nome, cognome e data di nascita dalle licenze dei conducenti statunitensi o passaporti internazionali. Il documento id è una patente di guida statunitense o la pagina biografica da un passaporto internazionale (non un visto). Modello di documento ID
    Tessera business Si vogliono estrarre informazioni chiave, ad esempio nome, cognome, nome della società, indirizzo di posta elettronica e numero di telefono dai biglietti da visita. Il documento del biglietto da visita è in testo inglese o giapponese. Modello di biglietto da visita
    Documenti di tipo misto Si vogliono estrarre coppie chiave-valore, segni di selezione, tabelle, campi firma e aree selezionate non estratte da modelli di documento predefiniti o generali. Sono disponibili vari documenti con elementi strutturati, semistrutturati e/o non strutturati. Modello personalizzato

    Riconoscimento modulo modelli e opzioni di sviluppo

    Suggerimento

    • Per un'esperienza avanzata e una qualità avanzata del modello, provare Riconoscimento modulo v3.0 Studio.
    • V3.0 Studio supporta qualsiasi modello sottoposto a training con dati con etichetta v2.1.
    • Per informazioni dettagliate sulla migrazione dalla versione 2.1 alla versione 3.0, vedere la guida alla migrazione delle API.

    Nota

    I modelli e le opzioni di sviluppo seguenti sono supportati dal servizio Riconoscimento modulo v2.1.

    Usare i collegamenti nella tabella per altre informazioni su ogni modello ed esplorare i riferimenti all'API:

    Modellare Descrizione Opzioni di sviluppo
    Analisi del layout Estrazione e analisi di testo, segni di selezione, tabelle e coordinate di rettangolo delimitatore, da moduli e documenti.
    Modello personalizzato Estrazione e analisi dei dati da moduli e documenti specifici per dati aziendali distinti e casi d'uso.
    Modello di fattura Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle fatture di vendita.
    Modello di ricevuta Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle ricevute di vendita.
    Modello di documento di identità (ID) Elaborazione automatica dei dati ed estrazione delle informazioni chiave dalle licenze e dai passaporti internazionali dei conducenti statunitensi.
    Modello di biglietto da visita Elaborazione e estrazione automatizzate di informazioni chiave dai biglietti da visita.

    Sicurezza e privacy dei dati

    Come per tutti i servizi di intelligenza artificiale, gli sviluppatori che usano il servizio Riconoscimento modulo devono essere consapevoli dei criteri Microsoft sui dati dei clienti. Vedere la pagina Dati, privacy e sicurezza per Riconoscimento modulo.

    Passaggi successivi