Modello di documento generale di Riconoscimento modulo

Questo articolo si applica a:Riconoscimento modulo segno di spunta v3.0Riconoscimento modulo v3.0.

Il modello General document v3.0 combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per estrarre coppie chiave-valore, tabelle e segni di selezione dai documenti. Il documento generale è disponibile solo con l'API v3.0. Per altre informazioni sull'uso dell'API v3.0, vedere la guida alla migrazione.

Estrazione di coppie chiave-valore

L'API documento generale supporta la maggior parte dei tipi di modulo e analizza i documenti ed estrae le chiavi e i valori associati. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.

Nota

Le 2022-06-30 versioni successive del modello di documento generale aggiungono il supporto per i contrassegni di selezione.

Funzionalità generali del documento

  • Il modello di documento generale è un modello con training preliminare; non richiede etichette o training.

  • Una singola API estrae coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti.

  • Il modello di documento generale supporta documenti strutturati, semistrutturati e non strutturati.

  • I nomi delle chiavi sono spazi di testo all'interno del documento associati a un valore.

  • I segni di selezione sono identificati come campi con un valore o :selected::unselected:

Documento di esempio elaborato in Riconoscimento modulo Studio

Screenshot: analisi generale dei documenti in Riconoscimento modulo Studio.

Opzioni di sviluppo

Gli strumenti seguenti sono supportati da Riconoscimento modulo v3.0:

Funzionalità Risorse ID modello
Modello di documento generale precompilt-document

Provare Riconoscimento modulo

Provare a estrarre dati da moduli e documenti usando Riconoscimento modulo Studio.

Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Istanza di Riconoscimento modulo nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot: chiavi e posizione dell'endpoint nel portale di Azure.

Riconoscimento modulo Studio

Nota

Riconoscimento modulo Studio e il modello di documento generale sono disponibili con l'API v3.0.

  1. Nella home page di Riconoscimento modulo Studio selezionare Documenti generali

  2. È possibile analizzare il documento di esempio o selezionare il pulsante + Aggiungi per caricare il proprio esempio.

  3. Selezionare il pulsante Analizza :

    Screenshot: analizzare il menu generale del documento.

Coppie chiave-valore

Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un modulo strutturato, queste coppie possono essere l'etichetta e il valore immesso dall'utente per tale campo. In un documento non strutturato, potrebbe essere la data in cui è stato eseguito un contratto in base al testo di un paragrafo. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documento, formati e strutture.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata sarà cliente o utente (in base al contesto).

Estrazione dei dati

Modello Estrazione del testo Coppie chiave-valore Segni di selezione Tabelle
Documento generale

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modellare PDF Immagine:
    JPEG/JPG, PNG, BMP e TIFF
    Microsoft Office:
    Word (DOCX), Excel (XLS), PowerPoint (PPT) e HTML
    Lettura versione dell'API REST
    2022/06/30-preview
    Layout
    Documento generale
    Predefinita
    Personalizzato

    ✱ i file di Microsoft Office non sono attualmente supportati per altri modelli o versioni.

  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti devono essere inferiori a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Le dimensioni PDF sono fino a 17 x 17 pollici, corrispondenti alle dimensioni di carta Legal o A3 o più piccole.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine di 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice (DPI).

  • Per il training del modello personalizzato, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

  • Per il training del modello personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

Lingue e impostazioni locali supportate

Nota

Non è necessario specificare le impostazioni locali. Questo parametro è facoltativo. La tecnologia di deep learning Riconoscimento modulo rileverà automaticamente la lingua del testo nell'immagine.

Modellare Lingua: codice delle impostazioni locali Predefinito
Documento generale
  • Inglese (Stati Uniti)- en-US
Inglese (Stati Uniti)- en-US

Considerazioni

  • Le chiavi sono estese di testo estratto dal documento, per documenti semistrutturati, potrebbe essere necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.

  • Aspettarsi di visualizzare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.

Passaggi successivi