Modelli personalizzati di Riconoscimento modulo

Riconoscimento modulo usa la tecnologia avanzata di Machine Learning per rilevare ed estrarre informazioni da moduli e documenti e restituisce i dati estratti in un output JSON strutturato. Con Riconoscimento modulo, è possibile usare modelli predefiniti o pre-sottoposti a training oppure è possibile eseguire il training di modelli personalizzati autonomi. I modelli personalizzati estraggono e analizzano i dati distinti e i casi d'uso dai moduli e dai documenti specifici dell'azienda. I modelli personalizzati autonomi possono essere combinati per creare modelli composti.

Per creare un modello personalizzato, etichettare un set di dati di documenti con i valori che si desidera estrarre ed eseguire il training del modello nel set di dati etichettato. Sono necessari solo cinque esempi dello stesso tipo di modulo o documento per iniziare.

Tipi di modello personalizzati

I modelli personalizzati possono essere uno dei due tipi, modello personalizzato o modulo personalizzato e modelli di documento neurali o personalizzati . Il processo di etichettatura e training per entrambi i modelli è identico, ma i modelli differiscono come segue:

Modello modello personalizzato

Il modello di modulo personalizzato o il modello di modulo personalizzato si basa su un modello visivo coerente per estrarre i dati etichettati. L'accuratezza del modello è influenzata dalle varianza nella struttura visiva dei documenti. Forme strutturate, ad esempio questionari o applicazioni, sono esempi di modelli visivi coerenti.

Il set di training consisterà in documenti strutturati in cui la formattazione e il layout sono statici e costanti da un'istanza del documento alla successiva. I modelli di modello personalizzati supportano coppie chiave-valore, contrassegni di selezione, tabelle, campi di firma e aree. I modelli di modello e possono essere sottoposti a training su documenti in una delle lingue supportate. Per altre informazioni, vedereModelli di modello personalizzati.

Suggerimento

Per verificare che i documenti di training presentino un modello visivo coerente, rimuovere tutti i dati immessi dall'utente da ogni modulo nel set. Se i moduli vuoti sono identici nell'aspetto, rappresentano un modello visivo coerente.

Per altre informazioni, vedereInterpretare e migliorare l'accuratezza e la fiducia per i modelli personalizzati.

Modello neurale personalizzato

Il modello neurale personalizzato (documento personalizzato) usa modelli di deep learning e modelli di base sottoposti a training su una vasta raccolta di documenti. Questo modello viene quindi ottimizzato o adattato ai dati quando si esegue il training del modello con un set di dati etichettato. I modelli neurali personalizzati supportano documenti strutturati, semistrutturati e non strutturati per estrarre campi. I modelli neurali personalizzati supportano attualmente documenti in lingua inglese. Quando si sceglie tra i due tipi di modello, iniziare con un modello neurale per determinare se soddisfa le esigenze funzionali. Per altre informazioni sui modelli di documento personalizzati, vedere Modelli neurali .

Modalità di compilazione

L'operazione del modello personalizzato di compilazione ha aggiunto il supporto per il modello e i modelli personalizzati neurali . Le versioni precedenti dell'API REST e degli SDK supportano solo una singola modalità di compilazione che è ora nota come modalità modello .

  • I modelli di modello accettano solo documenti con la stessa struttura di pagina di base, un aspetto visivo uniforme o lo stesso posizionamento relativo degli elementi all'interno del documento.

  • I modelli neurali supportano documenti con le stesse informazioni, ma strutture di pagina diverse. Esempi di questi documenti includono Stati Uniti moduli W2, che condividono le stesse informazioni, ma possono variare in aspetto tra le aziende. I modelli neurali supportano attualmente solo il testo inglese.

Questa tabella fornisce collegamenti ai riferimenti e agli esempi di codice dell'SDK per la modalità di compilazione in GitHub:

Linguaggio di programmazione Informazioni di riferimento sugli SDK Esempio di codice
C#/.NET DocumentBuildMode Struct Sample_BuildCustomModelAsync.cs
Java Classe DocumentBuildMode BuildModel.java
JavaScript Tipo DocumentBuildMode buildModel.js
Python Enumerazione DocumentBuildMode sample_build_model.py

Confrontare le funzionalità del modello

La tabella seguente confronta i modelli personalizzati e le funzionalità neurali personalizzate:

Funzionalità Modello personalizzato (modulo) Neurale personalizzato (documento)
Struttura del documento Modello, modulo e strutturato Strutturata, semistrutturata e non strutturata
Tempo di formazione Da 1 a 5 minuti 20 minuti a 1 ora
Estrazione dei dati Coppie chiave-valore, tabelle, segni di selezione, coordinate e firme Coppie chiave-valore, contrassegni di selezione e tabelle
Varianti del documento Richiede un modello per ogni variante Usa un singolo modello per tutte le varianti
Lingue supportate Supporto per più lingue supporto della lingua inglese Stati Uniti (en-US)

Strumenti di modello personalizzati

Gli strumenti seguenti sono supportati da Riconoscimento modulo v3.0:

Funzionalità Risorse ID modello
Modello personalizzato custom-model-id

Gli strumenti seguenti sono supportati da Riconoscimento modulo v2.1:

Funzionalità Risorse ID modello
Modello personalizzato custom-model-id

Provare Riconoscimento modulo

Provare a estrarre dati dai documenti specifici o univoci usando modelli personalizzati. Sono necessarie le risorse seguenti:

Riconoscimento modulo Studio

Nota

Riconoscimento modulo Studio è disponibile con l'API v3.0.

  1. Nella home page di Riconoscimento modulo Studio selezionare Modulo personalizzato.

  2. In Progetti personali selezionare Crea un progetto.

  3. Completare i campi dei dettagli del progetto.

  4. Configurare la risorsa del servizio aggiungendo l'account di archiviazione e il contenitore BLOB per Connettere l'origine dati di training.

  5. Esaminare e creare il progetto.

  6. Usare i documenti di esempio per compilare e testare il modello personalizzato.

Funzionalità del modello

Questa tabella confronta le aree di estrazione dei dati supportate:

Modellare Campi modulo Opzioni di selezione Campi strutturati (tabelle) Firma Etichettatura delle regioni
Modello personalizzato
Neurale personalizzato n/a n/a

Simboli di tabella: —✔ supportato; **n/a: attualmente non disponibile

Suggerimento

Quando si sceglie tra i due tipi di modello, iniziare con un modello neurale personalizzato se soddisfa le esigenze funzionali. Vedere neurale personalizzato per altre informazioni sui modelli neurali personalizzati.

Opzioni di sviluppo di modelli personalizzati

Nella tabella seguente vengono descritte le funzionalità disponibili con gli strumenti e gli SDK associati. Come procedura consigliata, assicurarsi di usare gli strumenti compatibili elencati qui.

Document type API REST SDK Etichetta e modelli di test
Modulo personalizzato 2.1 API GA Riconoscimento modulo 2.1 Riconoscimento modulo SDK Strumento di etichettatura campioni
Modello personalizzato 3.0 Riconoscimento modulo 3.0 Riconoscimento modulo SDK Riconoscimento modulo Studio
Neurale personalizzato Riconoscimento modulo 3.0 Riconoscimento modulo SDK Riconoscimento modulo Studio

Nota

I modelli di modello personalizzati sottoposti a training con l'API 3.0 avranno alcuni miglioramenti rispetto all'API 2.1 che deriva dai miglioramenti apportati al motore OCR. I set di dati usati per eseguire il training di un modello di modello personalizzato usando l'API 2.1 possono comunque essere usati per eseguire il training di un nuovo modello usando l'API 3.0.

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • I formati di file supportati sono JPEG/JPG, PNG, BMP, TIFF e PDF (incorporato o analizzati). I documenti PDF con testo incorporato sono i più adatti per evitare ogni possibilità di errore nell'estrazione e individuazione dei caratteri.

  • Per i file PDF e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione a livello gratuito, vengono elaborate solo le prime due pagine.

  • Le dimensioni del file devono essere inferiori a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Le dimensioni PDF sono fino a 17 x 17 pollici, corrispondenti a Dimensioni legali o A3 o più piccole.

  • La dimensione totale dei dati di training è di 500 pagine o meno.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

    Suggerimento

    Dati di training:

    • Se possibile, usare documenti PDF basati su testo anziché documenti basati su immagini. I PDF analizzati vengono gestiti come immagini.
    • Specificare solo una singola istanza del modulo per documento.
    • Per i moduli compilati, usare esempi che hanno tutti i relativi campi compilati.
    • Usare moduli con valori diversi in ogni campo.
    • Se le immagini del modulo sono di qualità inferiore, usare un set di dati più grande. Ad esempio, usare da 10 a 15 immagini.

Lo strumento Di etichettatura di esempio non supporta il formato di file BMP. Questa limitazione si riferisce allo strumento, non al servizio di Riconoscimento modulo.

Lingue e impostazioni locali supportate

La versione Riconoscimento modulo v3.0 introduce più supporto linguistico per i modelli personalizzati. Per un elenco di testo scritto e stampato a mano supportato, vedere Supporto linguistico.

Riconoscimento modulo v3.0

Riconoscimento modulo v3.0 introduce diverse nuove funzionalità e funzionalità:

  • API modello personalizzata (v3.0): questa versione supporta il rilevamento delle firme per i moduli personalizzati. Quando si esegue il training di modelli personalizzati, è possibile specificare determinati campi come firme. Quando un documento viene analizzato con il modello personalizzato, indica se è stata rilevata o meno una firma.
  • Riconoscimento modulo guida alla migrazione v3.0: questa guida illustra come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.
  • API REST : questa API mostra altre informazioni sulla versione v3.0 e sulle nuove funzionalità.

Provare il rilevamento delle firme

  1. Creare il set di dati di training.

  2. Passare a Riconoscimento modulo Studio. In Modelli personalizzati selezionare Modulo personalizzato.

    Screenshot che mostra la selezione della pagina del modulo personalizzato Riconoscimento modulo Studio.

  3. Seguire il flusso di lavoro per creare un nuovo progetto:

    1. Seguire i requisiti di input del modello personalizzati .

    2. Etichettare i documenti. Per i campi delle firme , usare l'etichettatura area per migliorare l'accuratezza.

      Screenshot che mostra il campo Firma etichetta.

Dopo aver etichettato il set di training, è possibile eseguire il training del modello personalizzato e usarlo per analizzare i documenti. I campi della firma specificano se è stata rilevata o meno una firma.

Passaggi successivi

Esplorare Riconoscimento modulo guide introduttive e api REST:

Guida introduttiva API REST
Guida introduttiva a v3.0 Studio RICONOSCIMENTO MODULO API v3.0 2022-08-31
Guida introduttiva alla versione 2.1 API Riconoscimento modulo v2.1