Comporre modelli personalizzati v3.0

Nota

Questa guida pratica fa riferimento Riconoscimento modulo v3.0 . Per usare Riconoscimento modulo v2.1 , vedere Comporre modelli personalizzati v2.1.

Un modello composto viene creato prendendo una raccolta di modelli personalizzati e assegnandoli a un singolo ID modello. È possibile assegnare fino a 100 modelli personalizzati sottoposti a training a un singolo ID modello composto. Quando un documento viene inviato a un modello composto, il servizio esegue un passaggio di classificazione per decidere quale modello personalizzato rappresenta in modo accurato il modulo presentato per l'analisi. I modelli composti sono utili quando è stato eseguito il training di diversi modelli e si vuole raggrupparli per analizzare tipi di modulo simili. Ad esempio, il modello composto potrebbe includere modelli personalizzati sottoposti a training per analizzare la fornitura, l'attrezzatura e gli ordini di acquisto di mobili. Anziché tentare manualmente di selezionare il modello appropriato, è possibile usare un modello composto per determinare il modello personalizzato appropriato per ogni analisi ed estrazione.

Per altre informazioni, vedere Modelli personalizzati composti.

In questo articolo si apprenderà come creare e usare modelli personalizzati composti per analizzare i moduli e i documenti.

Prerequisiti

Per iniziare, sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure. È possibile creare una sottoscrizione gratuita di Azure.

  • Istanza di Riconoscimento modulo. Dopo aver creato la sottoscrizione di Azure, creare una risorsa Riconoscimento modulo nel portale di Azure per ottenere la chiave e l'endpoint. Se si dispone di una risorsa Riconoscimento modulo esistente, passare direttamente alla pagina della risorsa. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

    1. Al termine della distribuzione della risorsa selezionare Vai alla risorsa.

    2. Copiare i valori Chiavi ed Endpoint dal portale di Azure e incollarli in una posizione comoda, ad esempio Il Blocco note Microsoft. Sono necessari i valori di chiave ed endpoint per connettere l'applicazione all'API Riconoscimento modulo.

    Ancora foto che mostra come accedere alla chiave di risorsa e all'URL dell'endpoint.

    Suggerimento

    Per altre informazioni, vedere Creare una risorsa Riconoscimento modulo.

  • Un account di archiviazione di Azure. Se non si sa come creare un account di archiviazione di Azure, seguire la guida introduttiva di Archiviazione di Azure per portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

Creare modelli personalizzati

Prima di tutto, è necessario un set di modelli personalizzati da comporre. È possibile usare gli SDK di Riconoscimento modulo Studio, DELL'API REST o della libreria client. La procedura è la seguente:

Assemblare il set di dati di training

La creazione di un modello personalizzato inizia con la definizione del set di dati di training. Per il set di dati di esempio sono necessari almeno cinque moduli completati dello stesso tipo. Possono essere di diversi tipi di file (jpg, png, pdf, tiff) e contengono sia testo che grafia. I moduli devono rispettare i requisiti di input per Riconoscimento modulo.

Suggerimento

Seguire questi suggerimenti per ottimizzare il set di dati per il training:

  • Se possibile, utilizzare documenti PDF basati su testo anziché documenti basati su immagini. I PDF analizzati vengono gestiti come immagini.
  • Per i moduli compilati, usare esempi con tutti i campi compilati.
  • Usare moduli con valori diversi in ogni campo.
  • Se le immagini del modulo sono di qualità inferiore, usare un set di dati più grande (ad esempio, 10-15 immagini).

Per suggerimenti su come raccogliere i documenti di training, vedere Creare un set di dati di training.

Caricare il set di dati di training

Dopo aver raccolto un set di documenti di training, è necessario caricare i dati di training in un contenitore di archiviazione BLOB di Azure.

Se si vogliono usare dati etichettati manualmente, è anche necessario caricare i file .labels.json e ocr.json corrispondenti ai documenti di training.

Eseguire il training del modello personalizzato

Quando si esegue il training del modello con dati etichettati, il modello usa l'apprendimento supervisionato per estrarre i valori di interesse, usando i moduli etichettati forniti. I dati etichettati generano modelli con prestazioni migliori e possono produrre modelli che funzionano con forme o moduli complessi contenenti valori senza chiavi.

Riconoscimento modulo usa l'API del modello di layout predefinito per apprendere le dimensioni e le posizioni previste del carattere tipografico e degli elementi di testo scritto a mano ed estrarre tabelle. Usa quindi le etichette specificate dall'utente per apprendere le associazioni chiave/valore e le tabelle nei documenti. È consigliabile usare cinque forme etichettate manualmente dello stesso tipo (stessa struttura) per iniziare a eseguire il training di un nuovo modello. Aggiungere quindi altri dati etichettati, se necessario, per migliorare l'accuratezza del modello. Riconoscimento modulo consente di eseguire il training di un modello per estrarre coppie chiave-valore e tabelle usando funzionalità di apprendimento supervisionate.

Per creare modelli personalizzati, iniziare con la configurazione del progetto:

  1. Nella home page di Studio selezionare Crea nuovo dalla scheda Modello personalizzato.

  2. Usare il ➕ comando Crea un progetto per avviare la configurazione guidata del nuovo progetto.

  3. Immettere i dettagli del progetto, selezionare la sottoscrizione e la risorsa di Azure e il contenitore di archiviazione BLOB di Azure che contiene i dati.

  4. Esaminare e inviare le impostazioni per creare il progetto.

Animazione che mostra la creazione di un progetto personalizzato in Riconoscimento modulo Studio.

Durante la creazione di modelli personalizzati, potrebbe essere necessario estrarre raccolte di dati dai documenti. Le raccolte possono essere visualizzate in uno dei due formati. Uso di tabelle come modello visivo:

  • Conteggio dinamico o variabile di valori (righe) per un determinato set di campi (colonne)

  • Raccolta specifica di valori per un determinato set di campi (colonne e/o righe)

Vedere Riconoscimento modulo Studio: etichettatura come tabelle

Creare un modello composto

Nota

l'operazione create compose model è disponibile solo per i modelli personalizzati sottoposti a training con etichette. Il tentativo di comporre modelli non etichettati genererà un errore.

Con l'operazione create compose model è possibile assegnare fino a 100 modelli personalizzati sottoposti a training a un singolo ID modello. Quando si analizzano i documenti con un modello composto, Riconoscimento modulo prima classifica il modulo inviato, quindi sceglie il modello assegnato più adatto e restituisce i risultati per tale modello. Questa operazione è utile quando i moduli in ingresso possono appartenere a uno dei diversi modelli.

Al termine del processo di training, è possibile iniziare a compilare il modello composto. Ecco i passaggi per la creazione e l'uso di modelli composti:

Raccogliere gli ID modello

Quando si esegue il training dei modelli usando Riconoscimento modulo Studio, l'ID modello si trova nel menu modelli in un progetto:

Screenshot: finestra di configurazione del modello in Riconoscimento modulo Studio.

Comporre i modelli personalizzati

  1. Selezionare un progetto di modelli personalizzati.

  2. Nel progetto selezionare la voce di Models menu.

  3. Nell'elenco risultante dei modelli selezionare i modelli che si desidera comporre.

  4. Scegliere il pulsante Compose dall'angolo superiore sinistro.

  5. Nella finestra popup assegnare un nome al modello appena composto e selezionare Compose.

  6. Al termine dell'operazione, il modello appena composto verrà visualizzato nell'elenco.

  7. Dopo aver pronto il modello, usare il comando Test per convalidarlo con i documenti di test e osservare i risultati.

Analizzare i documenti

L'operazione Di analisi del modello personalizzato richiede di fornire l'oggetto modelID nella chiamata a Riconoscimento modulo. È necessario specificare l'ID modello composto per il modelID parametro nelle applicazioni.

Screenshot di un ID modello composto in Riconoscimento modulo Studio.

Gestire i modelli composti

È possibile gestire i modelli personalizzati in tutti i cicli di vita:

  • Testare e convalidare nuovi documenti.
  • Scaricare il modello da usare nelle applicazioni.
  • Eliminare il modello al termine del ciclo di vita.

Screenshot di un modello composto in Riconoscimento modulo Studio

Passaggi successivi

Provare una delle guide introduttive Riconoscimento modulo:

C#