Introduzione allo strumento di etichettatura degli esempi di analisi dei documenti

Questo contenuto si applica a:Segno di spunta di Document Intelligence v2.1v2.1.

Suggerimento

  • Per un'esperienza avanzata e una qualità avanzata del modello, provare Document Intelligence v3.0 Studio.
  • V3.0 Studio supporta qualsiasi modello sottoposto a training con dati con etichetta v2.1.
  • Per informazioni dettagliate sulla migrazione dalla versione 2.1 alla versione 3.0, vedere la guida alla migrazione delle API.
  • Per iniziare a usare la versione 3.0, vedere le guide introduttive sull'API REST o C#, Java, JavaScript o Python SDK.

Lo strumento di etichettatura di esempio di Document Intelligence per intelligenza artificiale di Azure è uno strumento open source che consente di testare le funzionalità più recenti dei servizi OCR (Document Intelligence and Optical Character Recognition):

Prerequisiti

Per iniziare, è necessario quanto segue:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Un servizio di intelligenza artificiale di Azure o una risorsa di Document Intelligence. Dopo aver creato la sottoscrizione di Azure, creare una risorsa di Document Intelligence a servizio singolo o multiservizio nella portale di Azure per ottenere la chiave e l'endpoint. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

    Suggerimento

    Creare una risorsa dei servizi di intelligenza artificiale di Azure se si prevede di accedere a più servizi di intelligenza artificiale di Azure con un singolo endpoint/chiave. Solo per l'accesso a Document Intelligence, creare una risorsa di Document Intelligence. Si noti che è necessaria una risorsa a servizio singolo se si intende usare l'autenticazione Microsoft Entra.

Creare una risorsa di Document Intelligence

Passare alla portale di Azure e creare una nuova risorsa di Document Intelligence. Nel riquadro Crea specificare le informazioni seguenti:

Dettagli di progetto Descrizione
Abbonamento Selezionare la sottoscrizione di Azure a cui è stato concesso l'accesso.
Gruppo di risorse Gruppo di risorse di Azure che contiene la risorsa. È possibile creare un nuovo gruppo o aggiungerla a un gruppo già esistente.
Area Posizione della risorsa dei servizi di intelligenza artificiale di Azure. Posizioni diverse possono introdurre latenza, ma non hanno alcun impatto sulla disponibilità di runtime della risorsa.
Nome Nome per la risorsa. È consigliabile usare un nome descrittivo, ad esempio MyNameFormRecognizer.
Piano tariffario Il costo della risorsa varia a seconda del piano tariffario selezionato e dell'utilizzo. Per altre informazioni, vedere i dettagli sui prezzi delle API.
Rivedi e crea Selezionare il pulsante Rivedi e crea per distribuire la risorsa nel portale di Azure.

Recuperare la chiave e l'endpoint

Al termine della distribuzione della risorsa di Document Intelligence, trovare e selezionarla dall'elenco Tutte le risorse nel portale. La chiave e l'endpoint si troveranno nella pagina Chiave ed endpoint della risorsa, in Gestione risorse. Salvarli entrambi in un percorso temporaneo prima di procedere.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Analizzare usando un modello predefinito

Document Intelligence offre diversi modelli predefiniti tra cui scegliere. Ogni modello ha un proprio set di campi supportati. Il modello da usare per l'operazione Analyze dipende dal tipo di documento da analizzare. Ecco i modelli predefiniti attualmente supportati dal servizio Document Intelligence:

  • Fattura: estrae testo, segni di selezione, tabelle, coppie chiave-valore e informazioni chiave dalle fatture.
  • Ricevuta: estrae testo e informazioni chiave dalle ricevute.
  • Documento ID: estrae testo e informazioni sulla chiave dalle patenti di guida e dai passaporti internazionali.
  • Biglietto da visita: estrae testo e informazioni chiave dai biglietti da visita.
  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa percorso di origine.

  6. Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.

    Screenshot del menu a discesa

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Analizzare i risultati del modello di fattura di Document Intelligence

  10. Scaricare il file di output JSON per visualizzare i risultati dettagliati.

    • Il nodo "readResults" contiene ogni riga di testo con il rispettivo posizionamento del rettangolo delimitatore nella pagina.
    • Il nodo "selectionMarks" mostra ogni segno di selezione (casella di controllo, segno di opzione) e se lo stato è selected o unselected.
    • La sezione "pageResults" include le tabelle estratte. Per ogni tabella, vengono estratti il testo, la riga e l'indice di colonna, la riga e la colonna che si estende, il rettangolo delimitatore e altro ancora.
    • Il campo "documentResults" contiene informazioni sulle coppie chiave/valore e informazioni sugli elementi di riga per le parti più rilevanti del documento.

Analyze Layout

Azure l'API Document Intelligence Layout estrae testo, tabelle, segni di selezione e informazioni sulla struttura da documenti (PDF, TIFF) e immagini (JPG, PNG, BMP).

  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare Usa layout per ottenere testo, tabelle e segni di selezione.

    impostazioni di Connessione ion per lo strumento Di intelligence per i documenti di layout.

  3. Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.

  4. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/layout-page-001.jpgseguente e selezionare il pulsante Recupera.

  6. Selezionare Run Layout (Esegui layout). Lo strumento Di etichettatura di esempio di analisi dei documenti chiama e Analyze Layout API analizza il documento.

    Screenshot del menu a discesa layout.

  7. Visualizzare i risultati: vedere il testo evidenziato estratto, i segni di selezione rilevati e le tabelle rilevate.

    impostazioni di Connessione ion per lo strumento Document Intelligence.

  8. Scaricare il file di output JSON per visualizzare i risultati dettagliati del layout.

    • Il nodo readResults contiene ogni riga di testo con il rispettivo posizionamento del rettangolo di selezione nella pagina.
    • Il selectionMarks nodo mostra ogni segno di selezione (casella di controllo, segno di opzione) e se lo stato è selected o unselected.
    • La pageResults sezione include le tabelle estratte. Per ogni tabella, vengono estratti il testo, la riga e l'indice di colonna, la riga e la colonna che si estende, il rettangolo delimitatore e altro ancora.

Eseguire il training di un modello di modulo personalizzato

Eseguire il training di un modello personalizzato per analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. L'API è un programma di Machine Learning sottoposto a training per riconoscere i campi modulo all'interno del contenuto distinto ed estrarre coppie chiave-valore e dati di tabella. Sono necessari almeno cinque esempi dello stesso tipo di modulo per iniziare e il training del modello personalizzato può essere eseguito con o senza set di dati etichettati.

Prerequisiti per il training di un modello di modulo personalizzato

  • Un Archiviazione di Azure contenitore BLOB che contiene un set di dati di training. Assicurarsi che tutti i documenti di training abbiano lo stesso formato. Se si usano moduli in più formati, organizzarli in sottocartelle basate sul formato comune. Per questo progetto, è possibile usare il set di dati di esempio.

  • Se non si sa come creare un account di archiviazione di Azure con un contenitore, seguire la guida introduttiva Archiviazione di Azure per portale di Azure.

  • Configurare CORS

    CORS (condivisione di risorse tra le origini) deve essere configurato nell'account di archiviazione di Azure affinché sia accessibile da Document Intelligence Studio. Per configurare CORS nella portale di Azure, è necessario accedere alla scheda CORS dell'account di archiviazione.

    1. Selezionare la scheda CORS per l'account di archiviazione.

      Screenshot del menu delle impostazioni CORS nel portale di Azure.

    2. Per iniziare, creare una nuova voce CORS nel servizio BLOB.

    3. Impostare Origini consentite su https://fott-2-1.azurewebsites.net.

      Screenshot che mostra la configurazione CORS per un account di archiviazione.

      Suggerimento

      È possibile usare il carattere jolly '*' anziché un dominio specificato per consentire a tutti i domini di origine di effettuare richieste tramite CORS.

    4. Selezionare tutte le 8 opzioni disponibili per Metodi consentiti.

    5. Approvare tutte le intestazioni consentite e le intestazioni esposte immettendo un * in ogni campo.

    6. Impostare Validità massima su 120 secondi o qualsiasi valore accettabile.

    7. Selezionare il pulsante Salva nella parte superiore della pagina e salvare le modifiche.

Usare lo strumento di etichettatura di esempio

  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare Usa modulo personalizzato per eseguire il training di un modello con etichette e ottenere coppie chiave-valore.

    Eseguire il training di un modello personalizzato.

  3. Selezionare Nuovo progetto

    Screenshot della selezione di un nuovo prompt del progetto.

Crea un nuovo progetto

Configurare i campi Impostazioni project con i valori seguenti:

  1. Nome visualizzato. Assegnare un nome al progetto.

  2. Token di sicurezza. Ogni progetto genera automaticamente un token di sicurezza che può essere usato per crittografare/decrittografare le impostazioni del progetto sensibili. È possibile trovare i token di sicurezza nell'applicazione Impostazioni selezionando l'icona a forma di ingranaggio nella parte inferiore della barra di spostamento a sinistra.

  3. Connessione di origine. Lo strumento Di etichettatura di esempio si connette a un'origine (moduli caricati originali) e a una destinazione (etichette create e dati di output). Le connessioni possono essere configurate e condivise tra progetti. Si basano su un modello di provider estendibile, quindi è possibile aggiungere facilmente nuovi provider di origine/destinazione.

    • Creare una nuova connessione, selezionare il pulsante Aggiungi Connessione ion. Completare i campi con i valori seguenti:
    • Nome visualizzato. Denominare la connessione.
    • Descrizione. Aggiungere una breve descrizione.
    • URL di firma di accesso condiviso. Incollare l'URL della firma di accesso condiviso (SAS) per il contenitore Archiviazione BLOB di Azure.
    • Per recuperare l'URL della firma di accesso condiviso per i dati di training del modello personalizzato, passare alla risorsa di archiviazione nella portale di Azure e selezionare la scheda Archiviazione Explorer. Passare al contenitore, fare clic con il pulsante destro del mouse e selezionare Recupera firma di accesso condiviso. È importante ottenere la firma di accesso condiviso per il contenitore, non per l'account di archiviazione. Verificare che le autorizzazioni Lettura, Scrittura, Eliminazione ed Elenco siano selezionate e selezionare Crea. A questo punto, copiare il valore dalla sezione URL in una posizione temporanea. Dovrebbe essere in questo formato: https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.

      Posizione della firma di accesso condiviso.

  4. Percorso cartella (facoltativo). Se i moduli di origine si trovano all'interno di una cartella nel contenitore BLOB, specificare il nome della cartella.

  5. URI del servizio Document Intelligence: URL dell'endpoint di Document Intelligence.

  6. Key. Chiave di Business Intelligence per i documenti.

  7. Versione dell'API. Mantenere il valore v2.1 (predefinito).

  8. Descrizione (facoltativo). Descrivere il progetto.

    Impostazioni di connessione

Etichettare i moduli

Pagina Nuovo progetto

Quando si crea o si apre un progetto, viene visualizzata la finestra principale dell'editor di tag. L'editor di tag è costituito da tre parti:

  • Un riquadro di anteprima ridimensionabile che contiene un elenco scorrevole di moduli provenienti dalla connessione di origine.
  • Il riquadro principale dell'editor che consente di applicare tag.
  • Il riquadro dell'editor di tag che consente di modificare, bloccare, riordinare ed eliminare tag.
Identificare testo e tabelle

Selezionare Esegui layout nei documenti non visualizzati nel riquadro sinistro per ottenere le informazioni sul layout di testo e tabella per ogni documento. Lo strumento di etichettatura disegna rettangoli di delimitazione intorno a ogni elemento di testo.

Lo strumento di etichettatura mostra anche le tabelle estratte automaticamente. Selezionare l'icona tabella/griglia a sinistra del documento e visualizzare la tabella estratta. Poiché il contenuto della tabella viene estratto automaticamente, il contenuto della tabella non viene etichettato, ma si basa sull'estrazione automatica.

Visualizzazione tabella nello strumento Di etichettatura di esempio.

Applicare le etichette al testo

Successivamente, si creano tag (etichette) e si applicano agli elementi di testo che si vuole analizzare il modello. Si noti che il set di dati Etichetta di esempio include campi già etichettati; aggiungiamo un altro campo.

Usare il riquadro dell'editor di tag per creare un nuovo tag che si vuole identificare:

  1. Selezionare + segno più per creare un nuovo tag.

  2. Immettere il tag "Total" name (Totale).

  3. Selezionare Invio per salvare il tag.

  4. Nell'editor principale selezionare il valore totale dagli elementi di testo evidenziati.

  5. Selezionare il tag Totale da applicare al valore oppure premere il tasto di tastiera corrispondente. I tasti numerici vengono assegnati come tasti di scelta rapida per i primi 10 tag. È possibile riordinare i tag usando le icone delle frecce su e giù nel riquadro dell'editor di tag. Seguire questa procedura per etichettare tutti e cinque i moduli nel set di dati di esempio:

    Suggerimento

    Quando si etichettano i moduli, tenere presenti i suggerimenti seguenti:

    • È possibile applicare un unico tag a ogni elemento di testo selezionato.

    • Ogni tag può essere applicato una sola volta per pagina. Se un valore viene visualizzato più volte nella stessa pagina, creare tag diversi per ogni istanza. Ad esempio: "invoice# 1", "invoice# 2" e così via.

    • I tag non possono estendersi in più pagine.

    • Etichettare i valori così come appaiono nel modulo. Non provare a dividere un valore in due parti con due tag diversi. Ad esempio, un campo di indirizzo deve essere etichettato con un singolo tag anche se si estende su più righe.

    • Non includere chiavi nei campi con tag, ma solo i valori.

    • I dati della tabella devono essere rilevati automaticamente e saranno disponibili nel file JSON di output finale nella sezione "pageResults". Tuttavia, se il modello non riesce a rilevare tutti i dati della tabella, è anche possibile etichettare ed eseguire il training di un modello per rilevare le tabelle, vedere Eseguire il training di un modello personalizzato | Etichettare i moduli

    • Usare i pulsanti a destra del segno + per cercare, rinominare, riordinare ed eliminare i tag.

    • Per rimuovere un tag applicato senza eliminarlo, selezionare il rettangolo con tag nella visualizzazione del documento e premere CANC.

Etichettare gli esempi.

Eseguire il training di un modello personalizzato

Scegliere l'icona Esegui training nel riquadro sinistro e aprire la pagina Training. Selezionare quindi il pulsante Train (Esegui training) per iniziare il training del modello. Al termine del processo di training, vengono visualizzate le informazioni seguenti:

  • ID modello: l'ID del modello creato e sottoposto a training. Ogni chiamata al training crea un nuovo modello con un proprio ID. Copiare questa stringa in una posizione sicura; è necessario se si vogliono eseguire chiamate di stima tramite l'API REST o la libreria client.

  • Average Accuracy (Accuratezza media): l'accuratezza media del modello. È possibile migliorare l'accuratezza del modello etichettando più moduli e ripetere il training per creare un nuovo modello. È consigliabile iniziare etichettando cinque moduli per analizzare e testare i risultati e quindi, se necessario, aggiungere altri moduli in base alle esigenze.

  • L'elenco dei tag e l'accuratezza stimata per ognuno. Per altre informazioni, vedereInterpretare e migliorare l'accuratezza e l'attendibilità.

    Strumento di visualizzazione training.

Analizzare un modulo personalizzato

  1. Selezionare l'icona Analyze dalla barra di spostamento e testare il modello.

  2. Selezionare il file locale di origine e cercare un file da selezionare dal set di dati di esempio decompresso nella cartella di test.

  3. Scegliere il pulsante Esegui analisi per ottenere coppie chiave/valore, testo e tabelle per il modulo. Lo strumento applica tag nei rettangoli delimitatori e segnala l'attendibilità di ogni tag.

    Visualizzazione del training.

Ecco fatto! Si è appreso come usare lo strumento di esempio di Analisi documenti per modelli predefiniti, layout e personalizzati di Document Intelligence. Si è anche appreso come analizzare un modulo personalizzato con dati etichettati manualmente.

Passaggi successivi