Condividi tramite


Come usare l’etichettatura automatica per il riconoscimento di entità denominata personalizzato

Il processo di etichettatura è una parte importante della preparazione del set di dati. Siccome questo processo richiede tempo e lavoro, è possibile usare la funzionalità di etichettatura automatica per etichettare automaticamente le entità. È possibile avviare attività di etichettatura automatica basate su un modello precedentemente addestrato oppure utilizzando modelli GPT. Con la compilazione automatica basata su un modello sottoposto a training in precedenza, è possibile iniziare a etichettare alcuni documenti, eseguire il training di un modello, quindi creare un processo di compilazione automatica per produrre etichette di entità per altri documenti basati su tale modello. Con la compilazione automatica con GPT, è possibile attivare immediatamente un processo di compilazione automatica senza alcun training del modello precedente. Questa funzionalità consente di risparmiare tempo e lavoro per l'etichettatura manuale delle entità.

Prerequisiti

Prima di poter usare l'etichettatura automatica in base a un modello che hai addestrato, è necessario:

Attivare un processo di etichettatura automatica

Quando si attiva un processo di compilazione automatica in base a un modello sottoposto a training, è previsto un limite mensile di 5.000 record di testo al mese, per risorsa. Lo stesso limite si applica a tutti i progetti all'interno della stessa risorsa.

Suggerimento

Un record di testo viene calcolato arrotondando per eccesso (numero di caratteri in un documento / 1.000). Ad esempio, se un documento ha 8.921 caratteri, il numero di record di testo è:

ceil(8921/1000) = ceil(8.921), che sono nove record di testo.

  1. Nel riquadro sinistro selezionare Etichettatura dati.

  2. Selezionare il pulsante Etichetta automaticamente nel riquadro Attività a destra della pagina.

    Screenshot che mostra come attivare un processo di autotag.

  3. Scegliere l'etichettatura automatica basata su un modello addestrato e selezionare Avanti.

    Screenshot che mostra la scelta del modello per l'etichettatura automatica.

  4. Scegliere un modello sottoposto a training. Consigliamo di controllare le prestazioni del modello prima di usarlo per l'etichettatura automatica.

    Screenshot che mostra come scegliere il modello sottoposto a training per l'autotag.

  5. Scegliere le entità da includere nel processo di etichettatura automatica. Per impostazione predefinita, sono selezionate tutte le entità. È possibile visualizzare le etichette, la precisione e il richiamo totali di ogni entità. È consigliabile includere entità con prestazioni buone per garantire la qualità delle entità etichettate automaticamente.

    Screenshot che mostra quali entità includere nel processo di autotag.

  6. Scegliere i documenti da etichettare automaticamente. Viene visualizzato il numero di record di testo di ogni documento. Quando si seleziona uno o più documenti, verrà visualizzato il numero di record di testi selezionati. È consigliabile scegliere i documenti senza etichetta dal filtro.

    Note

    • Se un’entità è stata etichettata automaticamente ma questa etichetta era già stata definita dall'utente, viene usata ed è visibile solo l'etichetta definita dall'utente.
    • È possibile visualizzare i documenti selezionando il nome del documento.

    Screenshot che mostra quali documenti includere nel processo di autotag.

  7. Selezionare Etichetta automaticamente per attivare il processo di etichettatura automatica. Viene visualizzato il modello usato, il numero di documenti inclusi nel processo di etichettatura automatica, il numero di record di testo e le entità da etichettare automaticamente. I processi di etichettatura automatica possono richiedere da alcuni secondi ad alcuni minuti, a seconda del numero di documenti inclusi.

    Screenshot che mostra la schermata di revisione per un processo di autotag.

Rivedere i documenti etichettati automaticamente

Al termine del processo di etichettatura automatica, è possibile visualizzare i documenti di output nella pagina Etichettatura dati di Language Studio. Selezionare Rivedi documenti con etichette automatiche per visualizzare i documenti con il filtro Etichettato automaticamente applicato.

Screenshot che mostra i documenti con etichettatura automatica

Le entità etichettate automaticamente vengono visualizzate con una linea tratteggiata. Tali entità hanno due selettori (un segno di spunta e una “X”) che consentono di accettare o rifiutare l'etichetta automatica.

Una volta accettata un'etichetta, la linea tratteggiata diventa continua e l'etichetta viene inclusa nel training di ulteriori modelli, diventando un'etichetta definita dall'utente.

In alternativa, è possibile accettare o rifiutare tutte le entità etichettate automaticamente all'interno del documento usando Accetta tutto o Rifiuta tutto nell'angolo superiore destro dello schermo.

Dopo aver accettato o rifiutato le entità etichettate, selezionare Salva etichette per applicare le modifiche.

Note

  • È preferibile convalidare le entità etichettate automaticamente prima di accettarle.
  • Tutte le etichette non accettate vengono eliminate quando si esegue il training del modello.

Screenshot che mostra come accettare e rifiutare entità con etichettatura automatica.

Passaggi successivi