Condividi tramite


Come usare l’etichettatura automatica per il riconoscimento di entità denominata personalizzato

Il processo di etichettatura è una parte importante della preparazione del set di dati. Siccome questo processo richiede tempo e lavoro, è possibile usare la funzionalità di etichettatura automatica per etichettare automaticamente le entità. È possibile avviare i processi di etichettatura automatica in base a un modello sottoposto a training in precedenza o usando modelli GPT. Con l’etichettatura automatica basata su un modello di cui è stato eseguito il training in precedenza, è possibile iniziare l’etichettatura di alcuni documenti, eseguire il training di un modello, quindi creare un processo di etichettatura automatica per produrre etichette di entità per altri documenti basati su tale modello. Con l’etichettatura automatica con GPT, è possibile attivare immediatamente un processo di etichettatura automatica senza aver eseguito precedentemente il training di un modello. Questa funzionalità consente di risparmiare tempo e lavoro per l'etichettatura manuale delle entità.

Prerequisiti

Per poter usare l’etichettatura automatica in base a un modello di cui è stato eseguito il training, è necessario prima:

Attivare un processo di etichettatura automatica

Quando si attiva un processo di etichettatura automatica in base a un modello sottoposto a training, è previsto un limite mensile di 5.000 record di testo per risorsa. Ciò implica che lo stesso limite si applica a tutti i progetti all'interno della stessa risorsa.

Suggerimento

Un record di testo viene calcolato arrotondando per eccesso (Numero di caratteri in un documento / 1.000). Ad esempio, se un documento contiene 8921 caratteri, il numero di record di testo è:

ceil(8921/1000) = ceil(8.921), cioè 9 record di testo.

  1. Dal menu di spostamento a sinistra, selezionare Etichettatura dati.

  2. Selezionare il pulsante Etichetta automaticamente nel riquadro Attività a destra della pagina.

    Screenshot che mostra come attivare un processo di autotag.

  3. Scegliere l'etichettatura automatica in base a un modello sottoposto a training e selezionare Avanti.

    Screenshot che mostra la scelta del modello per l'etichettatura automatica.

  4. Scegliere un modello sottoposto a training. È preferibile controllare le prestazioni del modello prima di usarlo per l’etichettatura automatica.

    Screenshot che mostra come scegliere il modello sottoposto a training per l'autotag.

  5. Scegliere le entità da includere nel processo di etichettatura automatica. Per impostazione predefinita, sono selezionate tutte le entità. È possibile visualizzare le etichette totali, la precisione e il richiamo di ogni entità. Per garantire la qualità delle entità etichettate automaticamente, è preferibile includere entità con prestazioni soddisfacenti.

    Screenshot che mostra quali entità includere nel processo di autotag.

  6. Scegliere i documenti da etichettare automaticamente. Viene visualizzato il numero di record di testo di ogni documento. Quando si seleziona uno o più documenti, verrà visualizzato il numero di record di testi selezionati. È preferibile scegliere i documenti non etichettati dal filtro.

    Nota

    • Se un’entità è stata etichettata automaticamente ma questa etichetta era già stata definita dall'utente, viene usata ed è visibile solo l'etichetta definita dall'utente.
    • È possibile visualizzare i documenti facendo clic sul nome del documento.

    Screenshot che mostra quali documenti includere nel processo di autotag.

  7. Selezionare Etichetta automaticamente per attivare il processo di etichettatura automatica. Viene visualizzato il modello usato, il numero di documenti inclusi nel processo di etichettatura automatica, il numero di record di testo e le entità da etichettare automaticamente. I processi di etichettatura automatica possono richiedere da alcuni secondi ad alcuni minuti, a seconda del numero di documenti inclusi.

    Screenshot che mostra la schermata di revisione per un processo di autotag.

Rivedere i documenti etichettati automaticamente

Al termine del processo di etichettatura automatica, è possibile visualizzare i documenti di output nella pagina Etichettatura dati di Language Studio. Selezionare Rivedi documenti con etichette automatiche per visualizzare i documenti con il filtro Etichettato automaticamente applicato.

Screenshot che mostra i documenti con etichettatura automatica

Le entità etichettate automaticamente vengono visualizzate con una linea tratteggiata. Tali entità hanno due selettori (un segno di spunta e una “X”) che consentono di accettare o rifiutare l'etichetta automatica.

Una volta accettata un'etichetta, la linea tratteggiata diventa continua e l'etichetta viene inclusa nel training di ulteriori modelli, diventando un'etichetta definita dall'utente.

In alternativa, è possibile accettare o rifiutare tutte le entità etichettate automaticamente all'interno del documento usando Accetta tutto o Rifiuta tutto nell'angolo superiore destro dello schermo.

Dopo aver accettato o rifiutato le entità etichettate, selezionare Salva etichette per applicare le modifiche.

Nota

  • È preferibile convalidare le entità etichettate automaticamente prima di accettarle.
  • Tutte le etichette non accettate vengono eliminate quando si esegue il training del modello.

Screenshot che mostra come accettare e rifiutare entità con etichettatura automatica.

Passaggi successivi