Come usare l’etichettatura automatica per il riconoscimento di entità denominata personalizzato
Il processo di etichettatura è una parte importante della preparazione del set di dati. Siccome questo processo richiede tempo e lavoro, è possibile usare la funzionalità di etichettatura automatica per etichettare automaticamente le entità. È possibile avviare i processi di etichettatura automatica in base a un modello sottoposto a training in precedenza o usando modelli GPT. Con l’etichettatura automatica basata su un modello di cui è stato eseguito il training in precedenza, è possibile iniziare l’etichettatura di alcuni documenti, eseguire il training di un modello, quindi creare un processo di etichettatura automatica per produrre etichette di entità per altri documenti basati su tale modello. Con l’etichettatura automatica con GPT, è possibile attivare immediatamente un processo di etichettatura automatica senza aver eseguito precedentemente il training di un modello. Questa funzionalità consente di risparmiare tempo e lavoro per l'etichettatura manuale delle entità.
Prerequisiti
- Etichetta automaticamente in base a un modello sottoposto a training
- Etichetta automaticamente con GPT
Per poter usare l’etichettatura automatica in base a un modello di cui è stato eseguito il training, è necessario prima:
- Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato.
- Dati di testo che sono stati caricati nell'account di archiviazione.
- Dati etichettati
- Un modello sottoposto a training correttamente
Attivare un processo di etichettatura automatica
- Etichetta automaticamente in base a un modello sottoposto a training
- Etichetta automaticamente con GPT
Quando si attiva un processo di etichettatura automatica in base a un modello sottoposto a training, è previsto un limite mensile di 5.000 record di testo per risorsa. Ciò implica che lo stesso limite si applica a tutti i progetti all'interno della stessa risorsa.
Suggerimento
Un record di testo viene calcolato arrotondando per eccesso (Numero di caratteri in un documento / 1.000). Ad esempio, se un documento contiene 8921 caratteri, il numero di record di testo è:
ceil(8921/1000) = ceil(8.921)
, cioè 9 record di testo.
Dal menu di spostamento a sinistra, selezionare Etichettatura dati.
Selezionare il pulsante Etichetta automaticamente nel riquadro Attività a destra della pagina.
Scegliere l'etichettatura automatica in base a un modello sottoposto a training e selezionare Avanti.
Scegliere un modello sottoposto a training. È preferibile controllare le prestazioni del modello prima di usarlo per l’etichettatura automatica.
Scegliere le entità da includere nel processo di etichettatura automatica. Per impostazione predefinita, sono selezionate tutte le entità. È possibile visualizzare le etichette totali, la precisione e il richiamo di ogni entità. Per garantire la qualità delle entità etichettate automaticamente, è preferibile includere entità con prestazioni soddisfacenti.
Scegliere i documenti da etichettare automaticamente. Viene visualizzato il numero di record di testo di ogni documento. Quando si seleziona uno o più documenti, verrà visualizzato il numero di record di testi selezionati. È preferibile scegliere i documenti non etichettati dal filtro.
Nota
- Se un’entità è stata etichettata automaticamente ma questa etichetta era già stata definita dall'utente, viene usata ed è visibile solo l'etichetta definita dall'utente.
- È possibile visualizzare i documenti facendo clic sul nome del documento.
Selezionare Etichetta automaticamente per attivare il processo di etichettatura automatica. Viene visualizzato il modello usato, il numero di documenti inclusi nel processo di etichettatura automatica, il numero di record di testo e le entità da etichettare automaticamente. I processi di etichettatura automatica possono richiedere da alcuni secondi ad alcuni minuti, a seconda del numero di documenti inclusi.
Rivedere i documenti etichettati automaticamente
Al termine del processo di etichettatura automatica, è possibile visualizzare i documenti di output nella pagina Etichettatura dati di Language Studio. Selezionare Rivedi documenti con etichette automatiche per visualizzare i documenti con il filtro Etichettato automaticamente applicato.
Le entità etichettate automaticamente vengono visualizzate con una linea tratteggiata. Tali entità hanno due selettori (un segno di spunta e una “X”) che consentono di accettare o rifiutare l'etichetta automatica.
Una volta accettata un'etichetta, la linea tratteggiata diventa continua e l'etichetta viene inclusa nel training di ulteriori modelli, diventando un'etichetta definita dall'utente.
In alternativa, è possibile accettare o rifiutare tutte le entità etichettate automaticamente all'interno del documento usando Accetta tutto o Rifiuta tutto nell'angolo superiore destro dello schermo.
Dopo aver accettato o rifiutato le entità etichettate, selezionare Salva etichette per applicare le modifiche.
Nota
- È preferibile convalidare le entità etichettate automaticamente prima di accettarle.
- Tutte le etichette non accettate vengono eliminate quando si esegue il training del modello.
Passaggi successivi
- Consultare altre informazioni sull’etichettatura dei dati.