Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il processo di etichettatura è una parte importante della preparazione del set di dati. Siccome questo processo richiede tempo e lavoro, è possibile usare la funzionalità di etichettatura automatica per etichettare automaticamente le entità. È possibile avviare attività di etichettatura automatica basate su un modello precedentemente addestrato oppure utilizzando modelli GPT. Con la compilazione automatica basata su un modello sottoposto a training in precedenza, è possibile iniziare a etichettare alcuni documenti, eseguire il training di un modello, quindi creare un processo di compilazione automatica per produrre etichette di entità per altri documenti basati su tale modello. Con la compilazione automatica con GPT, è possibile attivare immediatamente un processo di compilazione automatica senza alcun training del modello precedente. Questa funzionalità consente di risparmiare tempo e lavoro per l'etichettatura manuale delle entità.
Prerequisiti
Prima di poter usare l'etichettatura automatica in base a un modello che hai addestrato, è necessario:
- Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato.
- Dati di testo caricati nell'account di archiviazione.
- Dati etichettati
- Un modello sottoposto a training correttamente
Attivare un processo di etichettatura automatica
- Etichettare automaticamente in base a un modello sottoposto a training
- Etichetta automaticamente con GPT
Quando si attiva un processo di compilazione automatica in base a un modello sottoposto a training, è previsto un limite mensile di 5.000 record di testo al mese, per risorsa. Lo stesso limite si applica a tutti i progetti all'interno della stessa risorsa.
Suggerimento
Un record di testo viene calcolato arrotondando per eccesso (numero di caratteri in un documento / 1.000). Ad esempio, se un documento ha 8.921 caratteri, il numero di record di testo è:
ceil(8921/1000) = ceil(8.921), che sono nove record di testo.
Nel riquadro sinistro selezionare Etichettatura dati.
Selezionare il pulsante Etichetta automaticamente nel riquadro Attività a destra della pagina.
Scegliere l'etichettatura automatica basata su un modello addestrato e selezionare Avanti.
Scegliere un modello sottoposto a training. Consigliamo di controllare le prestazioni del modello prima di usarlo per l'etichettatura automatica.
Scegliere le entità da includere nel processo di etichettatura automatica. Per impostazione predefinita, sono selezionate tutte le entità. È possibile visualizzare le etichette, la precisione e il richiamo totali di ogni entità. È consigliabile includere entità con prestazioni buone per garantire la qualità delle entità etichettate automaticamente.
Scegliere i documenti da etichettare automaticamente. Viene visualizzato il numero di record di testo di ogni documento. Quando si seleziona uno o più documenti, verrà visualizzato il numero di record di testi selezionati. È consigliabile scegliere i documenti senza etichetta dal filtro.
Note
- Se un’entità è stata etichettata automaticamente ma questa etichetta era già stata definita dall'utente, viene usata ed è visibile solo l'etichetta definita dall'utente.
- È possibile visualizzare i documenti selezionando il nome del documento.
Selezionare Etichetta automaticamente per attivare il processo di etichettatura automatica. Viene visualizzato il modello usato, il numero di documenti inclusi nel processo di etichettatura automatica, il numero di record di testo e le entità da etichettare automaticamente. I processi di etichettatura automatica possono richiedere da alcuni secondi ad alcuni minuti, a seconda del numero di documenti inclusi.
Rivedere i documenti etichettati automaticamente
Al termine del processo di etichettatura automatica, è possibile visualizzare i documenti di output nella pagina Etichettatura dati di Language Studio. Selezionare Rivedi documenti con etichette automatiche per visualizzare i documenti con il filtro Etichettato automaticamente applicato.
Le entità etichettate automaticamente vengono visualizzate con una linea tratteggiata. Tali entità hanno due selettori (un segno di spunta e una “X”) che consentono di accettare o rifiutare l'etichetta automatica.
Una volta accettata un'etichetta, la linea tratteggiata diventa continua e l'etichetta viene inclusa nel training di ulteriori modelli, diventando un'etichetta definita dall'utente.
In alternativa, è possibile accettare o rifiutare tutte le entità etichettate automaticamente all'interno del documento usando Accetta tutto o Rifiuta tutto nell'angolo superiore destro dello schermo.
Dopo aver accettato o rifiutato le entità etichettate, selezionare Salva etichette per applicare le modifiche.
Note
- È preferibile convalidare le entità etichettate automaticamente prima di accettarle.
- Tutte le etichette non accettate vengono eliminate quando si esegue il training del modello.
Passaggi successivi
- Consultare altre informazioni sull’etichettatura dei dati.