Testare il modello

Articolo
04/22/2024

Dopo aver completato il training del modello, è possibile usare le traduzioni per valutare la qualità del modello. Per decidere in modo informato se usare il modello standard o il modello personalizzato, è consigliabile valutare le differenze tra il punteggio BLEU del modello personalizzato e il punteggio BLEU di base del modello standard. Se il training dei modelli è stato eseguito in un dominio ristretto e i dati del training sono coerenti con i dati di test, il punteggio BLEU dovrebbe essere elevato.

Punteggio BLEU

BLEU (Bilingual Evaluation Understudy) è un algoritmo per valutare la precisione o l'accuratezza del testo tradotto automaticamente da una lingua a un'altra. Traduttore personalizzato usa la metrica BLEU come indicatore dell'accuratezza della traduzione.

Un punteggio BLEU è un numero compreso tra zero e 100. Un punteggio pari a zero indica una traduzione di bassa qualità, in cui nulla nella traduzione corrisponde al riferimento. Un punteggio pari a 100 indica una traduzione perfetta identica al riferimento. Non è necessario ottenere un punteggio pari a 100. Un punteggio BLEU compreso tra 40 e 60 indica una traduzione di alta qualità.

Altre informazioni

Dettagli del modello

Selezionare il pannello Dettagli modello.
Selezionare il nome del modello. Esaminare la data/ora di training, il tempo totale di training, il numero di frasi usate per il training, l'ottimizzazione, il test e il dizionario. Controllare se il sistema ha generato i set di test e di ottimizzazione. Si userà Category ID per effettuare richieste di traduzione.
Valutare il punteggio BLEU del modello. Esaminare il set di test: il punteggio BLEU è il punteggio del modello personalizzato e BLEU di base è il modello di base con training preliminare usato per la personalizzazione. Un punteggio BLEU più elevato significa una qualità di traduzione alta usando il modello personalizzato.

Testare la qualità della traduzione del modello

Selezionare il pannello Test modello.
Selezionare Nome modello.
Valutare la traduzione da Modello personalizzato e Modello baseline (la baseline con training preliminare usata per la personalizzazione) rispetto a Riferimento (traduzione di destinazione dal set di test).
Se si è soddisfatti dei risultati del training, inviare una richiesta di distribuzione per il modello sottoposto a training.

Passaggi successivi

Informazioni su come pubblicare o distribuire un modello personalizzato.
Informazioni su come tradurre i documenti con un modello personalizzato.

Testare il modello

Punteggio BLEU

Dettagli del modello

Testare la qualità della traduzione del modello

Passaggi successivi

Risorse aggiuntive