Delen via


Uw model testen

Zodra uw model is getraind, kunt u vertalingen gebruiken om de kwaliteit van uw model te evalueren. Als u een geïnformeerde beslissing wilt nemen over het gebruik van ons standaardmodel of uw aangepaste model, moet u de delta tussen uw aangepaste model BLEU-score en ons standaardmodel Baseline BLEU evalueren. Als uw model wordt getraind binnen een smal domein en uw trainingsgegevens consistent zijn met de testgegevens, kunt u een hoge BLEU-score verwachten.

BLEU-score

BLEU (Tweetalige Evaluatie Understudy) is een algoritme voor het evalueren van de precisie of nauwkeurigheid van tekst die van de ene taal naar de andere wordt vertaald. Custom Translator maakt gebruik van de metrische GEGEVENS VAN HET BESTAND ALS één manier om de nauwkeurigheid van de vertaling over te brengen.

Een BLEU-score is een getal tussen nul en 100. Een score van nul geeft een vertaling van lage kwaliteit aan waarbij niets in de vertaling overeenkomt met de verwijzing. Een score van 100 geeft een perfecte vertaling aan die identiek is aan de verwijzing. Het is niet nodig om een score van 100 te bereiken: een BLEU-score tussen 40 en 60 geeft een hoogwaardige vertaling aan.

Meer informatie

Modelgegevens

  1. Selecteer de blade Modeldetails .

  2. Selecteer de modelnaam. Bekijk de datum/tijd van de training, de totale trainingstijd, het aantal zinnen dat wordt gebruikt voor training, afstemming, testen en woordenlijst. Controleer of het systeem de test- en afstemmingssets heeft gegenereerd. Gebruik de optie Category ID om vertaalaanvragen te maken.

  3. Evalueer de MODEL-SCORE VAN HET BLAUW . Bekijk de testset: de BLEU-score is de aangepaste modelscore en de Baseline BLEU is het vooraf getrainde basislijnmodel dat wordt gebruikt voor aanpassing. Een hogere BLEU-score betekent dat er een hoge vertaalkwaliteit is met behulp van het aangepaste model.

    Schermopname van de details van het model.

De kwaliteit van de vertaling van uw model testen

  1. Selecteer de blade Model testen .

  2. Selecteer modelnaam.

  3. Vertaling door mensen evalueren van uw aangepaste model en het basislijnmodel (onze vooraf getrainde basislijn die wordt gebruikt voor aanpassing) op basis van verwijzing (doelomzetting uit de testset).

  4. Als de trainingsresultaten bevredigend zijn, plaatst u een implementatieaanvraag voor het getrainde model.

Volgende stappen