Uw model testen

Zodra uw model is getraind, kunt u vertalingen gebruiken om de kwaliteit van uw model te evalueren. Om een weloverwogen beslissing te nemen over het gebruik van ons standaardmodel of uw aangepaste model, moet u de delta evalueren tussen uw aangepaste model BLEU-score en ons standaardmodel Baseline BLEU. Als uw modellen zijn getraind op een beperkt domein en uw trainingsgegevens consistent zijn met de testgegevens, dan kunt u een hoge BLEU-score verwachten.

BLEU-score

BLEU (Tweetalige evaluatieonderstudie) is een algoritme voor het evalueren van de nauwkeurigheid of nauwkeurigheid van tekst die automatisch van de ene taal naar de andere is vertaald. Custom Translator gebruikt de metrische gegevens BLEU als een manier om de nauwkeurigheid van de vertaling over te brengen.

Een BLEU-score is een getal tussen nul en 100. Een score van nul geeft een vertaling van lage kwaliteit aan waarbij niets in de vertaling overeenkomt met de verwijzing. Een score van 100 duidt op een perfecte vertaling die identiek is aan de verwijzing. Het is niet nodig om een score van 100 te behalen: een BLEU-score tussen 40 en 60 duidt op een vertaling van hoge kwaliteit.

Meer informatie

Modeldetails

  1. Selecteer de blade Modeldetails .

  2. Selecteer de modelnaam. Bekijk de trainingsdatum/-tijd, de totale trainingstijd, het aantal zinnen dat is gebruikt voor training, afstemming, testen en woordenlijst. Controleer of het systeem de test- en afstemmingssets heeft gegenereerd. U gebruikt de Category ID om vertaalaanvragen te doen.

  3. Evalueer de bleu-score van het model. Controleer de testset: de BLEU-score is de score van het aangepaste model en de baseline BLEU is het vooraf getrainde basislijnmodel dat wordt gebruikt voor aanpassing. Een hogere BLEU-score betekent dat er een hoge vertaalkwaliteit is met behulp van het aangepaste model.

    Schermopname van de details van het model.

De kwaliteit van de vertaling van uw model testen

  1. Selecteer de blade Model testen .

  2. Selecteer modelnaam.

  3. Menselijke evaluatie van vertaling van uw aangepaste model en het basislijnmodel (onze vooraf getrainde basislijn die wordt gebruikt voor aanpassing) op basis van verwijzing (doelvertaling uit de testset).

  4. Als u tevreden bent met de trainingsresultaten, plaatst u een implementatieaanvraag voor het getrainde model.

Volgende stappen