Uw model testen
Zodra uw model is getraind, kunt u vertalingen gebruiken om de kwaliteit van uw model te evalueren. Als u een geïnformeerde beslissing wilt nemen over het gebruik van ons standaardmodel of uw aangepaste model, moet u de delta tussen uw aangepaste model BLEU-score en ons standaardmodel Baseline BLEU evalueren. Als uw model wordt getraind binnen een smal domein en uw trainingsgegevens consistent zijn met de testgegevens, kunt u een hoge BLEU-score verwachten.
BLEU-score
BLEU (Tweetalige Evaluatie Understudy) is een algoritme voor het evalueren van de precisie of nauwkeurigheid van tekst die van de ene taal naar de andere wordt vertaald. Custom Translator maakt gebruik van de metrische GEGEVENS VAN HET BESTAND ALS één manier om de nauwkeurigheid van de vertaling over te brengen.
Een BLEU-score is een getal tussen nul en 100. Een score van nul geeft een vertaling van lage kwaliteit aan waarbij niets in de vertaling overeenkomt met de verwijzing. Een score van 100 geeft een perfecte vertaling aan die identiek is aan de verwijzing. Het is niet nodig om een score van 100 te bereiken: een BLEU-score tussen 40 en 60 geeft een hoogwaardige vertaling aan.
Modelgegevens
Selecteer de blade Modeldetails .
Selecteer de modelnaam. Bekijk de datum/tijd van de training, de totale trainingstijd, het aantal zinnen dat wordt gebruikt voor training, afstemming, testen en woordenlijst. Controleer of het systeem de test- en afstemmingssets heeft gegenereerd. Gebruik de optie
Category ID
om vertaalaanvragen te maken.Evalueer de MODEL-SCORE VAN HET BLAUW . Bekijk de testset: de BLEU-score is de aangepaste modelscore en de Baseline BLEU is het vooraf getrainde basislijnmodel dat wordt gebruikt voor aanpassing. Een hogere BLEU-score betekent dat er een hoge vertaalkwaliteit is met behulp van het aangepaste model.
De kwaliteit van de vertaling van uw model testen
Selecteer de blade Model testen .
Selecteer modelnaam.
Vertaling door mensen evalueren van uw aangepaste model en het basislijnmodel (onze vooraf getrainde basislijn die wordt gebruikt voor aanpassing) op basis van verwijzing (doelomzetting uit de testset).
Als de trainingsresultaten bevredigend zijn, plaatst u een implementatieaanvraag voor het getrainde model.
Volgende stappen
- Meer informatie over het publiceren/implementeren van een aangepast model.
- Informatie over het vertalen van documenten met een aangepast model.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor