Testa din modell

När modellen har tränats kan du använda översättningar för att utvärdera modellens kvalitet. För att kunna fatta ett välgrundat beslut om att använda vår standardmodell eller din anpassade modell bör du utvärdera deltat mellan din anpassade modell BLEU-poäng och vår standardmodell Baseline BLEU. Om dina modeller har tränats på en smal domän och dina träningsdata är konsekventa med testdata kan du förvänta dig en hög BLEU-poäng.

BLEU-poäng

BLEU (Inhoppare för tvåspråkig utvärdering) är en algoritm för att utvärdera precisionen eller noggrannheten för text som har maskinöversatts från ett språk till ett annat. Custom Translator använder BLEU-måttet som ett sätt att förmedla översättningsprecision.

En BLEU-poäng är ett tal mellan noll och 100. En poäng på noll anger en översättning av låg kvalitet där ingenting i översättningen matchade referensen. Poängen 100 anger en perfekt översättning som är identisk med referensen. Det är inte nödvändigt att uppnå en poäng på 100 – en BLEU-poäng mellan 40 och 60 anger en högkvalitativ översättning.

Läs mer

Modellinformation

  1. Välj bladet Modellinformation .

  2. Välj modellnamnet. Granska träningsdatum/-tid, total träningstid, antal meningar som används för träning, justering, testning och ordlista. Kontrollera om systemet genererade test- och justeringsuppsättningarna. Du använder Category ID för att göra översättningsbegäranden.

  3. Utvärdera modellens BLEU-poäng . Granska testuppsättningen: BLEU-poängen är den anpassade modellpoängen och Baseline BLEU är den förtränade baslinjemodellen som används för anpassning. En högre BLEU-poäng innebär att det finns hög översättningskvalitet med hjälp av den anpassade modellen.

    Skärmbild som illustrerar modellinformationen.

Testa kvaliteten på din modells översättning

  1. Välj bladet Testmodell .

  2. Välj modellnamn.

  3. Mänsklig utvärdera översättning från din anpassade modell och baslinjemodellen (vår förtränade baslinje som används för anpassning) mot referens (målöversättning från testuppsättningen).

  4. Om du är nöjd med träningsresultatet placerar du en distributionsbegäran för den tränade modellen.

Nästa steg