Share via


Vad är en ordlista?

En ordlista är ett justerat par dokument som anger en lista med fraser eller meningar och deras motsvarande översättningar. Använd en ordlista i träningen när du vill att Translator ska översätta alla instanser av källfrasen eller meningen med hjälp av den översättning som du anger i ordlistan. Ordlistor kallas ibland ordlistor eller termbaser. Du kan se ordlistan som en brute force "kopiera och ersätt" för alla termer som du listar. Dessutom skapar och använder Microsoft Custom Translator-tjänsten egna ordlistor för generell användning för att förbättra kvaliteten på översättningen. En ordlista som tillhandahålls av kunden tar dock prejudikat och genomsöks först för att söka efter ord eller meningar.

Ordlistor fungerar endast för projekt i språkpar som har en fullständigt stödd microsofts allmänna neurala nätverksmodell bakom sig. Visa den fullständiga listan över språk.

Frasordlista

En frasordlista är skiftlägeskänslig. Det är en exakt sök-och-ersätt-åtgärd. När du inkluderar en frasordlista i träningen av din modell översätts alla ord eller fraser i listan på det sätt som anges. Resten av meningen översätts som vanligt. Du kan använda en frasordlista för att ange fraser som inte ska översättas genom att ange samma oöversatt fras i käll- och målfilerna.

Dynamisk ordlista

Med funktionen för dynamisk ordlista kan du anpassa översättningar för specifika termer eller fraser. Du definierar anpassade översättningar för din unika kontext, ditt språk eller dina specifika behov.

Ordlista för neural fras

Ordlistan för neural fras utökar våra funktioner för dynamisk ordlista och standardfrasordlista . Med dynamiska ordlistor och frasordlistor kan du anpassa översättningsutdata genom att tillhandahålla dina egna översättningar för specifika termer eller fraser. Funktionen för dynamisk ordlista används med Translator API medan den neurala frasordlistan är aktiverad med hjälp av Custom Translator. Ordlistan för neural fras förbättrar översättningskvaliteten för meningar som innehåller en eller flera termöversättningar genom att låta maskinöversättningsmodellen justera både termen och kontexten. Den här justeringen ger mer flytande översättningar. Samtidigt bevarar den högtermig översättningsnoggrannhet.

Meningsordlista

En meningsordlista är skiftlägeskänslig. Med meningsordlistan kan du ange en exakt målöversättning för en källdom. För att en meningsordlistematchning ska inträffa måste hela den skickade meningen matcha posten i källordlistan. En post i källordlistan som slutar med skiljetecken ignoreras under matchningen. Om endast en del av meningen matchar matchas inte posten. När en matchning identifieras returneras målposten i meningsordlistan.

Endast ordlisteträningar

Du kan träna en modell med endast ordlistedata. Om du vill göra det väljer du endast det ordlistedokument (eller flera ordlistedokument) som du vill inkludera och väljer Skapa modell. Eftersom den här utbildningen endast är ordlistebedömd krävs inget minsta antal tränings meningar. Din modell slutför vanligtvis träningen snabbare än en standardträning. De resulterande modellerna använder Microsofts baslinjemodeller för översättning med tillägg av de ordlistor som du lägger till. Du får ingen testrapport.

Kommentar

Custom Translator justerar inte ordlistefiler, så det är viktigt att det finns lika många käll- och målfraser/meningar i ordlistedokumenten och att de är exakt justerade.

Rekommendationer

  • Ordlistor ersätter inte träning av en modell med hjälp av träningsdata. Vi rekommenderar att du låter systemet lära sig av dina träningsdata. Då får du bättre resultat. Men när meningar eller sammansatta substantiv måste översättas ordagrant använder du en frasordlista.

  • Frasordlistan ska användas sparsamt. När en fras i en mening ersätts förloras eller begränsas kontexten för den meningen för översättning av resten av meningen. Resultatet är att medan frasen eller ordet i meningen översätts enligt den angivna ordlistan, lider den övergripande översättningskvaliteten för meningen ofta.

  • Frasordlistan fungerar bra för sammansatta substantiv som produktnamn ("Microsoft SQL Server"), lämpliga namn ("Hamburgs stad") eller produktfunktioner ("pivottabell"). Det fungerar inte lika bra för verb eller adjektiv eftersom dessa ord vanligtvis är mycket kontextuella inom käll- eller målspråket. Det bästa sättet är att undvika ordlisteposter för allt annat än sammansatta substantiv.

  • Om du använder en frasordlista är versaler och skiljetecken viktiga. Ordlisteposter är skiftläges- och skiljeteckenkänsliga. Custom Translator matchar bara ord och fraser i indatameningen som använder exakt samma versaler och skiljetecken som anges i källordlistefilen. Översättningar återspeglar också versaler och skiljetecken som anges i målordlistefilen.

    Exempel

    • Om du tränar ett engelsk-till-spanskt system som använder en frasordlista och du anger SQL-server i källfilen och Microsoft SQL Server i målfilen. När du begär översättning av en mening som innehåller frasen SQL Server matchar Custom Translator ordlisteposten och översättningen som innehåller Microsoft SQL Server.
    • När du begär översättning av en mening som innehåller samma fras men inte matchar vad som finns i källfilen, till exempel sql server, sql Server eller SQL Server, returneras ingen matchning från ordlistan.
    • Översättningen följer reglerna för målspråket enligt beskrivningen i frasordlistan.
  • Mer information om ordlistan för neurala fraser finns ivägledning och rekommendationer för neural ordlista.

  • Om du använder en meningsordlista ignoreras skiljetecken i slutet av meningen.

    Exempel

    • Om källordlistan innehåller "Den här meningen slutar med skiljetecken!" matchar alla översättningsbegäranden som innehåller "Den här meningen slutar med skiljetecken".
  • Ordlistan ska innehålla unika källrader. Om en källrad (ett ord, en fras eller en mening) visas mer än en gång i en ordlistefil använder systemet alltid den senast angivna posten och returnerar målet när en matchning hittas.

  • Undvik att lägga till fraser som endast består av siffror eller två- eller trebokstavsord, till exempel förkortningar, i källordlistefilen.

Nästa steg