Dela via


Skapa och hantera träningsdokument

Med Custom Translator kan du skapa översättningsmodeller som återspeglar din verksamhet, bransch och domänspecifika terminologi och stil. Det är enkelt att träna och distribuera en anpassad modell och kräver inga programmeringskunskaper. Med Custom Translator kan du ladda upp parallella filer, översättningsminnesfiler eller zip-filer.

Parallella dokument är par med dokument där det ena (målet) är en översättning av det andra (källa). Ett dokument i paret innehåller meningar i källspråket och det andra dokumentet innehåller de meningar som översätts till målspråket.

Innan du laddar upp dina dokument kan du läsa igenom vägledningen för dokumentformat och namngivningskonventioner för att se till att Custom Translator stöder filformatet.

Så här skapar du dokumentuppsättningar

Att hitta kvalitetsdata i domänen är ofta en utmanande uppgift som varierar beroende på användarklassificering. Här följer några frågor som du kan ställa dig själv när du utvärderar vilka data som kan vara tillgängliga för dig:

  • Har ditt företag tidigare översättningsdata tillgängliga som du kan använda? Företag har ofta en mängd översättningsdata som ackumulerats under många års användning av mänsklig översättning.

  • Har du en stor mängd enspråkiga data? Enspråkiga data är endast data på ett språk. Kan du i så fall få översättningar för dessa data?

  • Kan du crawla onlineportaler för att samla in käll meningar och syntetisera mål meningar?

Träningsmaterial för varje dokumenttyp

Källa Vad den gör Regler att följa
Tvåspråkiga utbildningsdokument Lär systemet din terminologi och stil. Var liberal. All mänsklig översättning i domänen är bättre än maskinöversättning. Lägg till och ta bort dokument när du går och försök att förbättra BLEU poängen.
Justera dokument Tränar parametrarna för neural maskinöversättning. Var strikt. Skriv dem så att de är optimalt representativa för vad du ska översätta i framtiden.
Testa dokument Beräkna poängenBLEU. Var strikt. Skapa testdokument för att vara optimalt representativa för vad du planerar att översätta i framtiden.
Frasordlista Tvingar den angivna översättningen 100 % av tiden. Var restriktiv. En frasordlista är skiftlägeskänslig och alla ord eller fraser i listan översätts på det sätt som du anger. I många fall är det bättre att inte använda en frasordlista och låta systemet lära sig.
Meningsordlista Tvingar den angivna översättningen 100 % av tiden. Var strikt. En meningsordlista är skiftlägeskänslig och bra för vanliga korta meningar i domänen. För att en meningsordlistematchning ska inträffa måste hela den skickade meningen matcha posten i källordlistan. Om endast en del av meningen matchar matchar inte posten.

Ladda upp dokument

Dokumenttyper associeras med det språkpar som valts när du skapar ett projekt.

  1. Logga in på Custom Translator-portalen . Standardarbetsytan läses in och en lista över tidigare skapade projekt visas.

  2. Välj önskat projektnamn. Som standard är bladet Hantera dokument markerat och en lista över tidigare uppladdade dokument visas.

  3. Välj Lägg till dokumentuppsättning och välj dokumenttyp:

    • Träningsuppsättning
    • Testuppsättning
    • Justeringsuppsättning
    • Ordlisteuppsättning:
      • Frasordlista
      • Meningsordlista
  4. Välj Nästa.

    Skärmbild som illustrerar länken för dokumentuppladdning.

    Kommentar

    Om du väljer Ordlisteuppsättning startas dialogrutan Välj typ av ordlista . Välj en och välj Nästa

  5. Välj dokumentformatet från alternativknapparna.

    Skärmbild som illustrerar uppladdningsdokumentsidan.

    • För Parallella dokument fyller du i Document set name och väljer Bläddra filer för att välja käll- och måldokument.
    • För TM-fil (Translation Memory) eller Upload multiple sets with ZIP (Ladda upp flera uppsättningar med ZIP) väljer du Bläddra filer för att välja filen
  6. Välj överför.

Nu bearbetar Custom Translator dina dokument och försöker extrahera meningar som anges i uppladdningsmeddelandet. När bearbetningen är klar visas meddelandet om att uppladdningen lyckades.

Skärmbild som illustrerar dialogrutan för att ladda upp dokumentbearbetning.

Visa uppladdningshistorik

På arbetsytans sida kan du visa historik för alla dokumentuppladdningsinformation som dokumenttyp, språkpar, uppladdningsstatus osv.

  1. Fliken för uppladdningshistorik visar historik från arbetsytan för Custom Translator-portalen .

    Skärmbild som visar fliken för uppladdningshistorik.

  2. Den här sidan visar status för alla dina tidigare uppladdningar. Den visar uppladdningar från senaste till senaste. Varje uppladdningsstatus visar dokumentnamn som skapats av, uppladdningsstatus, uppladdningsdatum, antal filer som laddats upp, typ av filuppladdning och språkpar. Du kan använda filter för att snabbt hitta dokument efter namn, status, språk och datumintervall.

    Skärmbild som visar sidan för uppladdningshistorik.

  3. Informationssidan för uppladdningshistorik visar de filer som laddats upp som en del av den uppladdade statusen för filen, filens språk och felmeddelandet (om det uppstår ett fel vid uppladdning).

Nästa steg