Share via


Vad är parallella dokument?

Parallella dokument är par av dokument där det ena dokumentet är en översättning av det andra. Ett dokument i paret innehåller meningar på källspråket och det andra dokumentet innehåller samma meningar översatta till målspråket. Det spelar ingen roll vilket språk som är markerat som ”källa” och vilket språk som är markerat som ”mål” – ett parallellt dokument kan användas för att träna ett översättningssystem i båda riktningarna.

Krav

Du behöver minst 10 000 unika parallella meningar för att träna ett system. Den här begränsningen är ett säkerhetsnät för att säkerställa att dina parallella meningar innehåller tillräckligt med unik vokabulär för att träna en översättningsmodell. Vi rekommenderar att du kontinuerligt lägger till mer parallellt innehåll och tränar om för att förbättra kvaliteten på översättningssystemet. Mer information finns iMeningsjustering.

Microsoft kräver att dokument som laddats upp till Custom Translator inte bryter mot en tredje parts upphovsrätt eller immateriella egenskaper. Mer information finns i användningsvillkoren. När du laddar upp ett dokument med hjälp av portalen ändras inte ägandet av den immateriella egendomen i själva dokumentet.

Användning av parallella dokument

Parallella dokument används av systemet:

  1. För att lära dig hur ord, fraser och meningar ofta mappas mellan de två språken.

  2. Lär dig hur du bearbetar rätt kontext beroende på de omgivande fraserna. Ett ord kanske inte alltid översätts till exakt samma ord på det andra språket.

Vi rekommenderar att du ser till att det finns en 1:1-meningskorrespondens mellan käll- och målspråkversionerna av dokumenten.

Om ditt projekt är domänspecifikt (kategori) bör dina dokument vara konsekventa i terminologin inom den kategorin. Kvaliteten på det resulterande översättningssystemet beror på antalet meningar i dokumentuppsättningen och kvaliteten på meningarna. Ju fler exempel dina dokument innehåller med olika användningar för ett ord som är specifikt för din kategori, desto bättre jobb kan systemet göra under översättningen.

Dokument som laddas upp är privata för varje arbetsyta och kan användas i så många projekt eller utbildningar som du vill. Meningar som extraheras från dina dokument lagras separat i lagringsplatsen som oformaterade Unicode-textfiler och är tillgängliga för dig att ta bort. Använd inte Custom Translator som dokumentlagringsplats. Du kan inte ladda ned de dokument som du laddade upp i det format som du laddade upp dem.

Nästa steg