Vad är dokumentöversättning?
Dokumentöversättning är en molnbaserad maskinöversättningsfunktion i Azure AI Translator-tjänsten . Du kan översätta flera och komplexa dokument över alla språk och dialekter som stöds samtidigt som du bevarar den ursprungliga dokumentstrukturen och dataformatet. API:et för dokumentöversättning stöder två översättningsåtgärder:
Asynkron batchdokumentöversättning stöder asynkron bearbetning av flera dokument och stora filer. Batchöversättningsprocessen kräver ett Azure Blob Storage-konto med containrar för källan och översatta dokument.
Synkron dokumentöversättning stöder synkron bearbetning av enstaka filöversättningar. Filöversättningsprocessen kräver inget Azure Blob Storage-konto. Det slutliga svaret innehåller det översatta dokumentet och returneras direkt till den anropande klienten.
Asynkron batchöversättning
Använd asynkron dokumentbearbetning för att översätta flera dokument och stora filer.
Funktioner för Batch-nycklar
Funktion | beskrivning |
---|---|
Översätta stora filer | Översätt hela dokument asynkront. |
Översätta många filer | Översätt flera filer över alla språk och dialekter som stöds samtidigt som dokumentstrukturen och dataformatet bevaras. |
Bevara källfilpresentationen | Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras. |
Tillämpa anpassad översättning | Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller . |
Använda anpassade ordlistor | Översätt dokument med hjälp av anpassade ordlistor. |
Identifiera dokumentspråk automatiskt | Låt dokumentöversättningstjänsten bestämma dokumentets språk. |
Översätta dokument med innehåll på flera språk | Använd funktionen identifiera automatiskt för att översätta dokument med innehåll på flera språk till målspråket. |
Utvecklingsalternativ för Batch
Du kan lägga till dokumentöversättning i dina program med hjälp av REST-API:et eller ett SDK för klientbiblioteket:
REST-API:et. är ett språkagnostiskt gränssnitt som gör att du kan skapa HTTP-begäranden och auktoriseringshuvuden för att översätta dokument.
Klientbibliotekets SDK:er är språkspecifika klasser, objekt, metoder och kod som du snabbt kan använda genom att lägga till en referens i projektet. För närvarande har dokumentöversättning stöd för programmeringsspråk för C#/.NET och Python.
Dokumentformat som stöds av Batch
Metoden Hämta dokumentformat som stöds returnerar en lista över dokumentformat som stöds av dokumentöversättningstjänsten. Listan innehåller det vanliga filtillägget och innehållstypen om du använder uppladdnings-API:et.
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Adobe PDF | pdf |
Portabelt dokumentfilformat. Dokumentöversättning använder optisk teckenigenkänningsteknik (OCR) för att extrahera och översätta text i skannade PDF-dokument samtidigt som den ursprungliga layouten bevaras. |
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
HTML | html , htm |
Hypertextmarkeringsspråk. |
Filformat för lokaliseringsutbyte | Xlf | Ett parallellt dokumentformat, export av översättningsminnessystem. De språk som används definieras i filen. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , , mdtxt , , mdtext rmd |
Ett enkelt markeringsspråk för att skapa formaterad text. |
MHTML | mthml , mht |
Ett webbsidearkivformat som används för att kombinera HTML-kod och dess tillhörande resurser. |
Microsoft Excel | xls , xlsx |
En kalkylbladsfil för dataanalys och dokumentation. |
Microsoft Outlook | msg |
Ett e-postmeddelande som skapats eller sparats i Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
En presentationsfil som används för att visa innehåll i ett bildspelsformat. |
Microsoft Word | doc , docx |
En textdokumentfil. |
OpenDocument-text | odt |
En textdokumentfil med öppen källkod. |
OpenDocument-presentation | odp |
En presentationsfil med öppen källkod. |
OpenDocument-kalkylblad | ods |
En kalkylbladsfil med öppen källkod. |
RTF-format | rtf |
Ett textdokument som innehåller formatering. |
Tabbavgränsade värden/TABB | tsv /tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Text | txt |
Ett oformaterat textdokument. |
Batch Legacy-filtyper
Källfiltyper bevaras under dokumentöversättningen med följande undantag:
Källfilnamnstillägg | Översatt filnamnstillägg |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Ordlisteformat som stöds i Batch
Dokumentöversättning stöder följande ordlistefiltyper:
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
Filformat för lokaliseringsutbyte | xlf , xliff |
Ett parallellt dokumentformat, export av översättningsminnessystem De språk som används definieras i filen. |
Tabbavgränsade värden/TABB | tsv , tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Synkron översättning
Använd synkron översättningsbearbetning för att skicka ett dokument som en del av HTTP-begärandetexten och ta emot det översatta dokumentet i HTTP-svaret.
Funktioner för synkron översättningsnyckel
Funktion | beskrivning |
---|---|
Översätta ensidesfiler | Den synkrona begäran accepterar endast ett enda dokument som indata. |
Bevara källfilpresentationen | Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras. |
Tillämpa anpassad översättning | Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller . |
Använda anpassade ordlistor | Översätt dokument med hjälp av anpassade ordlistor. |
Översättning på ett språk | Översätt till och från ett språk som stöds. |
Identifiera dokumentspråk automatiskt | Låt dokumentöversättningstjänsten bestämma dokumentets språk. |
Använda anpassade ordlistor | Översätt ett dokument med hjälp av en anpassad ordlista. |
Synkrona dokumentformat som stöds
Filtyp | Filnamnstillägg | Innehållstyp | beskrivning |
---|---|---|---|
Oformaterad text | .txt |
text/plain |
Ett oformaterat textdokument. |
Tabbavgränsade värden | .txv .tab |
text/tab-separated-values |
Ett textfilformat som använder flikar för att separera värden och nya poster för att separera poster. |
Kommaavgränsade värden | .csv |
text/csv |
Ett textfilformat som använder kommatecken som avgränsare mellan värden. |
HyperText-markeringsspråk | .html .htm |
text/html |
HTML är ett standardpåläggsspråk som används för att strukturera webbsidor och innehåll. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Ett filformat för webbsidearkiv. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Ett XML-baserat filformat som används för PowerPoint-bildspelspresentationer. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Ett XML-baserat filformat som används för Excel-kalkylblad. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Ett XML-baserat filformat som används för Word-dokument. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Ett filformat som används för lagrade Outlook-e-postmeddelandeobjekt. |
Xml-lokaliseringsutbyte | .xlf .xliff |
application/xliff+xml |
Ett standardiserat XML-baserat filformat som ofta används vid bearbetning av översättnings- och lokaliseringsprogram. |
Ordlisteformat som stöds synkront
Dokumentöversättning stöder följande ordlistefiltyper:
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
XmlLocalizationInterchange | xlf , xliff |
Ett XML-baserat format som är utformat för att standardisera hur data skickas under lokaliseringsprocessen. |
TabSeparatedValues | tsv , tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Begränsningar för begäran om dokumentöversättning
Detaljerad information om begränsningar för Azure AI Translator Service-begäranden finns iBegränsningar för begäran om dokumentöversättning.
Datahemvist för dokumentöversättning
Datahemvist för dokumentöversättning beror på den Azure-region där din Translator-resurs skapades:
- Translator-resurser som skapats i alla regioner i Europa (utom Schweiz) bearbetas i datacenter i Europa, norra och Europa, västra.
- Translator-resurser som skapats i alla regioner i Schweiz bearbetas i datacenter i Schweiz, norra och Schweiz, västra.
- Translator-resurser som skapats i alla regioner i Asien och Stillahavsområdet eller Australien bearbetas i datacenter i Sydostasien och Australien, östra.
- Translator-resurser som skapats i alla andra regioner, inklusive Global, Nordamerika och Sydamerika, bearbetasi datacenter i USA, östra och USA, västra 2.
✔️ Funktion: Slutpunkt för dokumentöversättningstjänsten ✔️ : Anpassad:<name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Resursregion | Begära bearbetning av datacenter |
---|---|
Alla regioner inom Europa (utom Schweiz) | Europa: Europa, norra • Europa, västra |
Schweiz | Schweiz: Schweiz, norra • Schweiz, västra |
Alla regioner i Asien och Stillahavsområdet och Australien | Asien: Sydostasien • Australien, östra |
Alla andra regioner, inklusive Global, Nordamerika och Sydamerika | USA: USA, östra • USA, västra 2 |
Nästa steg
I vår snabbstart lär du dig att snabbt komma igång med hjälp av dokumentöversättning. Till att börja med behöver du ett aktivt Azure-konto. Om du inte har någon, kan du skapa ett kostnadsfritt konto.