Vad är dokumentöversättning?

Dokumentöversättning är en molnbaserad maskinöversättningsfunktion i Azure AI Translator-tjänsten . Du kan översätta flera och komplexa dokument över alla språk och dialekter som stöds samtidigt som du bevarar den ursprungliga dokumentstrukturen och dataformatet. API:et för dokumentöversättning stöder två översättningsåtgärder:

  • Asynkron batchdokumentöversättning stöder asynkron bearbetning av flera dokument och stora filer. Batchöversättningsprocessen kräver ett Azure Blob Storage-konto med containrar för källan och översatta dokument.

  • Synkron dokumentöversättning stöder synkron bearbetning av enstaka filöversättningar. Filöversättningsprocessen kräver inget Azure Blob Storage-konto. Det slutliga svaret innehåller det översatta dokumentet och returneras direkt till den anropande klienten.

Asynkron batchöversättning

Använd asynkron dokumentbearbetning för att översätta flera dokument och stora filer.

Funktioner för Batch-nycklar

Funktion beskrivning
Översätta stora filer Översätt hela dokument asynkront.
Översätta många filer Översätt flera filer över alla språk och dialekter som stöds samtidigt som dokumentstrukturen och dataformatet bevaras.
Bevara källfilpresentationen Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras.
Tillämpa anpassad översättning Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller .
Använda anpassade ordlistor Översätt dokument med hjälp av anpassade ordlistor.
Identifiera dokumentspråk automatiskt Låt dokumentöversättningstjänsten bestämma dokumentets språk.
Översätta dokument med innehåll på flera språk Använd funktionen identifiera automatiskt för att översätta dokument med innehåll på flera språk till målspråket.

Utvecklingsalternativ för Batch

Du kan lägga till dokumentöversättning i dina program med hjälp av REST-API:et eller ett SDK för klientbiblioteket:

  • REST-API:et. är ett språkagnostiskt gränssnitt som gör att du kan skapa HTTP-begäranden och auktoriseringshuvuden för att översätta dokument.

  • Klientbibliotekets SDK:er är språkspecifika klasser, objekt, metoder och kod som du snabbt kan använda genom att lägga till en referens i projektet. För närvarande har dokumentöversättning stöd för programmeringsspråk för C#/.NET och Python.

Dokumentformat som stöds av Batch

Metoden Hämta dokumentformat som stöds returnerar en lista över dokumentformat som stöds av dokumentöversättningstjänsten. Listan innehåller det vanliga filtillägget och innehållstypen om du använder uppladdnings-API:et.

Filtyp Filnamnstillägg beskrivning
Adobe PDF pdf Portabelt dokumentfilformat. Dokumentöversättning använder optisk teckenigenkänningsteknik (OCR) för att extrahera och översätta text i skannade PDF-dokument samtidigt som den ursprungliga layouten bevaras.
Kommaavgränsade värden csv En kommaavgränsad rådatafil som används av kalkylbladsprogram.
HTML html, htm Hypertextmarkeringsspråk.
Filformat för lokaliseringsutbyte Xlf Ett parallellt dokumentformat, export av översättningsminnessystem. De språk som används definieras i filen.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, , mdtxt, , mdtextrmd Ett enkelt markeringsspråk för att skapa formaterad text.
MHTML mthml, mht Ett webbsidearkivformat som används för att kombinera HTML-kod och dess tillhörande resurser.
Microsoft Excel xls, xlsx En kalkylbladsfil för dataanalys och dokumentation.
Microsoft Outlook msg Ett e-postmeddelande som skapats eller sparats i Microsoft Outlook.
Microsoft PowerPoint ppt, pptx En presentationsfil som används för att visa innehåll i ett bildspelsformat.
Microsoft Word doc, docx En textdokumentfil.
OpenDocument-text odt En textdokumentfil med öppen källkod.
OpenDocument-presentation odp En presentationsfil med öppen källkod.
OpenDocument-kalkylblad ods En kalkylbladsfil med öppen källkod.
RTF-format rtf Ett textdokument som innehåller formatering.
Tabbavgränsade värden/TABB tsv/tab En flikavgränsad rådatafil som används av kalkylbladsprogram.
Text txt Ett oformaterat textdokument.

Batch Legacy-filtyper

Källfiltyper bevaras under dokumentöversättningen med följande undantag:

Källfilnamnstillägg Översatt filnamnstillägg
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Ordlisteformat som stöds i Batch

Dokumentöversättning stöder följande ordlistefiltyper:

Filtyp Filnamnstillägg beskrivning
Kommaavgränsade värden csv En kommaavgränsad rådatafil som används av kalkylbladsprogram.
Filformat för lokaliseringsutbyte xlf , xliff Ett parallellt dokumentformat, export av översättningsminnessystem De språk som används definieras i filen.
Tabbavgränsade värden/TABB tsv, tab En flikavgränsad rådatafil som används av kalkylbladsprogram.

Synkron översättning

Använd synkron översättningsbearbetning för att skicka ett dokument som en del av HTTP-begärandetexten och ta emot det översatta dokumentet i HTTP-svaret.

Funktioner för synkron översättningsnyckel

Funktion beskrivning
Översätta ensidesfiler Den synkrona begäran accepterar endast ett enda dokument som indata.
Bevara källfilpresentationen Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras.
Tillämpa anpassad översättning Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller .
Använda anpassade ordlistor Översätt dokument med hjälp av anpassade ordlistor.
Översättning på ett språk Översätt till och från ett språk som stöds.
Identifiera dokumentspråk automatiskt Låt dokumentöversättningstjänsten bestämma dokumentets språk.
Använda anpassade ordlistor Översätt ett dokument med hjälp av en anpassad ordlista.

Synkrona dokumentformat som stöds

Filtyp Filnamnstillägg Innehållstyp beskrivning
Oformaterad text .txt text/plain Ett oformaterat textdokument.
Tabbavgränsade värden .txv
.tab
text/tab-separated-values Ett textfilformat som använder flikar för att separera värden och nya poster för att separera poster.
Kommaavgränsade värden .csv text/csv Ett textfilformat som använder kommatecken som avgränsare mellan värden.
HyperText-markeringsspråk .html
.htm
text/html HTML är ett standardpåläggsspråk som används för att strukturera webbsidor och innehåll.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Ett filformat för webbsidearkiv.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Ett XML-baserat filformat som används för PowerPoint-bildspelspresentationer.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Ett XML-baserat filformat som används för Excel-kalkylblad.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Ett XML-baserat filformat som används för Word-dokument.
Microsoft Outlook .msg application/vnd.ms-outlook Ett filformat som används för lagrade Outlook-e-postmeddelandeobjekt.
Xml-lokaliseringsutbyte .xlf
.xliff
application/xliff+xml Ett standardiserat XML-baserat filformat som ofta används vid bearbetning av översättnings- och lokaliseringsprogram.

Ordlisteformat som stöds synkront

Dokumentöversättning stöder följande ordlistefiltyper:

Filtyp Filnamnstillägg beskrivning
Kommaavgränsade värden csv En kommaavgränsad rådatafil som används av kalkylbladsprogram.
XmlLocalizationInterchange xlf , xliff Ett XML-baserat format som är utformat för att standardisera hur data skickas under lokaliseringsprocessen.
TabSeparatedValues tsv, tab En flikavgränsad rådatafil som används av kalkylbladsprogram.

Begränsningar för begäran om dokumentöversättning

Detaljerad information om begränsningar för Azure AI Translator Service-begäranden finns iBegränsningar för begäran om dokumentöversättning.

Datahemvist för dokumentöversättning

Datahemvist för dokumentöversättning beror på den Azure-region där din Translator-resurs skapades:

  • Translator-resurser som skapats i alla regioner i Europa (utom Schweiz) bearbetas i datacenter i Europa, norra och Europa, västra.
  • Translator-resurser som skapats i alla regioner i Schweiz bearbetas i datacenter i Schweiz, norra och Schweiz, västra.
  • Translator-resurser som skapats i alla regioner i Asien och Stillahavsområdet eller Australien bearbetas i datacenter i Sydostasien och Australien, östra.
  • Translator-resurser som skapats i alla andra regioner, inklusive Global, Nordamerika och Sydamerika, bearbetasi datacenter i USA, östra och USA, västra 2.

✔️ Funktion: Slutpunkt för dokumentöversättningstjänsten ✔️
: Anpassad:<name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Resursregion Begära bearbetning av datacenter
Alla regioner inom Europa (utom Schweiz) Europa: Europa, norra • Europa, västra
Schweiz Schweiz: Schweiz, norra • Schweiz, västra
Alla regioner i Asien och Stillahavsområdet och Australien Asien: Sydostasien • Australien, östra
Alla andra regioner, inklusive Global, Nordamerika och Sydamerika USA: USA, östra • USA, västra 2

Nästa steg

I vår snabbstart lär du dig att snabbt komma igång med hjälp av dokumentöversättning. Till att börja med behöver du ett aktivt Azure-konto. Om du inte har någon, kan du skapa ett kostnadsfritt konto.