Share via


Mi az a dokumentumfordítás?

A dokumentumfordítás az Azure AI Translator szolgáltatás felhőalapú gépi fordítási funkciója. Az eredeti dokumentumstruktúra és adatformátum megőrzése mellett több és összetett dokumentumot is lefordíthat az összes támogatott nyelvre és nyelvjárásra . A Dokumentumfordítási API két fordítási műveletet támogat:

  • Az aszinkron kötegelt dokumentumfordítás több dokumentum és nagyméretű fájl aszinkron feldolgozását támogatja. A kötegelt fordítási folyamathoz egy Azure Blob Storage-fiók szükséges, amely tárolókat biztosít a forráshoz és a lefordított dokumentumokhoz.

  • A szinkron dokumentumfordítás támogatja az önálló fájlfordítások szinkron feldolgozását. A fájlfordítási folyamathoz nincs szükség Azure Blob Storage-fiókra. A végső válasz tartalmazza a lefordított dokumentumot, és közvetlenül a hívó ügyfélnek adja vissza.

Aszinkron kötegelt fordítás

Aszinkron dokumentumfeldolgozással több dokumentumot és nagyméretű fájlt fordíthat le.

Batch-kulcsok funkciói

Szolgáltatás Leírás
Nagyméretű fájlok fordítása Teljes dokumentumok aszinkron fordítása.
Számos fájl fordítása Több fájl lefordítása az összes támogatott nyelvre és nyelvjárásra, miközben megőrzi a dokumentumstruktúrát és az adatformátumot.
Forrásfájl-bemutató megőrzése Fájlok fordítása az eredeti elrendezés és formátum megőrzése mellett.
Egyéni fordítás alkalmazása Dokumentumok fordítása általános és egyéni fordítási modellek használatával.
Egyéni szószedetek alkalmazása Dokumentumok fordítása egyéni szószedetekkel.
Dokumentumnyelv automatikus észlelése Hagyja, hogy a Dokumentumfordítási szolgáltatás határozza meg a dokumentum nyelvét.
Dokumentumok fordítása több nyelven lévő tartalommal Az automatikus észlelés funkcióval több nyelven is lefordíthatja a dokumentumokat a célnyelvre.

Batch-fejlesztési lehetőségek

A REST API-val vagy egy ügyféloldali SDK-val dokumentumfordítást adhat az alkalmazásokhoz:

  • A REST API. egy nyelvi agnosztikus felület, amellyel HTTP-kéréseket és engedélyezési fejléceket hozhat létre a dokumentumok fordításához.

  • Az ügyféloldali kódtár SDK-k nyelvspecifikus osztályok, objektumok, metódusok és kód, amelyeket gyorsan használhat, ha hozzáad egy hivatkozást a projekthez. A Document Translation jelenleg programozási nyelvi támogatást nyújt a C#/.NET-hez és a Pythonhoz.

Batch által támogatott dokumentumformátumok

A Támogatott dokumentumformátumok lekérése metódus a Dokumentumfordítás szolgáltatás által támogatott dokumentumformátumok listáját adja vissza. A lista tartalmazza a gyakori fájlkiterjesztést és a tartalomtípust, ha a feltöltési API-t használja.

Fájltípus Fájlkiterjesztés Leírás
Adobe PDF pdf Hordozható dokumentumfájl formátuma. A dokumentumfordítás optikai karakterfelismerési (OCR) technológiával kinyeri és lefordítja a beolvasott PDF-dokumentumban lévő szöveget, miközben megtartja az eredeti elrendezést.
Vesszővel tagolt értékek csv Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl.
HTML html, htm Hyper Text Markup Language.
Localization Interchange fájlformátum xlf Párhuzamos dokumentumformátum, a Translation Memory-rendszerek exportálása. A használt nyelvek a fájlban vannak definiálva.
Markdown markdown, mdown, mkdn, mdmkd, mdwn, mdtxt, , mdtextrmd Egyszerűsített korrektúranyelv formázott szöveg létrehozásához.
MHTML mthml, mht A HTML-kód és a társerőforrások kombinálására használt weblaparchívum-formátum.
Microsoft Excel xls, xlsx Táblázatfájl adatelemzéshez és dokumentációhoz.
Microsoft Outlook msg A Microsoft Outlookban létrehozott vagy mentett e-mail.
Microsoft PowerPoint ppt, pptx Bemutatófájl, amely diavetítési formátumban jeleníti meg a tartalmat.
Microsoft Word doc, docx Szöveges dokumentumfájl.
OpenDocument szöveg odt Nyílt forráskódú szöveges dokumentumfájl.
OpenDocument-bemutató odp Nyílt forráskódú bemutatófájl.
OpenDocument-számolótábla ods Nyílt forráskódú számolótáblafájl.
Rich Text formátum rtf Formázást tartalmazó szöveges dokumentum.
Tabulátorral tagolt értékek/TAB tsv/tab Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl.
Szöveg txt Formázatlan szöveges dokumentum.

Örökölt Batch-fájltípusok

A forrásfájltípusok a dokumentumfordítás során a következő kivételekkel maradnak meg:

Forrásfájl-bővítmény Lefordított fájlkiterjesztés
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Batch által támogatott szószedetformátumok

A dokumentumfordítás a következő szószedetfájltípusokat támogatja:

Fájltípus Fájlkiterjesztés Leírás
Vesszővel tagolt értékek csv Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl.
Localization Interchange fájlformátum xlf , xliff Párhuzamos dokumentumformátum, fordítási memóriarendszerek exportálása A használt nyelvek a fájlban vannak definiálva.
Tabulátorral tagolt értékek/TAB tsv, tab Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl.

Szinkron fordítás

Szinkron fordítási feldolgozással küldje el a dokumentumot a HTTP-kérelem törzsének részeként, és fogadja a lefordított dokumentumot a HTTP-válaszban.

Szinkron fordítási kulcsok funkciói

Szolgáltatás Leírás
Egyoldalas fájlok fordítása A szinkron kérés csak egyetlen dokumentumot fogad bemenetként.
Forrásfájl-bemutató megőrzése Fájlok fordítása az eredeti elrendezés és formátum megőrzése mellett.
Egyéni fordítás alkalmazása Dokumentumok fordítása általános és egyéni fordítási modellek használatával.
Egyéni szószedetek alkalmazása Dokumentumok fordítása egyéni szószedetekkel.
Egynyelvű fordítás Fordítás egy támogatott nyelvre és nyelvről.
Dokumentumnyelv automatikus észlelése Hagyja, hogy a Dokumentumfordítási szolgáltatás határozza meg a dokumentum nyelvét.
Egyéni szószedetek alkalmazása Dokumentum fordítása egyéni szószedet használatával.

Szinkron támogatott dokumentumformátumok

Fájltípus Fájlkiterjesztés Tartalomtípus Leírás
Egyszerű szöveg .txt text/plain Formázatlan szöveges dokumentum.
Tabulátorral elválasztott értékek .txv
.tab
text/tab-separated-values Szövegfájlformátum, amely tabulátorokkal választja el az értékeket és az új sorokat a rekordok elkülönítéséhez.
Vesszővel tagolt értékek .csv text/csv Szöveges fájlformátum, amely vesszőket használ az értékek közötti elválasztóként.
HyperText Korrektúra nyelv .html
.htm
text/html A HTML egy szabványos korrektúranyelv, amellyel weblapokat és tartalmakat lehet strukturálni.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Weblap archív fájlformátuma.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation A PowerPoint diavetítés-bemutatóihoz használt XML-alapú fájlformátum.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Excel-számolótáblákhoz használt XML-alapú fájlformátum.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Word-dokumentumokhoz használt XML-alapú fájlformátum.
Microsoft Outlook .msg application/vnd.ms-outlook Tárolt Outlook-üzenetobjektumokhoz használt fájlformátum.
Xml-honosítási csomópont .xlf
.xliff
application/xliff+xml A fordítási és honosítási szoftverfeldolgozásban széles körben használt szabványosított XML-alapú fájlformátum.

Szinkron támogatott szószedetformátumok

A dokumentumfordítás a következő szószedetfájltípusokat támogatja:

Fájltípus Fájlkiterjesztés Leírás
Vesszővel tagolt értékek csv Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl.
XmlLocalizationInterchange xlf , xliff Xml-alapú formátum, amely szabványosítja az adatok átadását a honosítási folyamat során.
TabSeparatedValues tsv, tab Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl.

Dokumentumfordítási kérelem korlátai

Az Azure AI Translator Service kéréskorlátairól a Dokumentumfordítási kérelmek korlátai című témakörben találrészletes információt.

Dokumentumfordítási adatok tartózkodási helye

A dokumentumfordítási adatok tartózkodási helye attól az Azure-régiótól függ, ahol a Translator-erőforrás létrejött:

✔️ Szolgáltatás: Dokumentumfordítási ✔️
szolgáltatás végpontja: Egyéni: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Erőforrás által létrehozott régió Adatfeldolgozási adatközpont kérése
Globális Legközelebbi elérhető adatközpont.
Americas USA 2. keleti régiója • USA 2. nyugati régiója
Ázsia és a csendes-óceáni Kelet-Japán • Délkelet-Ázsia
Európa (Svájc kivételével) Közép-Franciaország • Nyugat-Európa
Svájc Észak-Svájc • Nyugat-Svájc

Következő lépések

Rövid útmutatónkból megtudhatja, hogyan kezdheti el gyorsan a dokumentumfordítás használatát. Először is aktív Azure-fiókra van szüksége. Ha még nincs fiókja, hozzon létre egy ingyenes fiókot.