Mi az a dokumentumfordítás?
A dokumentumfordítás az Azure AI Translator szolgáltatás felhőalapú gépi fordítási funkciója. Az eredeti dokumentumstruktúra és adatformátum megőrzése mellett több és összetett dokumentumot is lefordíthat az összes támogatott nyelvre és nyelvjárásra . A Dokumentumfordítási API két fordítási folyamatot támogat:
Az aszinkron kötegelt fordítás több dokumentum és nagyméretű fájl feldolgozását támogatja. A kötegelt fordítási folyamathoz egy Azure Blob Storage-fiók szükséges, amely tárolókat biztosít a forrásdokumentumok és a lefordított dokumentumok számára.
A szinkron önálló fájl támogatja az önálló fájlfordítások feldolgozását. A fájlfordítási folyamathoz nincs szükség Azure Blob Storage-fiókra. A végső válasz tartalmazza a lefordított dokumentumot, és közvetlenül a hívó ügyfélnek adja vissza.
Aszinkron kötegelt fordítás
Aszinkron dokumentumfeldolgozással több dokumentumot és nagyméretű fájlt fordíthat le.
Batch-kulcsok funkciói
Szolgáltatás | Leírás |
---|---|
Nagyméretű fájlok fordítása | Teljes dokumentumok aszinkron fordítása. |
Számos fájl fordítása | Több fájl lefordítása az összes támogatott nyelvre és nyelvjárásra, miközben megőrzi a dokumentumstruktúrát és az adatformátumot. |
Forrásfájl-bemutató megőrzése | Fájlok fordítása az eredeti elrendezés és formátum megőrzése mellett. |
Egyéni fordítás alkalmazása | Dokumentumok fordítása általános és egyéni fordítási modellek használatával. |
Egyéni szószedetek alkalmazása | Dokumentumok fordítása egyéni szószedetekkel. |
Dokumentumnyelv automatikus észlelése | Hagyja, hogy a Dokumentumfordítási szolgáltatás határozza meg a dokumentum nyelvét. |
Dokumentumok fordítása több nyelven lévő tartalommal | Az automatikus észlelés funkcióval több nyelven is lefordíthatja a dokumentumokat a célnyelvre. |
Batch-fejlesztési lehetőségek
A REST API-val vagy egy ügyféloldali SDK-val dokumentumfordítást adhat az alkalmazásokhoz:
A REST API. egy nyelvi agnosztikus felület, amellyel HTTP-kéréseket és engedélyezési fejléceket hozhat létre a dokumentumok fordításához.
Az ügyféloldali kódtár SDK-k nyelvspecifikus osztályok, objektumok, metódusok és kód, amelyeket gyorsan használhat, ha hozzáad egy hivatkozást a projekthez. A Document Translation jelenleg programozási nyelvi támogatást nyújt a C#/.NET-hez és a Pythonhoz.
Batch által támogatott dokumentumformátumok
A Támogatott dokumentumformátumok lekérése metódus a Dokumentumfordítás szolgáltatás által támogatott dokumentumformátumok listáját adja vissza. A lista tartalmazza a gyakori fájlkiterjesztést és a tartalomtípust, ha a feltöltési API-t használja.
Fájltípus | Fájlkiterjesztés | Leírás |
---|---|---|
Adobe PDF | pdf |
Hordozható dokumentumfájl formátuma. A dokumentumfordítás optikai karakterfelismerési (OCR) technológiával kinyeri és lefordítja a beolvasott PDF-dokumentumban lévő szöveget, miközben megtartja az eredeti elrendezést. |
Vesszővel tagolt értékek | csv |
Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl. |
HTML | html , htm |
Hyper Text Markup Language. |
Localization Interchange fájlformátum | xlf | Párhuzamos dokumentumformátum, a Translation Memory-rendszerek exportálása. A használt nyelvek a fájlban vannak definiálva. |
Markdown | markdown , mdown , mkdn , md mkd , mdwn , mdtxt , , mdtext rmd |
Egyszerűsített korrektúranyelv formázott szöveg létrehozásához. |
MHTML | mthml , mht |
A HTML-kód és a társerőforrások kombinálására használt weblaparchívum-formátum. |
Microsoft Excel | xls , xlsx |
Táblázatfájl adatelemzéshez és dokumentációhoz. |
Microsoft Outlook | msg |
A Microsoft Outlookban létrehozott vagy mentett e-mail. |
Microsoft PowerPoint | ppt , pptx |
Bemutatófájl, amely diavetítési formátumban jeleníti meg a tartalmat. |
Microsoft Word | doc , docx |
Szöveges dokumentumfájl. |
OpenDocument szöveg | odt |
Nyílt forráskódú szöveges dokumentumfájl. |
OpenDocument-bemutató | odp |
Nyílt forráskódú bemutatófájl. |
OpenDocument-számolótábla | ods |
Nyílt forráskódú számolótáblafájl. |
Rich Text formátum | rtf |
Formázást tartalmazó szöveges dokumentum. |
Tabulátorral tagolt értékek/TAB | tsv /tab |
Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl. |
Szöveg | txt |
Formázatlan szöveges dokumentum. |
Örökölt Batch-fájltípusok
A forrásfájltípusok a dokumentumfordítás során a következő kivételekkel maradnak meg:
Forrásfájl-bővítmény | Lefordított fájlkiterjesztés |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Batch által támogatott szószedetformátumok
A dokumentumfordítás a következő szószedetfájltípusokat támogatja:
Fájltípus | Fájlkiterjesztés | Leírás |
---|---|---|
Vesszővel tagolt értékek | csv |
Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl. |
Localization Interchange fájlformátum | xlf , xliff |
Párhuzamos dokumentumformátum, fordítási memóriarendszerek exportálása A használt nyelvek a fájlban vannak definiálva. |
Tabulátorral tagolt értékek/TAB | tsv , tab |
Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl. |
Szinkron fordítás
Szinkron fordítási feldolgozással küldje el a dokumentumot a HTTP-kérelem törzsének részeként, és fogadja a lefordított dokumentumot a HTTP-válaszban.
Szinkron fordítási kulcsok funkciói
Szolgáltatás | Leírás |
---|---|
Egyoldalas fájlok fordítása | A szinkron kérés csak egyetlen dokumentumot fogad bemenetként. |
Forrásfájl-bemutató megőrzése | Fájlok fordítása az eredeti elrendezés és formátum megőrzése mellett. |
Egyéni fordítás alkalmazása | Dokumentumok fordítása általános és egyéni fordítási modellek használatával. |
Egyéni szószedetek alkalmazása | Dokumentumok fordítása egyéni szószedetekkel. |
Egynyelvű fordítás | Fordítás egy támogatott nyelvre és nyelvről. |
Dokumentumnyelv automatikus észlelése | Hagyja, hogy a Dokumentumfordítási szolgáltatás határozza meg a dokumentum nyelvét. |
Egyéni szószedetek alkalmazása | Dokumentum fordítása egyéni szószedet használatával. |
Szinkron támogatott dokumentumformátumok
Fájltípus | Fájlkiterjesztés | Tartalomtípus | Leírás |
---|---|---|---|
Egyszerű szöveg | .txt |
text/plain |
Formázatlan szöveges dokumentum. |
Tabulátorral elválasztott értékek | .txv .tab |
text/tab-separated-values |
Szövegfájlformátum, amely tabulátorokkal választja el az értékeket és az új sorokat a rekordok elkülönítéséhez. |
Vesszővel tagolt értékek | .csv |
text/csv |
Szöveges fájlformátum, amely vesszőket használ az értékek közötti elválasztóként. |
HyperText Korrektúra nyelv | .html .htm |
text/html |
A HTML egy szabványos korrektúranyelv, amellyel weblapokat és tartalmakat lehet strukturálni. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Weblap archív fájlformátuma. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
A PowerPoint diavetítés-bemutatóihoz használt XML-alapú fájlformátum. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Excel-számolótáblákhoz használt XML-alapú fájlformátum. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Word-dokumentumokhoz használt XML-alapú fájlformátum. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Tárolt Outlook-üzenetobjektumokhoz használt fájlformátum. |
Xml-honosítási csomópont | .xlf .xliff |
application/xliff+xml |
A fordítási és honosítási szoftverfeldolgozásban széles körben használt szabványosított XML-alapú fájlformátum. |
Szinkron támogatott szószedetformátumok
A dokumentumfordítás a következő szószedetfájltípusokat támogatja:
Fájltípus | Fájlkiterjesztés | Leírás |
---|---|---|
Vesszővel tagolt értékek | csv |
Táblázatkezelő programok által használt vesszővel tagolt nyersadat-fájl. |
XmlLocalizationInterchange | xlf , xliff |
Xml-alapú formátum, amely szabványosítja az adatok átadását a honosítási folyamat során. |
TabSeparatedValues | tsv , tab |
Táblázatkezelő programok által használt, tabulátorral tagolt nyersadat-fájl. |
Dokumentumfordítási kérelem korlátai
Az Azure AI Translator Service kéréskorlátairól a Dokumentumfordítási kérelmek korlátai című témakörben talál részletes információt.
Dokumentumfordítási adatok tartózkodási helye
A dokumentumfordítási adatok tartózkodási helye attól az Azure-régiótól függ, ahol a Translator-erőforrás létrejött:
✔️ Szolgáltatás: Dokumentumfordítási ✔️
szolgáltatás végpontja: Egyéni: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Erőforrás által létrehozott régió | Adatfeldolgozási adatközpont kérése |
---|---|
Globális | Legközelebbi elérhető adatközpont. |
Amerika | USA 2. keleti régiója • USA 2. nyugati régiója |
Ázsia és a csendes-óceáni | Kelet-Japán • Délkelet-Ázsia |
Európa (Svájc kivételével) | Közép-Franciaország • Nyugat-Európa |
Svájc | Észak-Svájc • Nyugat-Svájc |
Következő lépések
Rövid útmutatónkból megtudhatja, hogyan kezdheti el gyorsan a dokumentumfordítás használatát. Először is aktív Azure-fiókra van szüksége. Ha még nincs fiókja, hozzon létre egy ingyenes fiókot.