Co to jest tłumaczenie dokumentów?

Tłumaczenie dokumentów to funkcja tłumaczenia maszynowego oparta na chmurze usługi Azure AI Translator . Można przetłumaczyć wiele i złożonych dokumentów we wszystkich obsługiwanych językach i dialektach , zachowując jednocześnie oryginalną strukturę dokumentu i format danych. Interfejs API tłumaczenia dokumentów obsługuje dwie operacje tłumaczenia:

  • Asynchroniczne tłumaczenie dokumentów wsadowych obsługuje asynchroniczne przetwarzanie wielu dokumentów i dużych plików. Proces tłumaczenia wsadowego wymaga konta usługi Azure Blob Storage z kontenerami dla dokumentów źródłowych i przetłumaczonych.

  • Synchroniczne tłumaczenie dokumentów obsługuje synchroniczne przetwarzanie translacji pojedynczych plików. Proces tłumaczenia plików nie wymaga konta usługi Azure Blob Storage. Ostateczna odpowiedź zawiera przetłumaczony dokument i jest zwracana bezpośrednio do klienta wywołującego.

Asynchroniczne tłumaczenie wsadowe

Użyj asynchronicznego przetwarzania dokumentów, aby przetłumaczyć wiele dokumentów i dużych plików.

Kluczowe funkcje usługi Batch

Funkcja opis
Tłumaczenie dużych plików Asynchroniczne tłumaczenie całych dokumentów.
Tłumaczenie wielu plików Tłumaczenie wielu plików we wszystkich obsługiwanych językach i dialektach przy zachowaniu struktury dokumentów i formatu danych.
Zachowaj prezentację pliku źródłowego Przetłumacz pliki przy zachowaniu oryginalnego układu i formatu.
Stosowanie tłumaczenia niestandardowego Tłumaczenie dokumentów przy użyciu ogólnych i niestandardowych modeli tłumaczenia .
Stosowanie niestandardowych słowników Tłumaczenie dokumentów przy użyciu niestandardowych słowników.
Automatyczne wykrywanie języka dokumentów Pozwól usłudze tłumaczenia dokumentów określić język dokumentu.
Tłumaczenie dokumentów przy użyciu zawartości w wielu językach Funkcja autowykrywania umożliwia tłumaczenie dokumentów z zawartością w wielu językach na język docelowy.

Opcje programowania wsadowego

Tłumaczenie dokumentów można dodać do aplikacji przy użyciu interfejsu API REST lub zestawu SDK biblioteki klienta:

  • Interfejs API REST. to niezależny interfejs języka, który umożliwia tworzenie żądań HTTP i nagłówków autoryzacji w celu tłumaczenia dokumentów.

  • Zestawy SDK biblioteki klienta to klasy specyficzne dla języka, obiekty, metody i kod, których można szybko użyć, dodając odwołanie w projekcie. Obecnie tłumaczenie dokumentów ma obsługę języka programowania dla języków C#/.NET i Python.

Formaty dokumentów obsługiwanych przez usługę Batch

Metoda Pobierz obsługiwane formaty dokumentów zwraca listę formatów dokumentów obsługiwanych przez usługę tłumaczenia dokumentów. Lista zawiera typowe rozszerzenie pliku i typ zawartości w przypadku korzystania z interfejsu API przekazywania.

Typ pliku Rozszerzenie pliku opis
Adobe PDF pdf Format pliku dokumentu przenośnego. Tłumaczenie dokumentów używa technologii optycznego rozpoznawania znaków (OCR) do wyodrębniania i tłumaczenia tekstu w zeskanowanym dokumencie PDF przy zachowaniu oryginalnego układu.
Wartości rozdzielone przecinkami csv Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.
HTML html, htm Język znaczników hipertekstowych.
Format pliku wymiany lokalizacji Xlf Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku.
Znaczniki języka Markdown markdown, mdown, , mkdn, mkdmd, mdwn, , mdtextmdtxtrmd Lekki język znaczników do tworzenia sformatowanego tekstu.
MHTML mthml, mht Format archiwum strony internetowej używany do łączenia kodu HTML i jej zasobów towarzyszących.
Microsoft Excel xls, xlsx Plik arkusza kalkulacyjnego do analizy danych i dokumentacji.
Microsoft Outlook msg Wiadomość e-mail utworzona lub zapisana w programie Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Plik prezentacji służący do wyświetlania zawartości w formacie pokazu slajdów.
Microsoft Word doc, docx Plik dokumentu tekstowego.
OpenDocument — tekst odt Plik dokumentu tekstowego typu open source.
Prezentacja OpenDocument odp Plik prezentacji typu open source.
Arkusz kalkulacyjny OpenDocument ods Plik arkusza kalkulacyjnego typu open source.
Format tekstu sformatowanego rtf Dokument tekstowy zawierający formatowanie.
Wartości rozdzielone tabulatorami/TAB tsv/tab Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.
Text txt Niesformatowany dokument tekstowy.

Starsze typy plików usługi Batch

Typy plików źródłowych są zachowywane podczas tłumaczenia dokumentu z następującymi wyjątkami:

Rozszerzenie pliku źródłowego Przetłumaczone rozszerzenie pliku
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, odp .pptx

Formaty słownika obsługiwane przez usługę Batch

Tłumaczenie dokumentów obsługuje następujące typy plików słownika:

Typ pliku Rozszerzenie pliku opis
Wartości rozdzielone przecinkami csv Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.
Format pliku wymiany lokalizacji xlf , xliff Równoległy format dokumentu, eksport systemów pamięci tłumaczenia Używane języki są definiowane wewnątrz pliku.
Wartości rozdzielane tabulatorami/TAB tsv, tab Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.

Translacja synchroniczna

Użyj synchronicznego przetwarzania tłumaczenia, aby wysłać dokument w ramach treści żądania HTTP i otrzymać przetłumaczony dokument w odpowiedzi HTTP.

Funkcje klucza tłumaczenia synchronicznego

Funkcja opis
Tłumaczenie plików jednostronicowych Żądanie synchroniczne akceptuje tylko jeden dokument jako dane wejściowe.
Zachowaj prezentację pliku źródłowego Przetłumacz pliki przy zachowaniu oryginalnego układu i formatu.
Stosowanie tłumaczenia niestandardowego Tłumaczenie dokumentów przy użyciu ogólnych i niestandardowych modeli tłumaczenia .
Stosowanie niestandardowych słowników Tłumaczenie dokumentów przy użyciu niestandardowych słowników.
Tłumaczenie w jednym języku Tłumaczenie na język i z jednego obsługiwanego języka.
Automatyczne wykrywanie języka dokumentów Pozwól usłudze tłumaczenia dokumentów określić język dokumentu.
Stosowanie niestandardowych słowników Tłumaczenie dokumentu przy użyciu niestandardowego słownika.

Synchroniczne obsługiwane formaty dokumentów

Typ pliku Rozszerzenie pliku Typ zawartości opis
Zwykły tekst .txt text/plain Niesformatowany dokument tekstowy.
Wartości rozdzielone tabulatorami .txv
.tab
text/tab-separated-values Format pliku tekstowego, który używa kart do oddzielania wartości i nowych linii do oddzielania rekordów.
Wartości rozdzielone przecinkami .csv text/csv Format pliku tekstowego, który używa przecinków jako ogranicznika między wartościami.
Język znaczników hypertext .html
.htm
text/html HTML to standardowy język znaczników używany do tworzenia struktury stron internetowych i zawartości.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Format pliku archiwum strony internetowej.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Format pliku oparty na formacie XML używany na potrzeby prezentacji pokazu slajdów programu PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Format pliku oparty na formacie XML używany w arkuszach kalkulacyjnych programu Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Format pliku oparty na formacie XML używany dla dokumentów programu Word.
Microsoft Outlook .msg application/vnd.ms-outlook Format pliku używany do przechowywania obiektów wiadomości e-mail programu Outlook.
Wymiana lokalizacji xml .xlf
.xliff
application/xliff+xml Ustandaryzowany format pliku oparty na formacie XML powszechnie używany w przetwarzaniu oprogramowania do tłumaczenia i lokalizacji.

Synchroniczne obsługiwane formaty słownika

Tłumaczenie dokumentów obsługuje następujące typy plików słownika:

Typ pliku Rozszerzenie pliku opis
Wartości rozdzielone przecinkami csv Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.
XmlLocalizationInterchange xlf , xliff Format oparty na formacie XML zaprojektowany do standaryzacji sposobu przekazywania danych podczas procesu lokalizacji.
TabSeparatedValues tsv, tab Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego.

Limity żądań tłumaczenia dokumentów

Aby uzyskać szczegółowe informacje dotyczące limitów żądań usługi Azure AI Translator, zobaczLimity żądań tłumaczenia dokumentów.

Miejsce przechowywania danych tłumaczenia dokumentów

Miejsce przechowywania danych tłumaczenia dokumentów zależy od regionu świadczenia usługi Azure, w którym utworzono zasób usługi Translator:

✔️ Funkcja: Punkt końcowy usługi tłumaczenia ✔️
dokumentów: niestandardowy: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Region utworzony przez zasób Żądanie przetwarzania centrum danych
Globalne Najbliższe dostępne centrum danych.
Ameryka Północna i Południowa Wschodnie stany USA 2 • Zachodnie stany USA 2
Azja i Pacyfik Japonia Wschodnia • Azja Południowo-Wschodnia
Europa (z wyjątkiem Szwajcarii) Francja Środkowa • Europa Zachodnia
Szwajcaria Szwajcaria Północna • Szwajcaria Zachodnia

Następne kroki

Z naszego przewodnika Szybki start dowiesz się, jak szybko rozpocząć korzystanie z tłumaczenia dokumentów. Aby rozpocząć, potrzebne jest aktywne konto platformy Azure. Jeśli nie masz, możesz utworzyć bezpłatne konto.