Co to jest tłumaczenie dokumentów?
Tłumaczenie dokumentów to funkcja tłumaczenia maszynowego oparta na chmurze usługi Azure AI Translator . Można przetłumaczyć wiele i złożonych dokumentów we wszystkich obsługiwanych językach i dialektach , zachowując jednocześnie oryginalną strukturę dokumentu i format danych. Interfejs API tłumaczenia dokumentów obsługuje dwa procesy tłumaczenia:
Asynchroniczne tłumaczenie wsadowe obsługuje przetwarzanie wielu dokumentów i dużych plików. Proces tłumaczenia wsadowego wymaga konta usługi Azure Blob Storage z kontenerami magazynu dla dokumentów źródłowych i przetłumaczonych.
Synchroniczny pojedynczy plik obsługuje przetwarzanie tłumaczeń pojedynczych plików. Proces tłumaczenia plików nie wymaga konta usługi Azure Blob Storage. Ostateczna odpowiedź zawiera przetłumaczony dokument i jest zwracana bezpośrednio do klienta wywołującego.
Asynchroniczne tłumaczenie wsadowe
Użyj asynchronicznego przetwarzania dokumentów, aby przetłumaczyć wiele dokumentów i dużych plików.
Kluczowe funkcje usługi Batch
Funkcja | opis |
---|---|
Tłumaczenie dużych plików | Asynchroniczne tłumaczenie całych dokumentów. |
Tłumaczenie wielu plików | Tłumaczenie wielu plików we wszystkich obsługiwanych językach i dialektach przy zachowaniu struktury dokumentów i formatu danych. |
Zachowaj prezentację pliku źródłowego | Przetłumacz pliki przy zachowaniu oryginalnego układu i formatu. |
Stosowanie tłumaczenia niestandardowego | Tłumaczenie dokumentów przy użyciu ogólnych i niestandardowych modeli tłumaczenia . |
Stosowanie niestandardowych słowników | Tłumaczenie dokumentów przy użyciu niestandardowych słowników. |
Automatyczne wykrywanie języka dokumentów | Pozwól usłudze tłumaczenia dokumentów określić język dokumentu. |
Tłumaczenie dokumentów przy użyciu zawartości w wielu językach | Funkcja autowykrywania umożliwia tłumaczenie dokumentów z zawartością w wielu językach na język docelowy. |
Opcje programowania wsadowego
Tłumaczenie dokumentów można dodać do aplikacji przy użyciu interfejsu API REST lub zestawu SDK biblioteki klienta:
Interfejs API REST. to niezależny interfejs języka, który umożliwia tworzenie żądań HTTP i nagłówków autoryzacji w celu tłumaczenia dokumentów.
Zestawy SDK biblioteki klienta to klasy specyficzne dla języka, obiekty, metody i kod, których można szybko użyć, dodając odwołanie w projekcie. Obecnie tłumaczenie dokumentów ma obsługę języka programowania dla języków C#/.NET i Python.
Formaty dokumentów obsługiwanych przez usługę Batch
Metoda Pobierz obsługiwane formaty dokumentów zwraca listę formatów dokumentów obsługiwanych przez usługę tłumaczenia dokumentów. Lista zawiera typowe rozszerzenie pliku i typ zawartości w przypadku korzystania z interfejsu API przekazywania.
Typ pliku | Rozszerzenie pliku | opis |
---|---|---|
Adobe PDF | pdf |
Format pliku dokumentu przenośnego. Tłumaczenie dokumentów używa technologii optycznego rozpoznawania znaków (OCR) do wyodrębniania i tłumaczenia tekstu w zeskanowanym dokumencie PDF przy zachowaniu oryginalnego układu. |
Wartości rozdzielone przecinkami | csv |
Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
HTML | html , htm |
Język znaczników hipertekstowych. |
Format pliku wymiany lokalizacji | xlf | Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku. |
Znaczniki języka Markdown | markdown , mdown , , mkdn , mkd md , mdwn , , mdtext mdtxt rmd |
Lekki język znaczników do tworzenia sformatowanego tekstu. |
MHTML | mthml , mht |
Format archiwum strony internetowej używany do łączenia kodu HTML i jej zasobów towarzyszących. |
Microsoft Excel | xls , xlsx |
Plik arkusza kalkulacyjnego do analizy danych i dokumentacji. |
Microsoft Outlook | msg |
Wiadomość e-mail utworzona lub zapisana w programie Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
Plik prezentacji służący do wyświetlania zawartości w formacie pokazu slajdów. |
Microsoft Word | doc , docx |
Plik dokumentu tekstowego. |
OpenDocument — tekst | odt |
Plik dokumentu tekstowego typu open source. |
Prezentacja OpenDocument | odp |
Plik prezentacji typu open source. |
Arkusz kalkulacyjny OpenDocument | ods |
Plik arkusza kalkulacyjnego typu open source. |
Format tekstu sformatowanego | rtf |
Dokument tekstowy zawierający formatowanie. |
Wartości rozdzielone tabulatorami/TAB | tsv /tab |
Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
Text | txt |
Niesformatowany dokument tekstowy. |
Starsze typy plików usługi Batch
Typy plików źródłowych są zachowywane podczas tłumaczenia dokumentu z następującymi wyjątkami:
Rozszerzenie pliku źródłowego | Przetłumaczone rozszerzenie pliku |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, odp | .pptx |
Formaty słownika obsługiwane przez usługę Batch
Tłumaczenie dokumentów obsługuje następujące typy plików słownika:
Typ pliku | Rozszerzenie pliku | opis |
---|---|---|
Wartości rozdzielone przecinkami | csv |
Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
Format pliku wymiany lokalizacji | xlf , xliff |
Równoległy format dokumentu, eksport systemów pamięci tłumaczenia Używane języki są definiowane wewnątrz pliku. |
Wartości rozdzielane tabulatorami/TAB | tsv , tab |
Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
Translacja synchroniczna
Użyj synchronicznego przetwarzania tłumaczenia, aby wysłać dokument w ramach treści żądania HTTP i otrzymać przetłumaczony dokument w odpowiedzi HTTP.
Funkcje klucza tłumaczenia synchronicznego
Funkcja | opis |
---|---|
Tłumaczenie plików jednostronicowych | Żądanie synchroniczne akceptuje tylko jeden dokument jako dane wejściowe. |
Zachowaj prezentację pliku źródłowego | Przetłumacz pliki przy zachowaniu oryginalnego układu i formatu. |
Stosowanie tłumaczenia niestandardowego | Tłumaczenie dokumentów przy użyciu ogólnych i niestandardowych modeli tłumaczenia . |
Stosowanie niestandardowych słowników | Tłumaczenie dokumentów przy użyciu niestandardowych słowników. |
Tłumaczenie w jednym języku | Tłumaczenie na język i z jednego obsługiwanego języka. |
Automatyczne wykrywanie języka dokumentów | Pozwól usłudze tłumaczenia dokumentów określić język dokumentu. |
Stosowanie niestandardowych słowników | Tłumaczenie dokumentu przy użyciu niestandardowego słownika. |
Synchroniczne obsługiwane formaty dokumentów
Typ pliku | Rozszerzenie pliku | Typ zawartości | opis |
---|---|---|---|
Zwykły tekst | .txt |
text/plain |
Niesformatowany dokument tekstowy. |
Wartości rozdzielone tabulatorami | .txv .tab |
text/tab-separated-values |
Format pliku tekstowego, który używa kart do oddzielania wartości i nowych linii do oddzielania rekordów. |
Wartości rozdzielone przecinkami | .csv |
text/csv |
Format pliku tekstowego, który używa przecinków jako ogranicznika między wartościami. |
Język znaczników hypertext | .html .htm |
text/html |
HTML to standardowy język znaczników używany do tworzenia struktury stron internetowych i zawartości. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Format pliku archiwum strony internetowej. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Format pliku oparty na formacie XML używany na potrzeby prezentacji pokazu slajdów programu PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Format pliku oparty na formacie XML używany w arkuszach kalkulacyjnych programu Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Format pliku oparty na formacie XML używany dla dokumentów programu Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Format pliku używany do przechowywania obiektów wiadomości e-mail programu Outlook. |
Wymiana lokalizacji xml | .xlf .xliff |
application/xliff+xml |
Ustandaryzowany format pliku oparty na formacie XML powszechnie używany w przetwarzaniu oprogramowania do tłumaczenia i lokalizacji. |
Synchroniczne obsługiwane formaty słownika
Tłumaczenie dokumentów obsługuje następujące typy plików słownika:
Typ pliku | Rozszerzenie pliku | opis |
---|---|---|
Wartości rozdzielone przecinkami | csv |
Rozdzielany przecinkami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
XmlLocalizationInterchange | xlf , xliff |
Format oparty na formacie XML zaprojektowany do standaryzacji sposobu przekazywania danych podczas procesu lokalizacji. |
TabSeparatedValues | tsv , tab |
Rozdzielany tabulatorami plik nieprzetworzonych danych używany przez programy arkusza kalkulacyjnego. |
Limity żądań tłumaczenia dokumentów
Aby uzyskać szczegółowe informacje dotyczące limitów żądań usługi Azure AI Translator, zobacz Limity żądań tłumaczenia dokumentów.
Miejsce przechowywania danych tłumaczenia dokumentów
Miejsce przechowywania danych tłumaczenia dokumentów zależy od regionu świadczenia usługi Azure, w którym utworzono zasób usługi Translator:
✔️ Funkcja: Punkt końcowy usługi tłumaczenia ✔️
dokumentów: niestandardowy: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Region utworzony przez zasób | Żądanie przetwarzania centrum danych |
---|---|
Globalny | Najbliższe dostępne centrum danych. |
Ameryka Północna i Południowa | Wschodnie stany USA 2 • Zachodnie stany USA 2 |
Azja i Pacyfik | Japonia Wschodnia • Azja Południowo-Wschodnia |
Europa (z wyjątkiem Szwajcarii) | Francja Środkowa • Europa Zachodnia |
Szwajcaria | Szwajcaria Północna • Szwajcaria Zachodnia |
Następne kroki
Z naszego przewodnika Szybki start dowiesz się, jak szybko rozpocząć korzystanie z tłumaczenia dokumentów. Aby rozpocząć, potrzebne jest aktywne konto platformy Azure. Jeśli nie masz, możesz utworzyć bezpłatne konto.