Udostępnij za pośrednictwem


Wskazówki dotyczące formatów dokumentów i konwencji nazewnictwa

Każdy plik używany do tłumaczenia niestandardowego musi mieć długość co najmniej czterech znaków.

Ta tabela zawiera wszystkie obsługiwane formaty plików, których można użyć do utworzenia systemu tłumaczenia:

Format Rozszerzenia Opis
XLIFF . XLF. XLIFF Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku.
TMX . TMX Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku.
ZIP .ZIP ZIP jest formatem pliku archiwum.
Locstudio . LCL Format firmy Microsoft dla dokumentów równoległych
Microsoft Word .DOCX Dokument Word firmy Microsoft
Adobe Acrobat .PDF Przenośny dokument Adobe Acrobat
HTML .HTML, .HTM Dokument HTML
Plik tekstowy .TXT Zakodowane pliki tekstowe UTF-16 lub UTF-8. Nazwa pliku nie może zawierać znaków japońskich.
Wyrównany plik tekstowy . WYRÓWNAJ Rozszerzenie .ALIGN to specjalne rozszerzenie, którego można użyć, jeśli wiesz, że zdania w parze dokumentów są idealnie wyrównane. Jeśli podasz .ALIGN plik, usługa Custom Translator nie będzie wyrównać zdań.
Plik programu Excel .XLSX Plik programu Excel (2013 lub nowszy). Pierwszy wiersz/ wiersz arkusza kalkulacyjnego powinien być kodem języka.

Formaty słowników

W przypadku słowników funkcja Custom Translator obsługuje wszystkie formaty plików, które są obsługiwane dla zestawów treningowych. Jeśli używasz słownika programu Excel, pierwszy wiersz arkusza kalkulacyjnego powinien zawierać kody języków.

Formaty plików zip

Dokumenty można pogrupować w jeden plik zip i przekazać. Funkcja Custom Translator obsługuje formaty plików zip (ZIP, GZ i TGZ).

Każdy dokument w pliku zip z rozszerzeniem TXT, HTML, HTM, PDF, DOCX, ALIGN musi być zgodny z tą konwencją nazewnictwa:

{nazwa dokumentu}_{kod języka}, w którym {nazwa dokumentu} jest nazwą dokumentu, {language code} jest identyfikatorem JĘZYKA ISO (dwa znaki), wskazującym, że dokument zawiera zdania w tym języku. Musi istnieć podkreślenie (_) przed kodem języka.

Aby na przykład przekazać dwa równoległe dokumenty w pliku zip dla systemu tłumaczeń z języka angielskiego na język hiszpański, pliki powinny mieć nazwy „data_en” i „data_es”.

W przypadków plików pamięci tłumaczeniowej (TMX, XLF, XLIFF, LCL, XLSX) nie trzeba przestrzegać określonej konwencji nazewnictwa języków.

Następne kroki