Wskazówki dotyczące formatów dokumentów i konwencji nazewnictwa
Każdy plik używany do tłumaczenia niestandardowego musi mieć długość co najmniej czterech znaków.
Ta tabela zawiera wszystkie obsługiwane formaty plików, których można użyć do utworzenia systemu tłumaczenia:
Format | Rozszerzenia | Opis |
---|---|---|
XLIFF | . XLF. XLIFF | Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku. |
TMX | . TMX | Równoległy format dokumentu, eksport systemów pamięci tłumaczenia. Używane języki są definiowane wewnątrz pliku. |
ZIP | .ZIP | ZIP jest formatem pliku archiwum. |
Locstudio | . LCL | Format firmy Microsoft dla dokumentów równoległych |
Microsoft Word | .DOCX | Dokument Word firmy Microsoft |
Adobe Acrobat | Przenośny dokument Adobe Acrobat | |
HTML | .HTML, .HTM | Dokument HTML |
Plik tekstowy | .TXT | Zakodowane pliki tekstowe UTF-16 lub UTF-8. Nazwa pliku nie może zawierać znaków japońskich. |
Wyrównany plik tekstowy | . WYRÓWNAJ | Rozszerzenie .ALIGN to specjalne rozszerzenie, którego można użyć, jeśli wiesz, że zdania w parze dokumentów są idealnie wyrównane. Jeśli podasz .ALIGN plik, usługa Custom Translator nie będzie wyrównać zdań. |
Plik programu Excel | .XLSX | Plik programu Excel (2013 lub nowszy). Pierwszy wiersz/ wiersz arkusza kalkulacyjnego powinien być kodem języka. |
Formaty słowników
W przypadku słowników funkcja Custom Translator obsługuje wszystkie formaty plików, które są obsługiwane dla zestawów treningowych. Jeśli używasz słownika programu Excel, pierwszy wiersz arkusza kalkulacyjnego powinien zawierać kody języków.
Formaty plików zip
Dokumenty można pogrupować w jeden plik zip i przekazać. Funkcja Custom Translator obsługuje formaty plików zip (ZIP, GZ i TGZ).
Każdy dokument w pliku zip z rozszerzeniem TXT, HTML, HTM, PDF, DOCX, ALIGN musi być zgodny z tą konwencją nazewnictwa:
{nazwa dokumentu}_{kod języka}, w którym {nazwa dokumentu} jest nazwą dokumentu, {language code} jest identyfikatorem JĘZYKA ISO (dwa znaki), wskazującym, że dokument zawiera zdania w tym języku. Musi istnieć podkreślenie (_) przed kodem języka.
Aby na przykład przekazać dwa równoległe dokumenty w pliku zip dla systemu tłumaczeń z języka angielskiego na język hiszpański, pliki powinny mieć nazwy „data_en” i „data_es”.
W przypadków plików pamięci tłumaczeniowej (TMX, XLF, XLIFF, LCL, XLSX) nie trzeba przestrzegać określonej konwencji nazewnictwa języków.
Następne kroki
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla