ドキュメントの形式と名前付け規則のガイダンス
カスタム翻訳に使用するすべてのファイルは、4 文字以上の長さにする必要があります。
この表には、翻訳システムの構築に使用できる、サポートされているすべてのファイル形式がまとめられています。
Format | 拡張機能 | 説明 |
---|---|---|
XLIFF | .XLF、.XLIFF | 並列ドキュメント形式、翻訳メモリ システムのエクスポート。 使用される言語はファイル内で定義されています。 |
TMX | .TMX | 並列ドキュメント形式、翻訳メモリ システムのエクスポート。 使用される言語はファイル内で定義されています。 |
ZIP | .ZIP | ZIP はアーカイブのファイル形式です。 |
Locstudio | .LCL | Microsoft の並列ドキュメントの形式 |
Microsoft Word | .DOCX | Microsoft Word 文書 |
Adobe Acrobat | Adobe Acrobat ポータブル ドキュメント | |
HTML | .HTML、.HTM | HTML ドキュメント |
テキスト ファイル | .TXT | UTF-16 または UTF-8 でエンコードされたテキスト ファイル。 このファイル名に日本語文字を含めることはできません。 |
アライン済みテキスト ファイル | .ALIGN | 拡張子 .ALIGN は、ドキュメント ペア内の文が完全にアラインされていることがわかっている場合に使用できる特別な拡張子です。 .ALIGN ファイルを指定すると、カスタム翻訳ツールでは文が自動的にアラインされません。 |
Excel ファイル | .XLSX | Excel ファイル (2013 以降)。 スプレッドシートの最初の行には言語コードを指定する必要があります。 |
辞書の形式
辞書の場合、カスタム翻訳ツールはトレーニング セットでサポートされているすべてのファイル形式をサポートしています。 Excel の辞書を使用している場合は、スプレッドシートの最初の行に言語コードを指定する必要があります。
zip ファイル形式
複数のドキュメントを 1 つの zip ファイルにまとめてアップロードすることができます。 Custom Translator は、zip ファイル形式 (ZIP、GZ、TGZ) をサポートしています。
TXT、HTML、HTM、PDF、DOCX、ALIGN の拡張子を持つ、ZIP ファイル内の各ドキュメントは、次の名前付け規則に従う必要があります。
{ドキュメント名}_{言語コード}。この {ドキュメント名} はドキュメントの名前、{言語コード} は ISO LanguageID (2 文字) であり、ドキュメントにその言語の文が含まれていることを示します。 言語コードの前にアンダースコア (_) を指定する必要があります。
たとえば、英語からスペイン語へのシステム用の zip 内に 2 つの並列ドキュメントを含めてアップロードするには、ファイル名を "data_en" と "data_es" にする必要があります。
翻訳メモリ ファイル (TMX、XLF、XLIFF、LCL、XLSX) は、必ずしも特定の言語の名前付け規則に準拠している必要はありません。