カスタム翻訳ツールに関してよく寄せられる質問
この記事では、Custom Translator についてよく寄せられる質問とその回答を示します。
現在、Custom Translator にはどのような制限がありますか。
ファイル サイズ、モデルのトレーニング、モデル デプロイについては、制約と制限があります。 Custom Translator でモデルを構築するためのトレーニングを設定するときは、これらの制約に留意してください。
- 翻訳対象のファイルのサイズは 100 MB 未満である必要があります。
- モノリンガル データはサポートされていません。 モノリンガル ファイルには、別の言語の別のファイルとペアリングされていない単一言語が含まれています。
トレーニングされた翻訳システムのデプロイはいつ要求すればよいですか。
プロジェクトに最適な翻訳システムを作成するために、複数のトレーニングを実行することがあります。 BLEU
スコアやテスト結果に満足できない場合は、トレーニング データを増やすか、より慎重にフィルター処理されたデータを使用してみることをお勧めします。 チューニング セットとテスト セットの設計は、厳格に注意して行う必要があります。 それらのセットが翻訳する素材の用語とスタイルを完全に表していることを確認してください。 トレーニング データの作成時はより自由に取り組み、さまざまなオプションを使用して実験を行うことができます。 システムのテスト結果の翻訳が満足のいくもので、トレーニング済みシステムを改善するために追加するデータがもう存在しない場合、システムのデプロイを要求してください。
1 つのプロジェクトでデプロイできるトレーニング済みシステムの数はいくつですか。
1 つのプロジェクトでデプロイできるトレーニング済みシステムは 1 つのみです。 プロジェクトに適した翻訳システムを作成するために複数のトレーニングが必要な場合があります。最適な結果を達成できるトレーニングのデプロイを要求することをお勧めします。 翻訳の品質がデプロイに適していると判断する前に、BLEU
スコア (高い方が良い) と、レビュー担当者への相談で、トレーニングの品質を判断することができます。
トレーニングはどのくらいでデプロイされますか。
一般的に、デプロイにかかる時間は 1 時間未満です。
デプロイされたシステムにアクセスする方法を教えてください。
デプロイされたシステムには、Microsoft Translator Text API V3 を介して CategoryID を指定することでアクセスできます。 Translator Text API の詳細については、API リファレンス Web ページを参照してください。
データに文が既にアラインされている場合に、アラインと文の分割をスキップする方法を教えてください。
Custom Translator では、TMX
ファイルと拡張子が .align
のテキスト ファイルの場合に、文のアラインと文の区切りがスキップされます。 .align
ファイルは、完全にアラインされ、それ以上の処理が不要なファイルに対するカスタム トランスレーターの文分割およびアライン処理をスキップするためのオプションです。 完全にアラインされているファイルにのみ、.align
の拡張子を使用することをお勧めします。
抽出された文の数が、同じベース名の 2 つのファイルと一致しない場合、Custom Translator によって、.align
ファイルに対して文のアライン機能が実行されます。
Translation Memory Exchange (TMX) ファイルをアップロードしようとすると、"ドキュメントの処理に失敗しました" と表示されます
TMX が TMX 1.4b 仕様に準拠していることを確認してください。