カスタム翻訳ツールに関してよく寄せられる質問

この記事では、Custom Translator についてよく寄せられる質問とその回答を示します。

現在、Custom Translator にはどのような制限がありますか。

ファイル サイズ、モデルのトレーニング、モデル デプロイについては、制約と制限があります。 Custom Translator でモデルを構築するためのトレーニングを設定するときは、これらの制約に留意してください。

  • 送信されるファイルのサイズは 100 MB 未満である必要があります。
  • モノリンガル データはサポートされていません。

トレーニングを実行した翻訳システムのデプロイはいつ要求すればよいですか。

プロジェクトに最適な翻訳システムを作成するために、複数のトレーニングを実行することがあります。 BLEU スコアやテスト結果に満足できない場合は、トレーニング データを増やすか、より慎重にフィルター処理されたデータを使用してみることをお勧めします。 チューニング セットとテスト セットの設計は、厳格に注意して行う必要があります。 それらのセットが翻訳する素材の用語とスタイルを完全に表していることを確認してください。 トレーニング データの作成時はより自由に取り組み、さまざまなオプションを使用して実験を行うことができます。 システムのテスト結果の翻訳に満足し、トレーニング済みシステムを改善するためにトレーニングに追加できるデータがもう存在しない場合、システムのデプロイを要求してください。

1 つのプロジェクトでデプロイできるトレーニング済みシステムの数はいくつですか。

1 つのプロジェクトでデプロイできるトレーニング済みシステムは 1 つのみです。 プロジェクトに適した翻訳システムを作成するために複数のトレーニングが必要な場合があります。最適な結果を達成できるトレーニングのデプロイを要求することをお勧めします。 翻訳の品質がデプロイに適していると判断する前に、BLEU スコア (高い方が良い) と、レビュー担当者への相談で、トレーニングの品質を判断することができます。

トレーニングはどのくらいでデプロイされますか。

一般的に、デプロイにかかる時間は 1 時間未満です。

デプロイされたシステムにアクセスする方法を教えてください。

デプロイされたシステムには、Microsoft Translator Text API V3 を介して CategoryID を指定することでアクセスできます。 Translator Text API の詳細については、API リファレンス Web ページを参照してください。

データに文が既にアラインされている場合に、アラインと文の分割をスキップする方法を教えてください。

Custom Translator では、TMX ファイルと拡張子が .align のテキスト ファイルの場合に、文のアラインと文の区切りがスキップされます。 .align ファイルは、完全にアラインされ、それ以上の処理が不要なファイルに対するカスタム トランスレーターの文分割およびアライン処理をスキップするためのオプションです。 完全にアラインされているファイルにのみ、.align の拡張子を使用することをお勧めします。

抽出された文の数が同じベース名の 2 つのファイルと一致しない場合、Custom Translator では .align ファイルに対して文のアライン機能が実行されます。

TMX をアップロードしようとすると、"ドキュメントの処理に失敗しました" と表示されます。

TMX が TMX 1.4b 仕様に準拠していることを確認してください。

次のステップ