テキスト翻訳スキルでは、テキストが評価され、レコードごとに、指定した対象言語に翻訳されたテキストが返されます。 このスキルでは、Azure AI サービスで使用できる Translator Text API v3.0 を使用します。
この機能は、ドキュメント全体が 1 つの言語ではないことが予想される場合に役に立ち、そのような場合、翻訳して検索用のインデックスを作成する前に、テキストを 1 つの言語に正規化することができます。 また、同じテキストのコピーを複数の言語で使用できるようにするローカライズのユース ケースにも役立ちます。
Translator Text API v3.0 は非リージョンの Azure AI サービスです。つまり、データが Azure AI Search またはアタッチされた Azure AI サービス リソースと同じリージョンに留まる保証はありません。
注
このスキルは Azure AI サービスにバインドされており、1 日にインデクサーあたり 20 ドキュメントを超えるトランザクションには課金対象リソースが必要です。 組み込みスキルの実行は、既存の Azure AI サービス Standard 価格で課金されます。
このスキルを使用すると、ソースとターゲットの言語が同じ場合でも、ソース内のすべてのドキュメントが処理され、翻訳に対して課金されます。 この動作は、同じドキュメント内での多言語サポートに役立ちますが、不要な処理が発生する可能性があります。 処理を必要としないドキュメントからの予期しない課金を回避するには、スキルを実行する前にデータ ソース コンテナーからそれらを移動してください。
@odata.type
Microsoft.Skills.Text.TranslationSkill
データ制限
レコードのサイズは、String.Length
で測定して 50,000 文字以下にする必要があります。 データをテキスト翻訳スキルに送信する前に分割する必要がある場合は、テキスト分割スキルの使用を検討してください。 テキスト分割スキルを使用する場合は、最適なパフォーマンスを得るためにページの長さを 5000 に設定します。
スキルのパラメーター
パラメーターの大文字と小文字は区別されます。
入力 | 説明 |
---|---|
defaultToLanguageCode | (必須) 翻訳 "後" の言語が明示的に指定されていないドキュメントに対する翻訳後の言語のコード。 サポートされる言語の完全な一覧を参照してください。 |
defaultFromLanguageCode | (省略可能) 翻訳 "前" の言語が明示的に指定されていないドキュメントに対する翻訳前の言語のコード。 defaultFromLanguageCode が指定されていない場合は、Translator Text API によって提供される自動言語検出を使用して、翻訳 "前" の言語が決定されます。 サポートされる言語の完全な一覧を参照してください。 |
suggestedFrom | (省略可能) fromLanguageCode も defaultFromLanguageCode も指定されておらず、自動言語検出も失敗した場合に、ドキュメントを翻訳するための翻訳前の言語のコード。 suggestedFrom 言語が指定されていない場合は、suggestedFrom 言語として英語 (en) が使用されます。 サポートされる言語の完全な一覧を参照してください。 |
スキルの入力
入力名 | 説明 |
---|---|
テキスト | 翻訳対象のテキスト。 |
toLanguageCode | テキストの翻訳後の言語を示す文字列。 この入力が指定されていない場合、defaultToLanguageCode を使ってテキストが翻訳されます。 サポートされる言語の完全な一覧を参照してください。 |
fromLanguageCode | テキストの現在の言語を示す文字列。 このパラメーターが指定されていない場合は、defaultFromLanguageCode (または、defaultFromLanguageCode が指定されていない場合は自動言語検出) を使ってテキストが翻訳されます。 サポートされる言語の完全な一覧を参照してください。 |
スキルの出力
出力名 | 説明 |
---|---|
translatedText | translatedFromLanguageCode から translatedToLanguageCode へのテキスト翻訳の文字列の結果。 |
translatedToLanguageCode | テキストが翻訳された後の言語コードを示す文字列。 複数の言語に翻訳していて、どのテキストがどの言語であるかを追跡できるようにしたい場合に便利です。 |
translatedFromLanguageCode | テキストの翻訳前の言語コードを示す文字列。 この出力によって検出の結果がわかるので、自動言語検出オプションを選択した場合に便利です。 |
定義例
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
サンプル入力
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
サンプル出力
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
エラーと警告
翻訳 "前" または翻訳 "後" の言語のいずれかに、サポートされていない言語コードを指定した場合、エラーが生成され、テキストは翻訳されません。 テキストが空の場合、警告が生成されます。 テキストが 50,000 文字を超えると、最初の 50,000 文字のみが翻訳され、警告が発行されます。