文字翻譯認知技能
文字 翻譯 技能會評估文字,並針對每個記錄傳回翻譯為指定目標語言的文字。 此技能使用 Azure AI 服務中提供的翻譯工具文字 API v3.0 。
如果您預期檔可能不是全部都使用單一語言,則這項功能很有用,在此情況下,您可以先將文字正規化為單一語言,再藉由翻譯來編製搜尋索引。 它也適用於當地語系化使用案例,您可以在其中提供多種語言的相同文字複本。
翻譯工具文字 API v3.0 是非區域性的 Azure AI 服務,這表示您的數據不保證會與您的 Azure AI 搜尋或連結的 Azure AI 服務資源位於相同的區域中。
注意
此技能會繫結至 Azure AI 服務,並且每個索引子每天超過 20 個文件的交易需要可計費資源。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。
使用此技能時,即使來源和目標語言相同,來源中的所有文件都會處理並計費以進行翻譯。 此行為適用於相同檔內的多語言支援,但可能會導致不必要的處理。 若要避免不需要處理的文件產生非預期的計費費用,請在執行技能之前,將它們移出數據源容器。
@odata.type
Microsoft.Skills.Text.TranslationSkill
資料限制
記錄的大小上限應該是 50,000 個字元 (以 String.Length
為測量單位)。 如果您需要在將數據傳送至文字翻譯技能之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。
技能參數
這些參數會區分大小寫。
輸入 | 描述 |
---|---|
defaultToLanguageCode | (必要)針對未明確指定「to」 語言的檔,將文件翻譯成的語言代碼。 查看支援語言的完整清單。 |
defaultFromLanguageCode | (選擇性)針對未明確指定「from」語言的文件,翻譯文件的語言代碼。 如果未指定 defaultFromLanguageCode,翻譯工具文字 API 所提供的自動語言偵測將用來判斷“from” 語言。 查看支援語言的完整清單。 |
suggestedFrom | (選擇性)如果 fromLanguageCode 或 defaultFromLanguageCode 未指定,則翻譯檔的語言代碼,且自動語言偵測不成功。 如果未指定 suggestedFrom 語言,則會使用英文 (en) 作為建議的From 語言。 查看支援語言的完整清單。 |
技能輸入
輸入名稱 | 描述 |
---|---|
text | 要翻譯的文字。 |
toLanguageCode | 字串,指出文字應該翻譯為的語言。 如果未指定此輸入,則會使用 defaultToLanguageCode 來翻譯文字。 查看支援語言的完整清單。 |
fromLanguageCode | 字串,表示文字的目前語言。 如果未指定此參數,則會使用 defaultFromLanguageCode 來翻譯文字,或未提供 defaultFromLanguageCode 時自動偵測語言。 查看支援語言的完整清單。 |
技能輸出
輸出名稱 | 描述 |
---|---|
translatedText | 從 translationFromLanguageCode 到 translationToLanguageCode 之文字翻譯的字串結果。 |
translatedToLanguageCode | 字串,指出文字已翻譯成的語言代碼。 如果您要翻譯為多種語言,而且想要追蹤哪一個文字是哪一種語言,則很有用。 |
translatedFromLanguageCode | 字串,指出文字翻譯的來源語言代碼。 如果您選擇使用自動語言偵測選項,因為此輸出會提供該偵測的結果。 |
範例定義
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
範例輸入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
範例輸出
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
錯誤和警告
如果您為「到」或「from」語言提供不支援的語言代碼,則會產生錯誤,且不會翻譯文字。 如果您的文字是空的,則會產生警告。 如果您的文字大於 50,000 個字元,則只會翻譯前 50,000 個字元,併發出警告。