文字翻譯認知技能

文字 翻譯 技能會評估文字,並針對每個記錄傳回翻譯為指定目標語言的文字。 此技能會使用 Azure AI 服務中提供的 翻譯工具 Text API v3.0

如果您預期檔可能不是全部都使用單一語言,則這項功能很有用,在此情況下,您可以先將文字正規化為單一語言,再藉由翻譯來編製搜尋索引。 它也適用於當地語系化使用案例,您可以在其中提供多種語言的相同文字複本。

翻譯工具 文字 API v3.0 是非區域性的 Azure AI 服務,這表示您的數據不保證會保留在與 Azure AI 搜尋或連結的 Azure AI 服務資源相同的區域中。

注意

此技能會系結至 Azure AI 服務,而且需要 每天超過每個索引器 20 份檔的計費資源 。 內建技能的執行會以現有的 Azure AI 服務隨用隨付價格收費。

使用此技能時,即使來源和目標語言相同,來源中的所有文件都會處理並計費以進行翻譯。 此行為適用於相同檔內的多語言支援,但可能會導致不必要的處理。 若要避免不需要處理的文件產生非預期的計費費用,請在執行技能之前,將它們移出數據源容器。

@odata.type

Microsoft.Skills.Text.TranslationSkill

資料限制

記錄的大小上限應為50,000個字元,如所 String.Length測量。 如果您需要在將數據傳送至文字翻譯技能之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。

技能參數

參數會區分大小寫。

輸入 描述
defaultToLanguageCode (必要)針對未明確指定「to」 語言的檔,將文件翻譯成的語言代碼。
查看支援語言的完整清單。
defaultFromLanguageCode (選擇性)針對未明確指定「from」語言的文件,翻譯文件的語言代碼。 如果未指定 defaultFromLanguageCode,則會使用 翻譯工具 文字 API 所提供的自動語言偵測來判斷“from” 語言。
查看支援語言的完整清單。
suggestedFrom (選擇性)如果 fromLanguageCodedefaultFromLanguageCode 未指定,則翻譯檔的語言代碼,且自動語言偵測不成功。 如果未指定 suggestedFrom 語言,則會使用英文 (en) 作為建議的From 語言。
查看支援語言的完整清單。

技能輸入

輸入名稱 描述
text 要翻譯的文字。
toLanguageCode 字串,指出文字應該翻譯為的語言。 如果未指定此輸入,則會使用 defaultToLanguageCode 來翻譯文字。
查看支援語言的完整清單。
fromLanguageCode 字串,表示文字的目前語言。 如果未指定此參數,則會使用 defaultFromLanguageCode 來翻譯文字,或未提供 defaultFromLanguageCode 時自動偵測語言。
查看支援語言的完整清單。

技能輸出

輸出名稱 描述
translatedText 從 translationFromLanguageCode 到 translationToLanguageCode 之文字翻譯的字串結果。
translatedToLanguageCode 字串,指出文字已翻譯成的語言代碼。 如果您要翻譯為多種語言,而且想要追蹤哪一個文字是哪一種語言,則很有用。
translatedFromLanguageCode 字串,指出文字翻譯的來源語言代碼。 如果您選擇使用自動語言偵測選項,因為此輸出會提供該偵測的結果。

範例定義

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

範例輸入

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

範例輸出

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

錯誤和警告

如果您為「到」或「from」語言提供不支援的語言代碼,則會產生錯誤,且不會翻譯文字。 如果您的文字是空的,則會產生警告。 如果您的文字大於 50,000 個字元,則只會翻譯前 50,000 個字元,併發出警告。

另請參閱