語言偵測認知技能

發行項
09/01/2024

語言偵測技能會偵測輸入文字的語言，並針對要求提交的每個文件報告單一語言代碼。語言程式代碼會與指出分析強度的分數配對。此技能使用 Azure AI 語言中提供的機器學習模型。

當您需要提供文字的語言做為其他技能的輸入時，這項功能特別有用（例如情感分析技能或文字分割技能）。

請參閱語言偵測支援的語言。如果您有以不支援的語言表示的內容，則回應為 (Unknown)。

注意

此技能會繫結至 Azure AI 服務，並且每個索引子每天超過 20 個文件的交易需要可計費資源。內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

資料限制

記錄的大小上限應該是 50,000 個字元 (以 String.Length 為測量單位)。如果您需要在將數據傳送至語言偵測技能之前中斷數據，您可以使用文字分割技能。

技能參數

這些參數會區分大小寫。

輸入	描述
`defaultCountryHint`	（選擇性）如果 ISO 3166-1 alpha-2 兩個字母國家/地區代碼無法釐清語言，則可以提供做為語言偵測模型的提示。具體而言， `defaultCountryHint` 參數會與未明確指定 `countryHint` 輸入的檔搭配使用。
`modelVersion`	（選擇性）指定呼叫語言偵測時要使用的模型版本。它預設為未指定時的最新可用。除非有必要，否則建議您不要指定此值。

技能輸入

這些參數會區分大小寫。

輸入	描述
`text`	要分析的文字。
`countryHint`	ISO 3166-1 alpha-2 兩個字母國家/地區代碼，如果無法釐清語言，則做為語言偵測模型的提示。

技能輸出

輸出名稱	描述
`languageCode`	所識別語言的 ISO 6391 語言代碼。例如，“en”。
`languageName`	語言的名稱。例如，“English”。
`score`	介於 0 和 1 之間的值。正確識別語言的可能性。如果句子有混合語言，分數可能會低於1。

範例定義

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

範例輸入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

範例輸出

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

另請參閱

內建技能
如何定義技能集 (英文)

共用方式為