Share via


語言偵測認知技能

語言 偵測 技能會偵測輸入文字的語言,並針對要求提交的每個文件報告單一語言代碼。 語言程式代碼會與指出分析強度的分數配對。 此技能使用 Azure AI 語言提供的機器學習模型。

當您需要提供文字的語言做為其他技能的輸入時,這項功能特別有用(例如 情感分析技能文字分割技能)。

請參閱 語言偵測支援的語言 。 如果您有以不支援的語言表示的內容,則回應為 (Unknown)

注意

此技能會系結至 Azure AI 服務,而且需要 每天超過每個索引器 20 份檔的計費資源 。 內建技能的執行會以現有的 Azure AI 服務隨用隨付價格收費。

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

資料限制

記錄的大小上限應為50,000個字元,如所 String.Length測量。 如果您需要在將數據傳送至語言偵測技能之前中斷數據,您可以使用 文字分割技能

技能參數

參數會區分大小寫。

輸入 描述
defaultCountryHint (選擇性)如果 ISO 3166-1 alpha-2 兩個字母國家/地區代碼無法 釐清語言,則可以提供做為語言偵測模型的提示。 具體而言, defaultCountryHint 參數會與未明確指定 countryHint 輸入的檔搭配使用。
modelVersion (選擇性)指定 呼叫語言偵測時要使用的模型 版本。 它預設為未指定時的最新可用。 除非有必要,否則建議您不要指定此值。

技能輸入

參數會區分大小寫。

輸入 描述
text 要分析的文字。
countryHint ISO 3166-1 alpha-2 兩個字母國家/地區代碼,如果無法釐清語言,則做為語言偵測模型的提示。

技能輸出

輸出名稱 描述
languageCode 所識別語言的 ISO 6391 語言代碼。 例如,“en”。
languageName 語言的名稱。 例如,“English”。
score 介於 0 和 1 之間的值。 正確識別語言的可能性。 如果句子有混合語言,分數可能會低於1。

範例定義

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

範例輸入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

範例輸出

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

另請參閱