語言偵測認知技能
語言 偵測 技能會偵測輸入文字的語言,並針對要求提交的每個文件報告單一語言代碼。 語言程式代碼會與指出分析強度的分數配對。 此技能使用 Azure AI 語言中提供的機器學習模型。
當您需要提供文字的語言做為其他技能的輸入時,這項功能特別有用(例如 情感分析技能 或 文字分割技能)。
請參閱 語言偵測支援的語言 。 如果您有以不支援的語言表示的內容,則回應為 (Unknown)
。
注意
此技能會繫結至 Azure AI 服務,並且每個索引子每天超過 20 個文件的交易需要可計費資源。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
資料限制
記錄的大小上限應該是 50,000 個字元 (以 String.Length
為測量單位)。 如果您需要在將數據傳送至語言偵測技能之前中斷數據,您可以使用 文字分割技能。
技能參數
這些參數會區分大小寫。
輸入 | 描述 |
---|---|
defaultCountryHint |
(選擇性)如果 ISO 3166-1 alpha-2 兩個字母國家/地區代碼無法 釐清語言,則可以提供做為語言偵測模型的提示。 具體而言, defaultCountryHint 參數會與未明確指定 countryHint 輸入的檔搭配使用。 |
modelVersion |
(選擇性)指定 呼叫語言偵測時要使用的模型 版本。 它預設為未指定時的最新可用。 除非有必要,否則建議您不要指定此值。 |
技能輸入
這些參數會區分大小寫。
輸入 | 描述 |
---|---|
text |
要分析的文字。 |
countryHint |
ISO 3166-1 alpha-2 兩個字母國家/地區代碼,如果無法釐清語言,則做為語言偵測模型的提示。 |
技能輸出
輸出名稱 | 描述 |
---|---|
languageCode |
所識別語言的 ISO 6391 語言代碼。 例如,“en”。 |
languageName |
語言的名稱。 例如,“English”。 |
score |
介於 0 和 1 之間的值。 正確識別語言的可能性。 如果句子有混合語言,分數可能會低於1。 |
範例定義
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
範例輸入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
範例輸出
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}