Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Dil Algılama becerisi, giriş metninin dilini algılar ve istekte gönderilen her belge için tek bir dil kodu bildirir. Dil kodu, analizin gücünü gösteren bir puanla eşleştirilir. Bu beceri, Döküm Araçları'nda Azure Dil'de sağlanan makine öğrenmesi modellerini kullanır.
Bu özellik özellikle metnin dilini diğer becerilere giriş olarak sağlamanız gerektiğinde kullanışlıdır (örneğin, Yaklaşım Analizi becerisi veya Metin Bölme becerisi).
Bkz. Dil Algılama için desteklenen diller . Desteklenmeyen bir dilde ifade edilen içeriğiniz varsa, yanıt şeklindedir (Unknown).
Note
Bu beceri Döküm Araçları'na bağlıdır ve günlük dizin oluşturucu başına 20 belgeyi aşan işlemler için faturalanabilir bir kaynak gerektirir. Yerleşik becerilerin yürütülmesi mevcut Döküm Araçları Standart fiyatından ücretlendirilir.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
Data limits
Kaydın boyut üst sınırı, tarafından String.Lengthölçülen 50.000 karakter olmalıdır. Verilerinizi dil algılama becerisine göndermeden önce bölmeniz gerekiyorsa Metin Bölme becerisini kullanabilirsiniz.
Skill parameters
Parametreler büyük/küçük harfe duyarlıdır.
| Inputs | Description |
|---|---|
defaultCountryHint |
(İsteğe bağlı) Iso 3166-1 alfa-2 iki harfli ülke kodu, dili kesinleştirmediyse dil algılama modeline bir ipucu olarak kullanılabilir. Özellikle parametresi, defaultCountryHint girişi açıkça belirtmeyen countryHint belgelerle birlikte kullanılır. |
modelVersion |
(İsteğe bağlı) Dil algılamayı çağırırken kullanılacak modelin sürümünü belirtir. Belirtilmediğinde varsayılan olarak en son kullanılabilir değeri kullanır. Gerekli olmadığı sürece bu değeri belirtmenizi öneririz. |
Skill inputs
Parametreler büyük/küçük harfe duyarlıdır.
| Inputs | Description |
|---|---|
text |
Analiz edilecek metin. |
countryHint |
Dili kesinleştirme özelliğine sahip değilse dil algılama modeline ipucu olarak kullanılacak ISO 3166-1 alfa-2 iki harfli ülke kodu. |
Skill outputs
| Output Name | Description |
|---|---|
languageCode |
Tanımlanan dil için ISO 6391 dil kodu. Örneğin, "en". |
languageName |
Dilin adı. Örneğin, "İngilizce". |
score |
0 ile 1 arasında bir değer. Dilin doğru şekilde tanımlanması olasılığı. Cümlede karışık diller varsa puan 1'den düşük olabilir. |
Sample definition
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
Sample input
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
Sample output
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}