Dil algılama bilişsel becerisi

Dil Algılama becerisi, giriş metninin dilini algılar ve istekte gönderilen her belge için tek bir dil kodu bildirir. Dil kodu, analizin gücünü gösteren bir puanla eşleştirilir. Bu beceri, Döküm Araçları'nda Azure Dil'de sağlanan makine öğrenmesi modellerini kullanır.

Bu özellik özellikle metnin dilini diğer becerilere giriş olarak sağlamanız gerektiğinde kullanışlıdır (örneğin, Yaklaşım Analizi becerisi veya Metin Bölme becerisi).

Bkz. Dil Algılama için desteklenen diller . Desteklenmeyen bir dilde ifade edilen içeriğiniz varsa, yanıt şeklindedir (Unknown).

Note

Bu beceri Döküm Araçları'na bağlıdır ve günlük dizin oluşturucu başına 20 belgeyi aşan işlemler için faturalanabilir bir kaynak gerektirir. Yerleşik becerilerin yürütülmesi mevcut Döküm Araçları Standart fiyatından ücretlendirilir.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Data limits

Kaydın boyut üst sınırı, tarafından String.Lengthölçülen 50.000 karakter olmalıdır. Verilerinizi dil algılama becerisine göndermeden önce bölmeniz gerekiyorsa Metin Bölme becerisini kullanabilirsiniz.

Skill parameters

Parametreler büyük/küçük harfe duyarlıdır.

Inputs Description
defaultCountryHint (İsteğe bağlı) Iso 3166-1 alfa-2 iki harfli ülke kodu, dili kesinleştirmediyse dil algılama modeline bir ipucu olarak kullanılabilir. Özellikle parametresi, defaultCountryHint girişi açıkça belirtmeyen countryHint belgelerle birlikte kullanılır.
modelVersion (İsteğe bağlı) Dil algılamayı çağırırken kullanılacak modelin sürümünü belirtir. Belirtilmediğinde varsayılan olarak en son kullanılabilir değeri kullanır. Gerekli olmadığı sürece bu değeri belirtmenizi öneririz.

Skill inputs

Parametreler büyük/küçük harfe duyarlıdır.

Inputs Description
text Analiz edilecek metin.
countryHint Dili kesinleştirme özelliğine sahip değilse dil algılama modeline ipucu olarak kullanılacak ISO 3166-1 alfa-2 iki harfli ülke kodu.

Skill outputs

Output Name Description
languageCode Tanımlanan dil için ISO 6391 dil kodu. Örneğin, "en".
languageName Dilin adı. Örneğin, "İngilizce".
score 0 ile 1 arasında bir değer. Dilin doğru şekilde tanımlanması olasılığı. Cümlede karışık diller varsa puan 1'den düşük olabilir.

Sample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Sample output

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

See also