Dil algılama bilişsel becerisi

Dil Algılama becerisi, giriş metninin dilini algılar ve istekte gönderilen her belge için tek bir dil kodu bildirir. Dil kodu, analizin gücünü gösteren bir puanla eşleştirilir. Bu beceri, Azure Yapay Zeka Dili'nde sağlanan makine öğrenmesi modellerini kullanır.

Bu özellik özellikle metnin dilini diğer becerilere giriş olarak sağlamanız gerektiğinde kullanışlıdır (örneğin, Yaklaşım Analizi becerisi veya Metin Bölme becerisi).

Bkz. Dil Algılama için desteklenen diller . Desteklenmeyen bir dilde ifade edilen içeriğiniz varsa, yanıt şeklindedir (Unknown).

Dekont

Bu beceri Azure AI hizmetlerine bağlıdır ve günlük dizin oluşturucu başına 20 belgeyi aşan işlemler için faturalanabilir bir kaynak gerektirir. Yerleşik becerilerin yürütülmesi, mevcut Azure AI hizmetlerinin kullandıkça öde fiyatından ücretlendirilir.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Veri sınırları

Kaydın boyut üst sınırı, tarafından String.Lengthölçülen 50.000 karakter olmalıdır. Verilerinizi dil algılama becerisine göndermeden önce bölmeniz gerekiyorsa Metin Bölme becerisini kullanabilirsiniz.

Beceri parametreleri

Parametreler büyük/küçük harfe duyarlıdır.

Girişler Tanım
defaultCountryHint (İsteğe bağlı) Iso 3166-1 alfa-2 iki harfli ülke kodu, dili kesinleştirmediyse dil algılama modeline bir ipucu olarak kullanılabilir. Özellikle parametresi, defaultCountryHint girişi açıkça belirtmeyen countryHint belgelerle birlikte kullanılır.
modelVersion (İsteğe bağlı) Dil algılamayı çağırırken kullanılacak modelin sürümünü belirtir. Belirtilmediğinde varsayılan olarak en son kullanılabilir değeri kullanır. Gerekli olmadığı sürece bu değeri belirtmenizi öneririz.

Beceri girişleri

Parametreler büyük/küçük harfe duyarlıdır.

Girişler Tanım
text Analiz edilecek metin.
countryHint Dili kesinleştirme özelliğine sahip değilse dil algılama modeline ipucu olarak kullanılacak ISO 3166-1 alfa-2 iki harfli ülke kodu.

Beceri çıkışları

Çıkış Adı Tanım
languageCode Tanımlanan dil için ISO 6391 dil kodu. Örneğin, "en".
languageName Dilin adı. Örneğin, "İngilizce".
score 0 ile 1 arasında bir değer. Dilin doğru şekilde tanımlanması olasılığı. Cümlede karışık diller varsa puan 1'den düşük olabilir.

Örnek tanım

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Örnek girdi

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Örnek çıktı

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Ayrıca bkz.