مهارة معرفية للكشف عن اللغة

تكتشف مهارة الكشف عن اللغة لغة نص الإدخال وتقارير رمز لغة واحدة لكل مستند يتم إرساله عند الطلب. يتم إقران تعليمة اللغة البرمجية مع درجة تشير إلى قوة التحليل. تستخدم هذه المهارة نماذج التعلم الآلي المتوفرة في Azure الذكاء الاصطناعي Language.

هذه الإمكانية مفيدة بشكل خاص عندما تحتاج إلى توفير لغة النص كمدخل لمهارات أخرى (على سبيل المثال، مهارة تحليل المشاعر أو مهارة تقسيم النص).

راجع اللغات المعتمدة للكشف عن اللغة. إذا كان لديك محتوى تم التعبير عنه بلغة غير معتمدة، فإن الاستجابة هي (Unknown).

إشعار

ترتبط هذه المهارة بخدمات Azure الذكاء الاصطناعي وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الدفع حسب الاستخدام لخدمات Azure الذكاء الاصطناعي الحالية.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

حدود البيانات

يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما يتم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مهارة الكشف عن اللغة، يمكنك استخدام مهارة تقسيم النص.

معلمات المهارة

المعلمات حساسة لحالة الأحرف.

الإدخالات ‏‏الوصف
defaultCountryHint (اختياري) يمكن توفير رمز بلد ISO 3166-1 alpha-2 حرفين لاستخدامه كتلميح لنموذج الكشف عن اللغة إذا لم يتمكن من تبديد الغموض عن اللغة. على وجه التحديد، يتم استخدام المعلمة defaultCountryHint مع المستندات التي لا تحدد countryHint الإدخال بشكل صريح.
modelVersion (اختياري) يحدد إصدار النموذج الذي يجب استخدامه عند استدعاء الكشف عن اللغة. يتم تعيينه افتراضيا إلى الأحدث المتوفر عند عدم تحديده. نوصي بعدم تحديد هذه القيمة ما لم تكن ضرورية.

إدخالات المهارات

المعلمات حساسة لحالة الأحرف.

الإدخالات ‏‏الوصف
text النص المطلوب تحليله.
countryHint رمز بلد ISO 3166-1 alpha-2 حرفين لاستخدامه كتلميح لنموذج الكشف عن اللغة إذا لم يتمكن من توضيح اللغة.

إخراجات المهارات

اسم الإخراج ‏‏الوصف
languageCode رمز اللغة ISO 6391 للغة المحددة. على سبيل المثال، "en".
languageName اسم اللغة. على سبيل المثال، "الإنجليزية".
score قيمة بين 0 و1. احتمالية تحديد اللغة بشكل صحيح. يمكن أن تكون النتيجة أقل من 1 إذا كانت الجملة تحتوي على لغات مختلطة.

تعريف العينة

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

عينة الإدخال

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

عينة الإخراج

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

(راجع أيضًا )