مهارة معرفية لربط الكيان (v3)

تقوم مهارة Entity Linking (v3) بإرجاع قائمة بالكيانات المعترف بها مع ارتباطات إلى مقالات في قاعدة المعارف (KB) معروفة (ويكيبيديا).

إشعار

ترتبط هذه المهارة بنماذج التعلم الآلي لربط الكيان في Azure الذكاء الاصطناعي Language وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الدفع حسب الاستخدام لخدمات Azure الذكاء الاصطناعي الحالية.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

حدود البيانات

يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما يتم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مهارة EntityLinking، ففكر في استخدام مهارة تقسيم النص. إذا كنت تستخدم مهارة تقسيم النص، فقم بتعيين طول الصفحة إلى 5000 للحصول على أفضل أداء.

معلمات المهارة

أسماء المعلمات حساسة لحالة الأحرف وجميعها اختيارية.

اسم المعلمة ‏‏الوصف
defaultLanguageCode رمز اللغة لنص الإدخال. إذا لم يتم تحديد التعليمة البرمجية للغة الافتراضية، فسيتم استخدام اللغة الإنجليزية (en) بوصفها التعليمة البرمجية للغة الافتراضية.
راجع القائمة الكاملة للغات المدعومة.
minimumPrecision قيمة بين 0 و1. إذا كانت درجة الثقة (في entities الإخراج) أقل من هذه القيمة، فلن يتم إرجاع الكيان. الافتراضي هو 0.
modelVersion (اختياري) يحدد إصدار النموذج الذي يجب استخدامه عند استدعاء ربط الكيان. سيتم تعيينه افتراضيا إلى الأحدث المتوفر عند عدم تحديده. نوصي بعدم تحديد هذه القيمة ما لم تكن ضرورية.

إدخالات المهارات

اسم الإدخال ‏‏الوصف
languageCode سلسلة تشير إلى لغة السجلات. إذا لم يتم تحديد هذه المعلمة، فسيتم استخدام التعليمات البرمجية للغة الافتراضية لتحليل السجلات.
راجع القائمة الكاملة للغات المدعومة.
text النص المراد تحليله.

إخراجات المهارات

اسم الإخراج ‏‏الوصف
entities صفيف من الأنواع المعقدة التي تحتوي على الحقول التالية:
  • "name" (اسم الكيان الفعلي كما يظهر في النص)
  • "id"
  • "language" (لغة النص كما تحددها المهارة)
  • "url" (عنوان URL المرتبط بهذا الكيان)
  • "bingId" (bingId لهذا الكيان المرتبط)
  • "dataSource" (مصدر البيانات المقترن بعنوان url)
  • "matches"(صفيف من الأنواع المعقدة التي تحتوي على: textو offsetlength وconfidenceScore)

تعريف العينة

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

عينة الإدخال

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

عينة الإخراج

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

يتم إرجاع الإزاحات التي تم إرجاعها للكيانات في إخراج هذه المهارة مباشرة من واجهات برمجة تطبيقات خدمة اللغة، مما يعني أنه إذا كنت تستخدمها للفهرسة في السلسلة الأصلية، يجب استخدام فئة StringInfo في .NET لاستخراج المحتوى الصحيح. لمزيد من المعلومات، راجع دعم اللغات المتعددة والرموز التعبيرية في ميزات خدمة اللغة.

حالات التحذير

إذا كان رمز اللغة للمستند غير مدعوم، يتم إرجاع تحذير ولا يتم استخراج أي كيانات.

(راجع أيضًا )