المهارة المعرفية للتعرف على الكيان المسماة (v2)

تستخرج مهارة التعرف على الكيان المسمى (v2) الكيانات المسماة من النص. تتضمن الكيانات المتوفرة الأنواع personوlocation.organization

هام

تم الآن إيقاف مهارة التعرف على الكيان المسماة (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) محلها Microsoft.Skills.Text.V3.EntityRecognitionSkill. اتبع التوصيات الواردة في مهارات البحث في Azure الذكاء الاصطناعي المهملة للترحيل إلى مهارة مدعومة.

إشعار

أثناء توسيع النطاق عن طريق زيادة تكرار المعالجة أو إضافة المزيد من المستندات أو إضافة المزيد من خوارزميات الذكاء الاصطناعي، ستحتاج إلى إرفاق مورد خدمات Azure الذكاء الاصطناعي القابل للفوترة. تتراكم الرسوم عند استدعاء واجهات برمجة التطبيقات في خدمات Azure الذكاء الاصطناعي، واستخراج الصور كجزء من مرحلة تكسير المستندات في Azure الذكاء الاصطناعي Search. لا توجد رسوم لاستخراج النص من المستندات. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الدفع حسب الاستخدام لخدمات Azure الذكاء الاصطناعي الحالية.

استخراج الصور هو رسوم إضافية تم قياسها بواسطة Azure الذكاء الاصطناعي Search، كما هو موضح في صفحة التسعير. استخراج النص مجاني.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

حدود البيانات

يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما يتم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مستخرج العبارة الرئيسية، ففكر في استخدام مهارة تقسيم النص. إذا كنت تستخدم مهارة تقسيم النص، فقم بتعيين طول الصفحة إلى 5000 للحصول على أفضل أداء.

معلمات المهارة

المعلمات حساسة لحالة الأحرف.

اسم المعلمة ‏‏الوصف
categories صفيف من الفئات التي يجب استخراجها. أنواع الفئات المحتملة: "Person"، ، "Location". "Organization" إذا لم يتم توفير أي فئة، يتم إرجاع جميع الأنواع.
رمز Language الافتراضي رمز اللغة لنص الإدخال. يتم دعم اللغات التالية: de, en, es, fr, it
الحد الأدنى للاقصاء رقم بين 0 و1. إذا كانت الدقة أقل من هذه القيمة، فلن يتم إرجاع الكيان. الافتراضي هو 0.

إدخالات المهارات

اسم الإدخال ‏‏الوصف
languageCode اختياري. القيمة الافتراضية هي "en".
النص النص المراد تحليله.

إخراجات المهارات

اسم الإخراج ‏‏الوصف
الاشخاص صفيف من السلاسل حيث تمثل كل سلسلة اسم شخص.
المواقع صفيف من السلاسل حيث تمثل كل سلسلة موقعا.
organizations صفيف من السلاسل حيث تمثل كل سلسلة مؤسسة.
الكيانات صفيف من الأنواع المعقدة. يتضمن كل نوع معقد الحقول التالية:
  • الفئة ("person"أو "organization"أو "location")
  • القيمة (اسم الكيان الفعلي)
  • إزاحة (الموقع حيث تم العثور عليه في النص)
  • الثقة (قيمة بين 0 و1 تمثل تلك الثقة في أن القيمة كيان فعلي)

تعريف العينة

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

عينة الإدخال

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

عينة الإخراج

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

حالات التحذير

إذا كان رمز اللغة للمستند غير مدعوم، يتم إرجاع تحذير ولا يتم استخراج أي كيانات.

(راجع أيضًا )