مهارة معرفية لربط الكيان (v3)
تقوم مهارة Entity Linking (v3) بإرجاع قائمة بالكيانات المعترف بها مع ارتباطات إلى مقالات في قاعدة المعارف (KB) معروفة (ويكيبيديا).
إشعار
ترتبط هذه المهارة بنماذج التعلم الآلي لربط الكيان في Azure الذكاء الاصطناعي Language وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الدفع حسب الاستخدام لخدمات Azure الذكاء الاصطناعي الحالية.
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
حدود البيانات
يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما يتم قياسه بواسطة String.Length
. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مهارة EntityLinking، ففكر في استخدام مهارة تقسيم النص. إذا كنت تستخدم مهارة تقسيم النص، فقم بتعيين طول الصفحة إلى 5000 للحصول على أفضل أداء.
معلمات المهارة
أسماء المعلمات حساسة لحالة الأحرف وجميعها اختيارية.
اسم المعلمة | الوصف |
---|---|
defaultLanguageCode |
رمز اللغة لنص الإدخال. إذا لم يتم تحديد التعليمة البرمجية للغة الافتراضية، فسيتم استخدام اللغة الإنجليزية (en) بوصفها التعليمة البرمجية للغة الافتراضية. راجع القائمة الكاملة للغات المدعومة. |
minimumPrecision |
قيمة بين 0 و1. إذا كانت درجة الثقة (في entities الإخراج) أقل من هذه القيمة، فلن يتم إرجاع الكيان. الافتراضي هو 0. |
modelVersion |
(اختياري) يحدد إصدار النموذج الذي يجب استخدامه عند استدعاء ربط الكيان. سيتم تعيينه افتراضيا إلى الأحدث المتوفر عند عدم تحديده. نوصي بعدم تحديد هذه القيمة ما لم تكن ضرورية. |
إدخالات المهارات
اسم الإدخال | الوصف |
---|---|
languageCode |
سلسلة تشير إلى لغة السجلات. إذا لم يتم تحديد هذه المعلمة، فسيتم استخدام التعليمات البرمجية للغة الافتراضية لتحليل السجلات. راجع القائمة الكاملة للغات المدعومة. |
text |
النص المراد تحليله. |
إخراجات المهارات
اسم الإخراج | الوصف |
---|---|
entities |
صفيف من الأنواع المعقدة التي تحتوي على الحقول التالية:
|
تعريف العينة
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
عينة الإدخال
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
عينة الإخراج
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
يتم إرجاع الإزاحات التي تم إرجاعها للكيانات في إخراج هذه المهارة مباشرة من واجهات برمجة تطبيقات خدمة اللغة، مما يعني أنه إذا كنت تستخدمها للفهرسة في السلسلة الأصلية، يجب استخدام فئة StringInfo في .NET لاستخراج المحتوى الصحيح. لمزيد من المعلومات، راجع دعم اللغات المتعددة والرموز التعبيرية في ميزات خدمة اللغة.
حالات التحذير
إذا كان رمز اللغة للمستند غير مدعوم، يتم إرجاع تحذير ولا يتم استخراج أي كيانات.
(راجع أيضًا )
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ