ما هو التعرف على رموز الأحرف المخصصة؟

NER المخصص هو أحد الميزات المخصصة التي تقدمها Azure الذكاء الاصطناعي Language. وهي خدمة API مستندة إلى السحابة تطبق ذكاء التعلم الآلي لتمكينك من إنشاء نماذج مخصصة لمهام التعرُّف على الكيان المسمى المخصص.

يُمكّن التعرُّف على الكيان المسمى المخصص المستخدمين من إنشاء نماذج الذكاء الاصطناعي المخصصة لاستخراج كيانات خاصة بالمجال من نص غير منظم، مثل العقود أو المستندات المالية. من خلال إنشاء مشروع Custom NER، يمكن للمطورين تسمية البيانات بشكل متكرر وتدريب وتقييم أداء النموذج وتحسينه قبل إتاحته للاستهلاك. تؤثّر جودة البيانات المسماة بشدة على أداء النموذج. لتبسيط بناء وتخصيص النموذج الخاص بك، تقدم الخدمة بوابة ويب مخصصة يمكن الوصول إليها من خلال أستوديو اللغة. يمكنك بسهولة البدء في الخدمة باتباع الخطوات الواردة في التشغيل السريعة.

تحتوي هذه الوثائق على أنواع المقالات التالية:

  • التشغيل السريع ويتضمن تعليمات البدء لإرشادك خلال تقديم الطلبات إلى الخدمة.
  • توفر المفاهيم التفسيرات المتعلقة بوظائف الخدمة وميزاتها.
  • تحتوي الأدلة الإرشادية على إرشادات استخدام الخدمة بطرق محددة ومخصصة.

مثال على سيناريوهات الاستخدام

يمكن استخدام التعرُّف على الكيان المسمى المخصص في سيناريوهات متعددة عبر مجموعة متنوعة من الصناعات:

استخراج المعلومات

تقوم العديد من المنظمات المالية والقانونية باستخراج وتطبيع البيانات من آلاف المصادر النصية المعقدة غير المنظمة على أساس يومي. وتشمل هذه المصادر البيانات المصرفية أو الاتفاقيات القانونية أو النماذج المصرفية. على سبيل المثال، قد يستغرق استخراج بيانات تطبيق الرهن العقاري الذي يتم إجراؤه يدوياً بواسطة المراجعين البشريين عدة أيام. تعمل أتمتة هذه الخطوات من خلال إنشاء نموذج NER مخصص على تبسيط العملية وتوفير التكلفة والوقت والجهد.

يُعد البحث أساسياً لأي تطبيق يعرض محتوى نصي للمستخدمين. تتضمن السيناريوهات الشائعة البحث في الكتالوج أو المستند أو البحث عن منتجات البيع بالتجزئة أو استخراج المعرفة لعلوم البيانات. تتطلع العديد من المؤسسات عبر مختلف الصناعات إلى بناء تجربة بحث ثرية على محتوى خاص غير متجانس، والذي يتضمن كلاً من المستندات المنظمة وغير المنظمة. كجزء من التدفقات الخاصة بهم، يمكن للمطورين استخدام NER المخصص لاستخراج الكيانات ذات الصلة بصناعتها من النص. يمكن استخدام هذه الكيانات لإثراء فهرسة الملف للحصول على تجربة بحث أكثر تخصيصاً.

التدقيق والامتثال

بدلاً من مراجعة الملفات النصية الطويلة يدوياً لتدقيق النُهج وتطبيقها، يمكن لأقسام تكنولوجيا المعلومات في المؤسسات المالية أو القانونية استخدام NER المخصص لإنشاء حلول تلقائية. تساعد هذه الحلول في فرض سياسات الامتثال، وإعداد قواعد العمل الضرورية استناداً إلى تدفقات الاستخراج المعرفي التي تعالج المحتويات المنظمة وغير المنظمة.

دورة حياة تطوير المشروع

يتضمن استخدام NER المخصص عادةً عدة خطوات مختلفة.

دورة حياة التطوير

  1. تعريف مخططك: تعرَّف على بياناتك وحدد الكيانات التي تريد استخراجها. تجنب الغموض.

  2. قم بتسمية بياناتك: تعد تسمية البيانات عاملاً رئيسيًا في تحديد أداء النموذج. قم بالتسمية بدقة وثبات وكمال.

    1. التسمية بدقة: تسمية كل كيان لتحديد نوعه الصحيح دائماً. قم بتضمين ما تريد استخراجه فقط، وتجنب البيانات غير الضرورية في المسميات الخاصة بك.
    2. التسمية باستمرار: يجب أن يكون لنفس الكيان نفس المسمى عبر جميع الملفات.
    3. التسمية الكاملة: تسمية جميع مثيلات الكيان في جميع ملفاتك.
  3. تدريب النموذج: يبدأ نموذجك في التعلم من بياناتك المسماة.

  4. عرض أداء النموذج: بعد الانتهاء من التدريب، اطلع على تفاصيل تقييم النموذج وأدائه والإرشادات حول كيفية تحسينه.

  5. توزيع النموذج: توزيع النموذج يجعله متاحاً للاستخدام عبر Analyze API.

  6. استخراج الكيانات: استخدام النماذج المخصصة لمهام استخراج الكيان.

الوثائق المرجعية وعينات التعليمات البرمجية

أثناء استخدام NER المخصص، راجع الوثائق المرجعية والعينات التالية ل Azure الذكاء الاصطناعي Language:

لغة / خيار التطوير الوثائق المرجعية عينات
واجهات برمجة تطبيقات REST (عملية الإنشاء) وثائق REST API
واجهات برمجة تطبيقات REST (وقت التشغيل) وثائق REST API
C# (وقت التشغيل) وثائق C#‎ عينات C#‎
Java (وقت تشغيل) وثائق Java نماذج Java
JavaScript (وقت التشغيل) وثائق JavaScript نماذج JavaScript
Python (وقت التشغيل) وثائق Python عينات Python

الذكاء الاصطناعي المسؤول

لا يشمل نظام الذكاء الاصطناعي التكنولوجيا فحسب، بل يشمل أيضًا الأشخاص الذين سيستخدمونها، والأشخاص الذين سيتأثرون بها، والبيئة التي تُنشر فيها. اقرأ ملاحظة الشفافية حول NER المخصص للتعرُّف على استخدام الذكاء الاصطناعي المسؤول وعملية التوزيع في أنظمتك. يمكنك أيضا مشاهدة المقالات التالية للحصول على مزيد من المعلومات:

الخطوات التالية