إنشاء مشروع تصنيف نص مخصص

استخدم هذه المقالة لمعرفة كيفية إعداد متطلبات البدء بتصنيف النص المخصص وإنشاء مشروع.

المتطلبات الأساسية

قبل البدء في استخدام تصنيف النص المخصص، ستحتاج إلى:

إنشاء مورد Language

قبل البدء في استخدام تصنيف النص المخصص، ستحتاج إلى مورد Azure الذكاء الاصطناعي Language. يوصى بإنشاء مورد اللغة وتوصيله بحساب تخزين في مدخل Microsoft Azure. يتيح لك إنشاء مورد في مدخل Microsoft Azure إنشاء حساب تخزين Azure في نفس الوقت، مع جميع الأذونات المطلوبة التي تم تكوينها مسبقاً. يمكنك أيضاً قراءة المزيد في المقالة لمعرفة كيفية استخدام مورد موجود مسبقاً، وتكوينه للعمل مع التعرف على الكيان المسمى المخصص.

ستحتاج أيضاً إلى حساب تخزين Azure حيث ستقوم بتحميل .txt مستنداتك التي سيتم استخدامها لتدريب نموذج لتصنيف النص.

إشعار

  • تحتاج إلى تعيين دور مالك في مجموعة الموارد لإنشاء مورد لغة.
  • إذا كنت ستقوم بتوصيل حساب تخزين موجود مسبقاً، فيجب أن يكون لديك دور مالك معين له.

إنشاء مورد اللغة والاتصال بحساب التخزين

إشعار

يجب ألا يتم نقل حساب التخزين إلى مجموعة موارد أو اشتراك مختلف بمجرد ربطه بمورد لغة.

إنشاء مورد جديد من مدخل Microsoft Azure

  1. انتقل إلى مدخل Microsoft Azure لإنشاء مورد Azure الذكاء الاصطناعي Language جديد.

  2. في النافذة التي تظهر، حدد تصنيف النص المخصص والتعرف على الكيان المسمى المخصص من الميزات المخصصة. حدد متابعة لإنشاء المورد الخاص بك في أسفل الشاشة.

    A screenshot showing the selection option for custom text classification and custom named entity recognition in Azure portal.

  3. إنشاء مورد لغة بالتفاصيل التالية.

    الاسم القيمة المطلوبة
    الوصف اشتراك Azure الخاص بك.
    مجموعة الموارد مجموعة موارد التي ستحتوي على موردك. يمكنك استخدام مفتاح موجود، أو إنشاء مفتاح جديد.
    المنطقة إحدى المناطق المدعومة. على سبيل المثال، "غرب الولايات المتحدة 2".
    الاسم اسم لموردك.
    مستوى الأسعار أحد مستويات الأسعار المدعومة. يمكنك استخدام المستوى المجاني (F0) لتجربة الخدمة.

    إذا تلقيت رسالة تقول "الحساب الذي تستخدمه لتسجيل الدخول ليس مالكا لمجموعة موارد حساب التخزين المحدد"، فحسابك يحتاج إلى التمتع بدور مالك مُعيَّن على مجموعة الموارد قبل أن تتمكن من إنشاء مورد لغة. اتصل بمالك اشتراكك في Azure للحصول على المساعدة.

    يمكنك تحديد مالك اشتراك Azure الخاص بك عن طريق البحث في مجموعة الموارد الخاصة بك واتباع الارتباط إلى الاشتراك المقترن به. ثم:

    1. حدد علامة التبويب Access Control (IAM)
    2. تحديد تعيينات الدور
    3. تصفية حسب الدور:المالك.
  4. في قسم تصنيف النص المخصص والتعرف على الكيان المسمى المخصص، حدد حساب تخزين موجود أو حدد حساب تخزين جديد. لاحظ أن هذه القيم تساعدك على البدء، وليس بالضرورة قيم حساب التخزين التي تريد استخدامها في بيئات الإنتاج. لتجنب التأخير أثناء إنشاء مشروعك، اتصل بحسابات التخزين في نفس المنطقة مثل مورد اللغة الخاص بك.

    قيمة حساب التخزين القيمة الموصى بها
    Storage account name أي اسم
    نوع حساب التخزين التخزين القياسي المتكرر محلياً
  5. تأكد من تحديد إشعار الذكاء الاصطناعي المسؤول. حدد مراجعة + إنشاء عند أسفل الصفحة.

إشعار

  • عملية توصيل حساب تخزين بمورد اللغة الخاص بك لا رجعة فيها، ولا يمكن قطع الاتصال بها لاحقاً.
  • يمكنك فقط توصيل مورد اللغة بحساب تخزين واحد.

استخدام مورد Language موجود مسبقاً

المتطلبات الوصف
المناطق تأكد من توفير المورد الحالي في إحدى المناطق المدعومة. إذا لم يكن لديك مورد، فستحتاج إلى إنشاء مورد جديد في منطقة مدعومة.
مستوى الأسعار مستوى التسعير للمورد الخاص بك.
الهوية المُدارة تأكد من تمكين إعداد الهوية المدارة للمورد. وإلا، اقرأ المقطع التالي.

لاستخدام التعرف على الكيان المسمى المخصص، ستحتاج إلى إنشاء حساب تخزين Azure إذا لم يكن لديك حساب بالفعل.

تمكين إدارة الهوية لموردك

يجب أن يكون لمورد اللغة إدارة الهوية، لتمكينه باستخدام مدخل Microsoft Azure:

  1. حدد مورد اللغة
  2. من القائمة اليسرى، ضمن قسم Resource Management، حدد Identity
  3. من علامة التبويب System assigned، تأكد من تعيين Status إلى On

تمكين ميزة تصنيف النص المخصص

تأكد من تمكين ميزة تصنيف النص المخصص/التعرف على رموز الأحرف المخصص من مدخل Microsoft Azure.

  1. انتقل إلى مورد اللغة في مدخل Microsoft Azure
  2. من القائمة اليسرى، ضمن قسم Resource Management، حدد Features
  3. تمكين تصنيف النص المخصص / ميزة التعرف على رموز الأحرف المخصص
  4. الاتصال إلى حساب التخزين الخاص بك
  5. حدد تطبيق

هام

  • تأكد من أن مورد اللغة الخاص بك لديه دور مساهم تخزين بيانات ثنائية كبيرة الحجم المعين على حساب التخزين الذي تقوم بتوصيله.

تعيين أدوار لمورد Azure الذكاء الاصطناعي Language وحساب التخزين

استخدم الخطوات التالية لتعيين الأدوار المطلوبة لمورد اللغة وحساب التخزين.

An animated image showing how to set roles in the Azure portal.

أدوار مورد لغة الذكاء الاصطناعي Azure

  1. انتقل إلى حساب التخزين أو مورد اللغة في مدخل Azure.

  2. حدد التحكم في الوصول (IAM) من قائمة التنقل اليسرى.

  3. حدد AddلـAdd Role Assignments، واختر الدور المناسب لحسابك.

    يجب أن يكون لديك دور المالك أو المساهم المعين على مورد اللغة.

  4. بالنسبة إلى Assign access to، حدد User, group, or service principal

  5. حدد Select members

  6. حدد اسم المستخدم الخاص بك. يمكنك البحث عن أسماء المستخدمين في الحقل Select. كرر هذا الإجراء لجميع الأدوار.

  7. كرر هذه الخطوات لجميع حسابات المستخدمين التي تحتاج إلى الوصول إلى هذا المورد.

أدوار حساب التخزين الخاص بك

  1. انتقل إلى صفحة حساب التخزين في مدخل Azure.
  2. حدد التحكم في الوصول (IAM) من قائمة التنقل اليسرى.
  3. حدد AddلـAdd Role Assignments، واختر دور Storage blob data contributor على حساب التخزين.
  4. ضمن تعيين الوصول إلى، حدد Managed identity.
  5. حدد Select members
  6. حدد اشتراكك، واللغة كهوية مدارة. يمكنك البحث عن أسماء المستخدمين في الحقل Select.

هام

إذا كان لديك شبكة ظاهرية أو نقطة نهاية خاصة، فتأكد من تحديد السماح لخدمات Azure في قائمة الخدمات الموثوق بها بالوصول إلى حساب التخزين هذا في مدخل Microsoft Azure.

تمكين CORS لحساب التخزين الخاص بك

تأكد من السماح بأساليب (GET، PUT، DELETE) عند تمكين مشاركة الموارد عبر المنشأ (CORS). تعيين حقل الأصول المسموح به إلى https://language.cognitive.azure.com. اسمح لجميع العناوين بإضافة * إلى قيم العنوان المسموح بها، ثم قم بتعيين الحد الأقصى للعمر إلى 500.

A screenshot showing how to use CORS for storage accounts.

إنشاء مشروع تصنيف نص مخصص

بمجرد تكوين الموارد وحاوية التخزين، أنشئ مشروع تصنيف نص مخصص جديد. يُعد المشروع بمثابة منطقة عمل لبناء نماذج الذكاء الاصطناعي المخصصة بناءً على بياناتك. لا يمكن الوصول إلى مشروعك إلا بواسطتك أنت والآخرين الذين لديهم حق الوصول إلى مورد Azure الجاري استخدامه. إذا كنت قد قمت بتسمية البيانات، يمكنك استيرادها للبدء.

  1. تسجيل الدخول إلى Language Studio. ستظهر نافذة تتيح لك تحديد الاشتراك ومورد اللغة. حدد مورد اللغة.

  2. ضمن قسم Classify text في Language Studio، حدد Custom text classification.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. حدد إنشاء مشروع جديد من القائمة العليا في صفحة مشاريعك. سوف يسمح لك إنشاء المشروع بتسمية البيانات وتدريبها وتقييمها وتحسينها وتوزيع النماذج الخاصة بك.

    A screenshot of the custom text classification project creation page.

  4. بعد النقر فوق Create new project، ستظهر نافذة تتيح لك توصيل حساب التخزين الخاص بك. إذا قمت بالفعل بتوصيل حساب تخزين، فسترى حساب التخزين متصلاً. إذا لم يكن الأمر كما هو، فاختر حساب التخزين الخاص بك من القائمة المنسدلة التي تظهر وحدد الاتصال حساب التخزين؛ سيؤدي ذلك إلى تعيين الأدوار المطلوبة لحساب التخزين الخاص بك. من المحتمل أن ترجع هذه الخطوة خطأ إذا لم يتم تعيينك كمالك في حساب التخزين.

    إشعار

    • تحتاج فقط إلى القيام بهذه الخطوة مرة واحدة لكل مورد لغة جديد تستخدمه.
    • هذه العملية لا رجعة فيها، إذا قمت بتوصيل حساب تخزين إلى مورد اللغة الخاص بك فلن تتمكن من قطع الاتصال لاحقاً.
    • يمكنك فقط توصيل مورد اللغة بحساب تخزين واحد.

    A screenshot of the storage connection screen for custom classification projects.

  5. حدد نوع المشروع. يمكنك إما إنشاء مشروع تصنيف متعدد التسميات حيث يمكن أن ينتمي كل مستند إلى فئة واحدة أو أكثر أو مشروع تصنيف ذي تسمية واحدة حيث يمكن أن ينتمي كل مستند إلى فئة واحدة فقط. لا يمكن تغيير النوع المحدد لاحقاً. تعرف على المزيد عن أنواع المشاريع

    A screenshot of the available custom classification project types.

  6. أدخل معلومات المشروع، بما في ذلك الاسم والوصف ولغة المستندات في المشروع الخاص بك. إذا كنت تستخدم مجموعة البيانات المثال، فحدد English. لن تتمكن من تغيير اسم مشروعك لاحقاً. حدد التالي.

    تلميح

    لا يجب أن تكون مجموعة البيانات الخاصة بك كلها بنفس اللغة. يمكن أن يكون لديك مستندات متعددة، لكل منها لغات مدعومة مختلفة. إذا كانت مجموعة البيانات الخاصة بك تحتوي على مستندات بلغات مختلفة أو إذا كنت تتوقع نصاً من لغات مختلفة أثناء وقت التشغيل، فقم بتحديد الخيار enable multi-lingual dataset عند إدخال المعلومات الأساسية لمشروعك. يمكن تمكين هذا الخيار لاحقاً من صفحة Project settings.

  7. قم بتحديد الحاوية التي قمت بتحميل مجموعة البيانات فيها.

    إذا كنت تستخدم إحدى مجموعات البيانات المثال، فاستخدم الملف المضمن webOfScience_labelsFile أو movieLabels json. بعد ذلك حدد التالي.

  8. راجع البيانات التي أدخلتها وحدد إنشاء مشروع.

إنشاء مشروع تصنيف نص مخصص

إذا كنت قد قمت بالفعل بتسمية البيانات، يمكنك استخدامها لبدء استخدام الخدمة. تأكد من أن البيانات المسماة تتبع تنسيقات البيانات المقبولة.

  1. تسجيل الدخول إلى Language Studio. ستظهر نافذة تتيح لك تحديد الاشتراك ومورد اللغة. حدد مورد اللغة.

  2. ضمن قسم Classify text في Language Studio، حدد Custom text classification.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. حدد إنشاء مشروع جديد من القائمة العليا في صفحة مشاريعك. سوف يسمح لك إنشاء المشروع بتسمية البيانات وتدريبها وتقييمها وتحسينها وتوزيع النماذج الخاصة بك.

    A screenshot of the project creation page.

  4. بعد النقر فوق Create new project، ستظهر شاشة تتيح لك الاتصال بحساب التخزين الخاص بك. إذا لم تتمكن من العثور على حساب التخزين، فتأكد من إنشاء مورد باستخدام الخطوات المذكورة أعلاه. إذا قمت بالفعل بتوصيل حساب تخزين بمورد اللغة الخاص بك، فسترى حساب التخزين الخاص بك متصلاً.

    إشعار

    • تحتاج فقط إلى القيام بهذه الخطوة مرة واحدة لكل مورد لغة جديد تستخدمه.
    • هذه العملية لا رجعة فيها، إذا قمت بتوصيل حساب تخزين إلى مورد اللغة الخاص بك فلن تتمكن من قطع الاتصال لاحقاً.
    • يمكنك فقط توصيل مورد اللغة بحساب تخزين واحد.

    A screenshot of the storage connection screen for custom classification projects.

  5. حدد نوع المشروع. يمكنك إما إنشاء مشروع تصنيف متعدد التسميات حيث يمكن أن ينتمي كل مستند إلى فئة واحدة أو أكثر أو مشروع تصنيف ذي تسمية واحدة حيث يمكن أن ينتمي كل مستند إلى فئة واحدة فقط. لا يمكن تغيير النوع المحدد لاحقاً.

    A screenshot of the available custom classification project types.

  6. أدخل معلومات المشروع، بما في ذلك الاسم والوصف ولغة المستندات في المشروع الخاص بك. لن تتمكن من تغيير اسم مشروعك لاحقاً. حدد التالي.

    تلميح

    لا يجب أن تكون مجموعة البيانات الخاصة بك كلها بنفس اللغة. يمكن أن يكون لديك مستندات متعددة، لكل منها لغات مدعومة مختلفة. إذا كانت مجموعة البيانات الخاصة بك تحتوي على مستندات بلغات مختلفة أو إذا كنت تتوقع نصاً من لغات مختلفة أثناء وقت التشغيل، فقم بتحديد الخيار enable multi-lingual dataset عند إدخال المعلومات الأساسية لمشروعك. يمكن تمكين هذا الخيار لاحقاً من صفحة Project settings.

  7. قم بتحديد الحاوية التي قمت بتحميل مجموعة البيانات فيها.

  8. حدد نعم، تم تسمية مستنداتي بالفعل وقمت بتنسيق ملف تسميات JSON وحدد ملف التسميات من القائمة المنسدلة أدناه لاستيراد ملف تسميات JSON. تأكد من أنه يتبع التنسيق المدعوم.

  9. حدد التالي.

  10. راجع البيانات التي أدخلتها وحدد إنشاء مشروع.

الحصول على تفاصيل المشروع

  1. انتقل إلى صفحة مشروعك في صفحة استوديو اللغة.

  2. يمكنك مشاهدة تفاصيل المشروع.

  3. في هذه الصفحة، يمكنك تحديث وصف المشروع وتمكين/تعطيل مجموعة البيانات متعددة اللغات في إعدادات المشروع.

  4. يمكنك أيضاً عرض حساب التخزين المتصل والحاوية إلى مورد اللغة.

  5. يمكنك أيضاً استرداد مفتاح المورد الأساسي من هذه الصفحة.

    A screenshot of the project settings page.

حذف المشروع

عندما لا تحتاج إلى مشروعك بعد الآن، يمكنك حذف مشروعك باستخدام Language Studio. حدد تصنيف النص المخصص في الأعلى، ثم حدد المشروع الذي تريد حذفه. حدد حذف من القائمة العلوية لحذف المشروع.

الخطوات التالية

  • يجب أن تكون لديك فكرة عن مخطط المشروع الذي ستستخدمه لتسمية بياناتك.

  • بعد إنشاء مشروعك، يمكنك البدء في وضع علامات على بياناتك، والتي ستعلم نموذج استخراج الكيان الخاص بك بكيفية تفسير النص، ويتم استخدامه للتدريب والتقييم.