تحويل إلى قيم المؤشرات

توضح هذه المقالة أحد مكونات مصمم التعلم الآلي من Azure.

استخدم مكوّن التحويل إلى قيم المؤشر في مصمم التعلم الآلي من Microsoft Azure لتحويل الأعمدة التي تحتوي على قيم فئوية إلى سلسلة من أعمدة المؤشرات الثنائية.

تتيح عملية التحويل إلى قيم المؤشر تحويل البيانات الفئوية إلى قيم مؤشرات ممثلة بقيم ثنائية أو متعددة. هذه العملية هي واحدة من خطوات المعالجة المسبقة للبيانات التي غالبا ما تستخدم لنماذج التصنيف.

ينتج هذا المكوّن أيضًا تعريفًا للتحويل المستخدم للتحويل إلى قيم المؤشر. يمكنك إعادة استخدام هذا التحويل على مجموعات البيانات الأخرى التي لها نفس المخطط، عن طريق استخدام مكوّن تحويل التطبيق.

كيفية تكوين التحويل إلى قيم المؤشر

  1. ابحث عن التحويل إلى قيم المؤشر واسحبه إلى مسودة مسار المعالجة. يمكنك العثور على هذا المكوّن في فئة تحويل البيانات.

    إشعار

    بإمكانك استخدام مكوّن تحرير بيانات التعريف قبل مكوّن التحويل إلى قيم المؤشر لوضع علامة على العمود (الأعمدة) الهدف على أنه فئوي.

  2. وصّل مكوّن التحويل إلى قيم المؤشر بمجموعة البيانات التي تحتوي على الأعمدة التي تريد تحويلها.

  3. حدد تحرير العمود لاختيار عمود واحد أو أكثر من الأعمدة الفئوية.

  4. حدد الخيار الكتابة فوق الأعمدة الفئوية إذا كنت تريد إخراج الأعمدة المنطقية الجديدة فقط. بشكل افتراضي، يكون هذا الخيار متوقف عن التشغيل.

    تلميح

    إذا اخترت خيار الكتابة فوق، فلن يتم حذف عمود المصدر أو تعديله بالفعل. بدلاً من ذلك، يتم إنشاء الأعمدة الجديدة وتقديمها في مجموعة بيانات الإخراج، ويظل عمود المصدر متاحًا في مساحة العمل. إذا كنت بحاجة إلى رؤية البيانات الأصلية، يمكنك استخدام مكوّن إضافة الأعمدة في أي وقت لإضافة عمود المصدر مرة أخرى.

  5. إرسال البنية الأساسية.

النتائج

لنفترض أن لديك عمودًا يحتوي على درجات تشير إلى ما إذا كان لدى الخادم احتمالية عالية أو متوسطة أو منخفضة للفشل.

المعرّف الخاص بالخادم درجة الفشل
10301 منخفض
10302 متوسط
10303 درجة عالية

عند تطبيق التحويل إلى قيم المؤشر، يحول المصمم عمودًا واحدًا من التسميات إلى أعمدة متعددة تحتوي على قيم منطقية:

المعرّف الخاص بالخادم درجة الفشل - منخفضة درجة الفشل - متوسطة درجة الفشل - عالية
10301 1 1 1
10302 0 1 0
10303 1 1 1

إليك كيفية عمل التحويل:

  • في عمود درجة الفشل الذي يصف المخاطر، هناك ثلاث قيم ممكنة فقط (عالية ومتوسطة ومنخفضة)، ولا توجد قيم مفقودة. لذلك، تم إنشاء ثلاثة أعمدة جديدة بالضبط.

  • تسمي أعمدة المؤشر الجديدة استنادًا إلى عناوين الأعمدة وقيم عمود المصدر، باستخدام هذا النمط: <عمود المصدر>- <قيمة البيانات>.

  • يجب أن يكون هناك 1 في عمود مؤشر واحد بالضبط، و0 في جميع أعمدة المؤشر الأخرى حيث يمكن أن يكون لكل خادم تصنيف مخاطر واحد فقط.

بإمكانك الآن استخدام أعمدة المؤشرات الثلاثة كميزات في نموذج التعلم الآلي.

يُرجع المكوّن ناتجين:

  • مجموعة بيانات النتائج: مجموعة بيانات مع أعمدة قيم المؤشر المحولة. الأعمدة التي لم يتم تحديدها للتنظيف «تمرر» أيضًا.
  • تحويل قيم المؤشر: تحويل بيانات يستخدم للتحويل إلى قيم المؤشر، والتي يمكن حفظها في مساحة العمل وتطبيقها على البيانات الجديدة لاحقًا.

تطبيق عملية قيم المؤشر المحفوظة على البيانات الجديدة

إذا كنت بحاجة إلى تكرار عمليات قيم المؤشر في كثير من الأحيان، بإمكانك حفظ خطوات معالجة البيانات كتحويل لإعادة استخدامها مع نفس مجموعة البيانات. يُعد هذا مفيدًا إذا كان يجب عليك إعادة استيراد البيانات التي لها نفس المخطط ثم تنظيفها بشكل متكرر.

  1. أضف مكون تطبيق التحويل إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاص بك.

  2. أضف مجموعة البيانات التي تريد تنظيفها، ثم قم بتوصيل مجموعة البيانات بمنفذ الإدخال الأيمن.

  3. وسع مجموعة تحويل البيانات في الجزء الأيمن من المصمم. حدد موقع التحويل المحفوظ واسحبه إلى مسار المعالجة.

  4. وصل التحويل المحفوظ بمنفذ الإدخال الأيمن لتحويل التطبيق.

    عند تطبيق تحويل محفوظ، لا يمكنك تحديد الأعمدة المراد تحويلها. وذلك لأنه تم تعريف التحويل وتطبيقه تلقائيًا على أنواع البيانات المحددة في العملية الأصلية.

  5. إرسال البنية الأساسية.

الملاحظات التقنية

يحتوي هذا القسم على تفاصيل التنفيذ ونصائح وإجابات عن الأسئلة المتداولة.

نصائح الاستخدام

  • يمكن فقط تحويل الأعمدة التي ميزت على أنها فئوية إلى أعمدة مؤشرات. إذا رأيت الخطأ الموضح أدناه، فمن المحتمل أن أحد الأعمدة التي حددتها ليس فئويًا:

    خطأ 0056: العمود الذي يحمل <اسم العمود> ليس في فئة مسموح بها.

    بشكل افتراضي، تعالج معظم أعمدة السلسلة كميزات سلسلة، لذلك يجب وضع علامة عليها بشكل صريح على أنها فئوية باستخدام تحرير بيانات التعريف.

  • لا يوجد حد لعدد الأعمدة التي بإمكانك تحويلها إلى أعمدة المؤشر. ومع ذلك، نظرًا إلى أن كل عمود من القيم يمكن أن ينتج عنه أعمدة مؤشرات متعددة، فإنه يمكن أن ترغب في تحويل ومراجعة بضعة أعمدة فقط في كل مرة.

  • إذا كان العمود يحتوي على قيم مفقودة، يتم إنشاء عمود مؤشر منفصل للفئة المفقودة، بهذا الاسم: <عمود المصدر>- مفقود

  • إذا كان العمود الذي تقوم بتحويله إلى قيم المؤشر يشتمل على أرقام، فإنه يجب وضع علامة عليه على أنه فئوي مثل أي عمود ميزة آخر. بعد بذلك، يتم التعامل مع الأرقام كقيم منفصلة. على سبيل المثال، إذا كان لديك عمود رقمي بقيم MPG تتراوح بين 25 و30، فسيتم إنشاء عمود مؤشر جديد لكل قيمة منفصلة:

    الإنشاء طريق سريع mpg -25 طريق سريع mpg -26 طريق سريع mpg -27 طريق سريع mpg -28 طريق سريع mpg -29 طريق سريع mpg -30
    سيارات كونتوسو 1 0 0 0 1 1
  • لتجنب إضافة أبعاد كثيرة جدًا إلى مجموعة بياناتك. نوصي بأن تتحقق أولاً من عدد القيم في العمود، وتخزين البيانات أو تحديدها بشكل مناسب.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.