تحديد الأعمدة في مكون مجموعة البيانات

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لاختيار مجموعة فرعية من الأعمدة لاستخدامها في عمليات انتقال البيانات من الخادم. لا يزيل المكون الأعمدة فعلياً من مجموعة البيانات المصدر؛ بدلاً من ذلك، يقوم بإنشاء مجموعة فرعية من الأعمدة، مثل view أو projection لقاعدة البيانات.

يعد هذا المكون مفيداً عندما تحتاج إلى تقييد الأعمدة المتاحة لعملية المصب، أو إذا كنت تريد تقليل حجم مجموعة البيانات عن طريق إزالة الأعمدة غير الضرورية.

يتم إخراج الأعمدة في مجموعة البيانات بنفس الترتيب كما في البيانات الأصلية، حتى إذا حددتها بترتيب مختلف.

كيفية الاستخدام

هذا المكون ليست له معلمات. يمكنك استخدام محدد العمود لاختيار الأعمدة المراد تضمينها أو استبعادها.

اختر الأعمدة بالاسم

توجد خيارات متعددة في المكون لاختيار الأعمدة بالاسم:

  • التصفية والبحث

    انقر فوق الخيار BY NAME.

    إذا قمت بتوصيل مجموعة بيانات تم ملؤها بالفعل، يجب أن تظهر قائمة بالأعمدة المتاحة. إذا لم تظهر أي أعمدة، فقد تحتاج إلى تشغيل مكونات أولية لعرض قائمة الأعمدة.

    لتصفية القائمة، اكتب في مربع البحث. على سبيل المثال، إذا قمت بكتابة الحرف w في مربع البحث، تتم تصفية القائمة لإظهار أسماء الأعمدة التي تحتوي على الحرف w.

    حدد الأعمدة وانقر فوق زر السهم الأيمن لنقل الأعمدة المحددة إلى القائمة في الجزء الأيمن.

    • لتحديد نطاق مستمر لأسماء الأعمدة، اضغط على Shift + Click.
    • لإضافة أعمدة فردية إلى التحديد، اضغط على Ctrl + Click.

    انقر فوق زر علامة الاختيار للحفظ والإغلاق.

  • استخدم الأسماء مع القواعد الأخرى

    انقر فوق الخيار WITH RULES.

    اختر قاعدة، مثل إظهار أعمدة من نوع بيانات معين.

    ثم انقر فوق الأعمدة الفردية من هذا النوع حسب الاسم لإضافتها إلى قائمة الاختيار.

  • اكتب أو الصق قائمة بأسماء الأعمدة مفصولة بفواصل

    إذا كانت مجموعة البيانات الخاصة بك واسعة، فقد يكون من الأسهل استخدام الفهارس أو قوائم الأسماء المُنشأة، بدلاً من تحديد الأعمدة بشكل فردي. بافتراض أنك قد أعددت القائمة مسبقاً:

    1. انقر فوق الخيار WITH RULES.
    2. حدد No columns، وحدد Include، ثم انقر داخل مربع النص بعلامة التعجب الحمراء.
    3. الصق أو اكتب قائمة مفصولة بفواصل لأسماء الأعمدة التي تم التحقق من صحتها مسبقاً. لا يمكنك حفظ المكون إذا كان أي عمود به اسم غير صالح، لذا تأكد من التحقق من الأسماء مسبقاً.

    يمكنك أيضاً استخدام هذه الطريقة لتحديد قائمة الأعمدة باستخدام قيم الفهرس الخاصة بها.

الاختيار حسب النوع

إذا كنت تستخدم الخيار WITH RULES، يمكنك تطبيق شروط متعددة على تحديدات الأعمدة. على سبيل المثال، قد تحتاج إلى الحصول على أعمدة المعالم فقط من نوع البيانات الرقمية.

يحدد خيار BEGIN WITH نقطة البداية وهو مهم لفهم النتائج.

  • إذا حددت الخيار ALL COLUMNS، فستتم إضافة جميع الأعمدة إلى القائمة. بعد ذلك، يجب عليك استخدام الخيار Exclude من أجل إزالة remove الأعمدة التي تفي بشروط معينة.

    على سبيل المثال، قد تبدأ بكل الأعمدة ثم تزيل الأعمدة بالاسم أو بالنوع.

  • إذا حددت الخيار NO COLUMNS، فستبدأ قائمة الأعمدة فارغة. يمكنك بعد ذلك تحديد شروط إضافة add أعمدة إلى القائمة.

    إذا قمت بتطبيق قواعد متعددة، فإن كل شرط يكون additive. على سبيل المثال، لنفترض أنك بدأت دون أعمدة، ثم أضفت قاعدة للحصول على كل الأعمدة الرقمية. في مجموعة بيانات أسعار السيارات، ينتج عن ذلك 16 عموداً. بعد ذلك، انقر فوق علامة + لإضافة شرط جديد، ثم حدد Include all features. تتضمن مجموعة البيانات الناتجة جميع الأعمدة الرقمية، بالإضافة إلى جميع أعمدة المعالم، بما في ذلك بعض أعمدة ميزة السلسلة.

اختر حسب فهرس العمود

يشير فهرس العمود إلى ترتيب العمود داخل مجموعة البيانات الأصلية.

  • يتم ترقيم الأعمدة بالتسلسل بدءاً من 1.
  • للحصول على نطاق من الأعمدة، استخدم واصلة.
  • غير مسموح بالمواصفات المفتوحة مثل 1- أو -3.
  • غير مسموح بقيم الفهرس المكررة (أو أسماء الأعمدة)، وقد ينتج عنها خطأ.

على سبيل المثال، بافتراض أن مجموعة البيانات الخاصة بك تحتوي على ثمانية أعمدة على الأقل، يمكنك لصق أي من الأمثلة التالية لإرجاع عدة أعمدة غير متجاورة:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

المثال الأخير لا يؤدي إلى خطأ؛ ومع ذلك، تقوم بإرجاع مثيل واحد للعمود 4.

تغيير ترتيب الأعمدة

يبدأ الخيار Allow duplicates and preserve column order in selection بقائمة فارغة، ويضيف الأعمدة التي تحددها بالاسم أو بالفهرس. على عكس الخيارات الأخرى، التي تعرض الأعمدة دائماً "بترتيبها الطبيعي"، فإن هذا الخيار ينتج الأعمدة بالترتيب الذي تسميه أو يسردها.

على سبيل المثال، في مجموعة بيانات تحتوي على الأعمدة Col1 وCol2 وCol3 وCol4، يمكنك عكس ترتيب الأعمدة وترك العمود 2، عن طريق تحديد أي من القوائم التالية:

  • Col4, Col3, Col1
  • 4,3,1

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.