قص القيم

توضح هذه المقالة أحد مكونات مصمم التعلم الآلي من Azure.

استخدم مكون "قيم القصّ" لتحديد قيم البيانات الأعلى أو الأدنى من حد محدد، أو استبدالها اختيارياً بقيمة متوسطة أو ثابتة أو قيمة بديلة أخرى.

يمكنك توصيل المكون بمجموعة بيانات تحتوي على الأرقام التي تريد قصّها، واختيار الأعمدة التي تريد استخدامها، ثم تعيين حد أو نطاق للقيم، وطريقة استبدال. يمكن للمكون إخراج النتائج فقط، أو إخراج القيم المتغيرة المُلحقة إلى مجموعة البيانات الأصلية.

كيفية تكوين "قيم القصّ"

قبل البدء، حدد الأعمدة التي تريد قصّها والطريقة التي تريد استخدامها. نوصيك باختبار أي أسلوب قصّ على مجموعة فرعية صغيرة من البيانات أولاً.

يطبق المكون نفس المعايير وأسلوب الاستبدال على جميع الأعمدة التي تضمّنها في التحديد. لذلك، تأكد من استبعاد الأعمدة التي لا تريد تغييرها.

إذا كنت بحاجة إلى تطبيق أساليب قصّ أو معايير مختلفة على بعض الأعمدة، فيجب استخدام مثيل جديد من قيم القصّ لكل مجموعة من الأعمدة المتماثلة.

  1. أضف مكون قيم القصّ إلى مسارك ووصّله بمجموعة البيانات التي تريد تعديلها. يمكنك العثور على هذا المكون ضمن تحويل البيانات، في فئة تغيير السعة وتقليلها.

  2. في قائمة الأعمدة، استخدم محدِّد الأعمدة لاختيار الأعمدة التي ستُطبَّق قيم القصّ عليها.

  3. بالنسبة إلى مجموعة الحدود، اختر أحد الخيارات التالية من القائمة المنسدلة. تحدد هذه الخيارات كيفية تعيين الحدود العليا والدنيا للقيم المقبولة مقابل القيم التي يجب قصّها.

    • ClipPeaks: عند قصّ القيم حسب الذروات، فإنك تحدد حداً أعلى فقط. تُستبدل القيم الأكبر من قيمة الحد هذه.

    • ClipSubpeaks: عند قصّ القيم حسب الذروات الفرعية، فإنك تحدد حداً أدنى فقط. تُستبدل القيم الأقل من قيمة الحد هذه.

    • ClipPeaksAndSubpeaks: عند قصّ القيم حسب الذروات والذروات الفرعية، يمكنك تحديد الحدين الأعلى والأدنى. تُستبدل القيم الموجودة خارج هذا النطاق. لا يتم تغيير القيم التي تطابق قيم الحدود.

  4. يمكنك تعيين قيم الحدود التالية، استناداً إلى ما حددته في الخطوة السابقة:

    • الحد الأدنى: يُعرض فقط إذا اخترت ClipSubPeaks
    • الحد الأعلى: يُعرض فقط إذا اخترت ClipPeaks
    • الحد: يُعرض فقط إذا اخترت ClipPeaksAndSubPeaks

    لكل نوع حد، اختر إما ثابت أو قيمة مئوية.

  5. إذا حددت ثابت، فاكتب القيمة القصوى أو الدنيا في مربع النص. على سبيل المثال، افترض أنك تعرف أن القيمة 999 استُخدِمت كقيمة عنصر نائب. يمكنك اختيار ثابت للحد الأعلى، وكتابة 999 في القيمة الثابتة للحد الأعلى.

  6. إذا اخترت قيمة مئوية، فإنك تقيّد قيم العمود إلى نطاق قيمة مئوية.

    على سبيل المثال، لنفترض أنك تريد الاحتفاظ فقط بالقيم ضمن النطاق 10: 80 بالمائة، واستبدال كافة القيم الأخرى. يمكنك اختيار قيمة مئوية، ثم اكتب 10 لـ القيمة المئوية للحد الأدنى، واكتب 80 لـ القيمة المئوية للحد الأعلى.

    راجع قسم القيم المئوية للحصول على بعض الأمثلة لكيفية استخدام نطاقات القيم المئوية.

  7. عرّف قيمةً بديلة.

    الأرقام المتطابقة تماماً مع الحدود التي حددتها تُعتبر ضمن نطاق القيم المسموح به، وبالتالي لا تُستبدل. وجميع الأرقام التي تقع خارج النطاق المحدد تُستبدل بالقيمة البديلة.

    • القيمة البديلة للذروات: تحدد القيمة المراد أن تحل محل جميع قيم الأعمدة الأكبر من الحد المحدد.
    • القيمة البديلة للذروات الفرعية: تحدد القيمة المراد أن تحل محل جميع قيم الأعمدة الأقل من الحد المحدد.
    • إذا كنت تستخدم الخيار ClipPeaksAndSubpeaks، فيمكنك تحديد قيم استبدال منفصلة لقيم القصّ العليا والدنيا.

    قيم الاستبدال التالية مدعومة:

    • الحد: يستبدل القيم المُقتصّة بقيمة الحد المحددة.

    • المتوسط: يستبدل القيم المُقتصّة بمتوسط قيم الأعمدة. يتم حساب المتوسط قبل قصّ القيم.

    • الوسيط: يستبدل القيم المُقتصّة بوسيط قيم الأعمدة. يتم حساب الوسيط قبل قصّ القيم.

    • المفقود. يستبدل القيم المُقتصّة بالقيمة المفقودة (الفارغة).

  8. إضافة أعمدة مؤشر: حدد هذا الخيار إذا أردت إنشاء عمود جديد يخبرك بما إذا كانت عملية القصّ المحددة مُطبّقة على البيانات الموجودة في هذا الصف أم لا. يكون هذا الخيار مفيداً عند اختبار مجموعة جديدة من قيم القصّ والاستبدال.

  9. علامة الاستبدال: الإشارة إلى الكيفية التي تريد إنشاء القيم الجديدة بها. بشكل افتراضي، تنشئ قيم القصّ عموداً جديداً مع قصّ قيم الذروة إلى الحد المطلوب. تحل القيم الجديدة محل العمود الأصلي.

    للاحتفاظ بالعمود الأصلي وإضافة عمود جديد بالقيم المُقتصّة، ألغِ تحديد هذا الخيار.

  10. إرسال المسار.

    انقر بزر الماوس الأيمن فوق مكون قيم القصّ وحدد تمثيل باستخدام المخططات، أو حدد المكون وبدّل إلى علامة التبويب الإخراجات في اللوحة اليسرى، وانقر فوق أيقونة المدرج التكراري في إخراجات المنفذ، لمراجعة القيم والتأكد من أن عملية القصّ تلبي توقعاتك.

أمثلة للقصّ باستخدام القيم المئوية

لفهم كيفية عمل القصّ حسب القيم المئوية، فكّر في استخدام مجموعة بيانات تتضمن 10 صفوف، وتحتوي على مثيل واحد لكل قيمة من القيم من 1 إلى 10.

  • إذا كنت تستخدم القيمة المئوية كحد أعلى، عند القيمة المئوية 90، فيجب أن يكون 90 بالمئة من جميع القيم الموجودة في مجموعة البيانات أقل من تلك القيمة.

  • إذا كنت تستخدم القيمة المئوية كحد أدنى، عند القيمة المئوية 10، فيجب أن يكون 10 بالمئة من جميع القيم الموجودة في مجموعة البيانات أقل من تلك القيمة.

  1. بالنسبة إلى مجموعة الحدود، اختر ClipPeaksAndSubPeaks.

  2. اختر قيمة مئوية لـ الحد الأعلى، واكتب 90 لـ رقم القيمة المئوية.

  3. اختر القيمة المفقودة لـ القيمة البديلة العليا.

  4. اختر قيمة مئوية لـ الحد الأدنى، واكتب 10 لـ رقم القيمة المئوية.

  5. اختر القيمة المفقودة لـ القيمة البديلة الدنيا.

  6. ألغِ تحديد الخيار علامة الاستبدال، وحدد الخيار إضافة عمود مؤشر.

الآن جرّب المسار نفسه باستخدام 60 كحد أعلى للقيمة المئوية و30 كحد أدنى للقيمة المئوية، واستخدم قيمة الحد كقيمة استبدال. يقارن الجدول التالي بين هاتين النتيجتين:

  1. استبدل بالمفقود؛ الحد الأعلى = 90؛ الحد الأدنى = 20

  2. استبدل بالحد؛ القيمة المئوية العليا = 60؛ القيمة المئوية الدنيا = 40

البيانات الأصلية استبدال بالمفقود استبدال بالحد
1

2

3

4

5

6

7

8

9

10
صواب

صواب

3، خطأ

4، خطأ

5، خطأ

6، خطأ

7، خطأ

8، خطأ

9، خطأ

صواب
4، صحيح

4، صحيح

4، صحيح

4، صحيح

5، خطأ

6، خطأ

7، صحيح

7، صحيح

7، صحيح

7، صحيح

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.