إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
توضح هذه المقالة مكونا لمصمم التعلم الآلي من Microsoft Azure.
استخدم مكون تلخيص البيانات لإنشاء مجموعة من المقاييس الإحصائية القياسية التي تصف كل عمود في جدول الإدخال.
تكون الإحصائيات الموجزة مفيدة عندما تريد فهم خصائص مجموعة البيانات الكاملة. على سبيل المثال، قد تحتاج إلى معرفة:
- كم عدد القيم المفقودة الموجودة في كل عمود؟
- كم عدد القيم الفريدة الموجودة في عمود الميزة؟
- ما هو الوسط والانحراف المعياري لكل عمود؟
يحسب المكون الدرجات المهمة لكل عمود، ويعيد صفا من إحصائيات الملخص لكل متغير (عمود بيانات) تم توفيره كمدخل.
كيفية تكوين تلخيص البيانات
أضف مكون Summarize Data إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك. يمكنك العثور على هذا المكون في فئة الدالات الإحصائية في المصمم.
قم بتوصيل مجموعة البيانات التي تريد إنشاء تقرير لها.
إذا كنت تريد الإبلاغ عن بعض الأعمدة فقط، فاستخدم المكون Select Columns in Dataset لعرض مجموعة فرعية من الأعمدة للعمل معها.
لا توجد معلمات إضافية مطلوبة. بشكل افتراضي، يقوم المكون بتحليل جميع الأعمدة التي يتم توفيرها كمدخل، واستنادا إلى نوع القيم في الأعمدة، يقوم بإخراج مجموعة ذات صلة من الإحصائيات كما هو موضح في قسم النتائج .
إرسال البنية الأساسية.
النتائج
يمكن أن يتضمن التقرير من المكون الإحصائيات التالية.
| اسم العمود | وصف |
|---|---|
| ميزة | اسم العمود |
| عدد | عدد كافة الصفوف |
| عدد القيم الفريدة | عدد القيم الفريدة في العمود |
| عدد القيم المفقودة | عدد القيم الفريدة في العمود |
| دقيقه | أدنى قيمة في العمود |
| ماكس | أعلى قيمة في العمود |
| المتوسط | متوسط كافة قيم الأعمدة |
| متوسط الانحراف | متوسط انحراف قيم العمود |
| الربع الأول | القيمة عند الربع الأول |
| متوسط | قيمة العمود الوسيط |
| الربع الثالث | القيمة عند الربع الثالث |
| طريقة | وضع قيم الأعمدة |
| نطاق | عدد صحيح يمثل عدد القيم بين القيم القصوى والدنيا |
| تباين العينة | التباين للعمود؛ راجع ملاحظة |
| نموذج الانحراف المعياري | الانحراف المعياري للعمود؛ راجع ملاحظة |
| انحراف العينة | انحراف العمود؛ راجع ملاحظة |
| تفرطح العينة | التفرطح للعمود؛ راجع ملاحظة |
| P0.5 | 0.5% مئوية |
| P1 | قيمة مئوية% 1 |
| P5 | 5% مئوية |
| P95 | 95% مئوية |
| P99.5 | 99.5% مئوية |
الملاحظات التقنية
بالنسبة للأعمدة غير الرقمية، يتم حساب قيم العدد وعدد القيم الفريدة وعدد القيم المفقودة فقط. بالنسبة للإحصائيات الأخرى، يتم إرجاع قيمة خالية.
تتم معالجة الأعمدة التي تحتوي على قيم منطقية باستخدام هذه القواعد:
عند حساب Min، يتم تطبيق AND منطقي.
عند حساب Max، يتم تطبيق OR منطقي
عند حساب النطاق، يتحقق المكون أولا مما إذا كان عدد القيم الفريدة في العمود يساوي 2.
عند حساب أي إحصائية تتطلب حسابات الفاصلة العائمة، يتم التعامل مع قيم True على أنها 1.0، ويتم التعامل مع قيم False على أنها 0.0.
الخطوات التالية
راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.