تطبيع بيانات سجل الحدث
مِن خلال تحويل بيانات سجل الأحداث، يمكنك تسهيل استخدَامها أثناء جهد تحليل التنقيب فِي العمليات. إذا كانت بيانات سجل الأحداث أقل مِن 1-2 غيغابايت مِن البيانات، فإن استخدَام Power Query يعد خيارًا جيدًا. ومع ذلك، إذا كنت تعمل عَلى ملفات بيانات سجل أكبر، فِيمكن أن يكون إجراء التحويلات خارج التنقيب فِي العمليات أكثر كفاءة.
تستعرض الأقسام التالية بعض التحويلات الشائعة التي يمكنك إجراؤها قبل استيعاب البيانات فِي التنقيب فِي العمليات.
إعادة تسمية الأعمدة
يقوم النظام بتعيين الأعمدة مِن بيانات سجل الأحداث إلى التنقيب فِي العمليات، ولكن أسماء الأعمدة تمر مِن خلالها ثم يستخدمها النظام أثناء جهود تحليل العملية. تحدث مع فريقك للاتفاق عَلى اصطلاحات التسمية مقدمًا ثم قم بتطبيق هذه الأسماء كجزء مِن التحول. عَلى سَبِيل المِثَال، يمكنك استخدَام "c_" كبادئة لجميع السمات عَلى مستوى الحالة. يمكن أن يساعدك هذا الأسلوب عَلى التعرف بسرعة عَلى البيانات عَلى مستوى الحالة. عادة، نوصي باستخدَام حالة الجمل وتجنب استخدَام الشرطات السفلية (_) فِي الأسماء، عَلى سَبِيل المِثَال، ResourceHourlyRate بدلاً مِن resource_hourly_rate.
بالإضافة إلى ذلك، تأكد مِن أن اسم العمود يوضح محتوياته. عَلى سَبِيل المِثَال، لن تكون تسمية عمود باسم Timestamp1 وTimestamp2 واضحة مثل إعادة تسميتهما إلى StartTimestamp وEndTimestamp.
مِن Power Query، يمكنك تطبيق نظام التسمية الجَديد الخَاص بك عن طريق النقر المزدوج فوق الرأس وتغيير اسم العمود.
عند تطبيق أسماء أعمدة واضحة ومتناسقة، يكون استخدَام البيانات أكثر فاعلية فِي مرحلة تحليل البيانات.
تغيير نوع العمود.
تأكد مِن مراجعة نوع البيانات والإعدادات المحلية لكل عمود فِي سجل الأحداث للتأكد مِن صحته. غالبًا ما يستنتج سجل الأحداث نوع البيانات ولا يمثله بشكل صحيح. يمكنك تغيير نوع البيانات، وإذا كان ذلك مِناسبًا، يمكنك الإشارة إلى الإعدادات المحلية الخَاصة به.
استبدال القيّم
قد تتضمِن البيانات المستخرجة مِن نظام السجل حقول التعليمات البرمجية التي، عَلى الرغم مِن كفاءتها فِي التخزين، ليست فعالة للبشر لاستخدَامها فِي تحليل العملية. عَلى سَبِيل المِثَال، قد يحتوي عمود حالة الأمر عَلى القيمة 2277333، والتي يعرفها النظام باسم Shipped. باستخدَام ميزة Replace values، Power Query يمكنك تحديث هذه الأعمدة للحصول عَلى بياناتٍ ذات معنى.
التحولات الشائعة الأخرى
Power Query هو محرك تحويل قوي يمكنك استخدَامه للتعامل مع العديد مِن التحديات التي تواجهها مع بيانات سجل الأحداث. لمزيدٍ مِن المعلومات، راجع المرجع عَلى Power Query، الذي يصف العمليات المتاحة لتحويل البيانات.
تتضمِن تحويلات سجل الأحداث الشائعة الأخرى التي قد تقوم بإجرائها ما يلي:
تقسيم البيانات إلى عدة أعمدة. عَلى سَبِيل المِثَال، إذا كان لديك رقم عميل يحتوي عَلى المكتب ومعرف فريد، فقد ترغب فِي تقسيم معرف المكتب.
تجميع البيانات مِن أعمدة متعددة. عَلى سَبِيل المِثَال، قد ترغب فِي دمج اسم النشاط مع اسم النظام المصدر.
استخدم إمكانية Fill values لملء عمود يحتوي عَلى بعض القيم الفارغة ثم قم بتطبيق قيمة افتراضية عَلى تلك الصفوف.
يعد تحويل بيانات سجل الأحداث خطوة مهما فِي الحصول عَلى أنظف البيانات الممكنة للابتلاع إلى التنقيب فِي العمليات. يمكن أن يؤدي وجود سجل أحداث معدٍّ بشكل صحيح إلى تسريع عملية تحليل البيانات.


