تشخيص حادث باستخدام Metrics Advisor

هام

اعتبارا من 20 سبتمبر 2023، لن تتمكن من إنشاء موارد Metrics Advisor جديدة. يتم إيقاف خدمة Metrics Advisor في 1 أكتوبر 2026.

ما مفهوم الحادث؟

عند اكتشاف حالات شاذة في سلاسل زمنية متعددة ضمن مقياس واحد في طابع زمني معين، سيقوم Metrics Advisor تلقائياً بتجميع الحالات الشاذة التي تشترك في نفس السبب الجذري في حادث واحد. يشير الحدث عادة إلى مشكلة حقيقية، يقوم Metrics Advisor بإجراء تحليل فوقه ويوفر نتائج تحليلات تلقائية لتحليل السبب الجذري.

سيؤدي هذا إلى إزالة جهود العميل بشكل كبير لعرض كل حالة شاذة فردية، ويجد بسرعة أهم عامل مساهم في مشكلة ما.

قد يحتوي التنبيه الذي تم إنشاؤه بواسطة Metrics Advisor على حوادث متعددة، وقد يحتوي كل حادث على حالات شاذة متعددة تم التقاطها في سلاسل زمنية مختلفة في نفس الطابع الزمني.

مسارات لتشخيص حادث

  • التشخيص من إعلام تنبيه

    إذا قمت بتكوين خطاف لنوع البريد الإلكتروني/Teams وقمت بتطبيق تكوين تنبيه واحد على الأقل. بعد ذلك، ستتلقى إعلامات تنبيه مستمرة لتصعيد الحوادث والتي يتم تحليلها بواسطة Metrics Advisor. ضمن الإعلام، هناك قائمة بالحوادث ووصف مختصر. لكل حادث، يوجد زر تشخيص، سيؤدي تحديده إلى توجيهك إلى صفحة تفاصيل الحادث لعرض نتائج التحليلات التشخيصية.

    Diagnose from an alert notification

  • التشخيص من حادث في "مركز الأحداث"

    هناك مكان مركزي في Metrics Advisor يجمع جميع الأحداث التي تم التقاطها ويسهل تعقب أي مشكلات مستمرة. سيؤدي تحديد علامة التبويب مركز الأحداث في شريط التنقل الأيمن إلى سرد جميع الأحداث ضمن القياسات المحددة. ضمن قائمة الحوادث، حدد أحدهما لعرض نتائج تشخيصية مفصلة.

    Diagnose from an incident in Incident hub

  • التشخيص من حادث مدرج في صفحة القياسات

    ضمن صفحة تفاصيل القياسات، هناك علامة تبويب تسمى أحداث تسرد آخر الأحداث التي تم التقاطها لهذا القياس. يمكن تصفية القائمة حسب خطورة الأحداث أو قيمة البعد للقياسات.

    سيؤدي تحديد حدث واحد في القائمة إلى توجيهك إلى صفحة تفاصيل الحدث لعرض نتائج التحليلات التشخيصية.

    Diagnose from an incident listed in metrics page

تدفق التشخيص النموذجي

بعد توجيهك إلى صفحة تفاصيل الحادث، يمكنك الاستفادة من نتائج التحليلات التي يتم تحليلها تلقائياً بواسطة Metrics Advisor لتحديد السبب الجذري للمشكلة بسرعة أو استخدام أداة التحليل لتقييم تأثير المشكلة بشكل أكبر. هناك ثلاثة أقسام في صفحة تفاصيل الحادث تتوافق مع ثلاث خطوات رئيسية لتشخيص الحادث.

الخطوة 1: التحقق من ملخص الحادث الحالي

يسرد القسم الأول ملخصا للحادث الحالي، بما في ذلك المعلومات الأساسية والإجراءات والتتبعات والسبب الجذري الذي تم تحليله.

  • تتضمن المعلومات الأساسية "السلسلة الأكثر تأثيرا" مع رسم تخطيطي و"وقت بدء وانتهاء التأثير" و"خطورة الحادث" و"إجمالي الحالات الخارجة عن المألوف المضمنة". من خلال قراءة هذا، يمكنك الحصول على فهم أساسي لمشكلة مستمرة وتأثيرها.

  • الإجراءات والتتبعات، يتم استخدام هذا لتسهيل تعاون الفريق في حادث مستمر. في بعض الأحيان، قد يحتاج حادث واحد إلى إشراك جهود أعضاء الفريق لتحليله وحله. يمكن لكل شخص لديه الإذن لعرض الحدث إضافة إجراء أو حدث تتبع.

    على سبيل المثال، بعد تشخيص الحدث والسبب الجذري، يمكن للمهندس إضافة عنصر تتبع بنوع "مخصص" وإدخال السبب الجذري في قسم التعليق. اترك الحالة على أنها "نشط". بعد ذلك، يمكن لزملائه الآخرين مشاركة نفس المعلومات ومعرفة أن هناك شخصاً يعمل على الإصلاح. يمكنك أيضاً إضافة عنصر "Azure DevOps" لتعقب الحدث بمهمة أو خطأ معين.

  • يُعد السبب الجذري الذي تم تحليله نتيجة يتم تحليلها تلقائيًا. يحلل Metrics Advisor جميع الحالات الشاذة التي يتم التقاطها في سلسلة زمنية، ضمن قياس واحد بقيم أبعاد مختلفة في الطابع الزمني نفسه. ثم ينفذ الارتباط، ويجمع بين الحالات الشاذة المرتبطة معًا، وينشئ نصيحة عن السبب الجذري.

Incident summary

بالنسبة للقياسات ذات الأبعاد المتعددة، من الشائع اكتشاف حالات شاذة متعددة في نفس الوقت. ومع ذلك، قد تشترك هذه الحالات الشاذة في نفس السبب الجذري. بدلاً من تحليل جميع الحالات الشاذة واحدة تلو الأخرى يجب أن يكون الاستفادة من السبب الجذري الذي تم تحليله هي الطريقة الأكثر كفاءة لتشخيص الحادث الحالي.

الخطوة 2: عرض نتائج التحليلات التشخيصية عبر الأبعاد

بعد الحصول على المعلومات الأساسية ونتائج تحليل تلقائي، يمكنك الحصول على معلومات أكثر تفصيلاً حول الحالة غير الطبيعية على الأبعاد الأخرى ضمن نفس المقياس بطريقة شاملة باستخدام "شجرة التشخيص".

بالنسبة للقياسات ذات الأبعاد المتعددة، يصنف Metrics Advisor السلسلة الزمنية في تدرج هرمي، والذي يسمى شجرة التشخيص. على سبيل المثال، يتم رصد قياس "الإيرادات" بحسب بعدين: "المنطقة" و"الفئة". على الرغم من قيم الأبعاد الملموسة، يجب أن يكون هناك قيمة بعد مجمعة، مثل "SUM". ثم سيتم تصنيف السلسلة الزمنية من "المنطقة" = "SUM" و"الفئة" = "SUM" كعقدة الجذر داخل الشجرة. عندما تكون هناك حالة شاذة تم التقاطها في البُعد ⁧"SUM"، يمكنك تحليله لتحديد قيمة البُعد المحدد التي ساهمت أكثر من غيرها في شذوذ العقدة الأصلية. حدد كل عقدة لتوسيعها للحصول على معلومات تفصيلية.

Cross dimension diagnostic using diagnostic tree

  • لتمكين قيمة بُعد "مجمع" في القياسات الخاصة بك

    يدعم Metrics Advisor تنفيذ "القيمة المحتسبة" على الأبعاد لحساب قيمة البعد "المجمعة". شجرة التشخيص تدعم التشخيص على تجميعات "SUM" و"AVG" و"MAX" و"MIN" و"COUNT". لتمكين قيمة بعد "مجمعة"، يمكنك تمكين الدالة "القيمة المحتسبة" أثناء إلحاق البيانات. يرجى التأكد من أن قياساتك قابلة للحساب رياضياً وأن البعد المجمع له قيمة تجارية حقيقية.

    Roll-up settings

  • إذا لم تكن هناك قيمة بعد "مجمعة" في قياساتك

    إذا لم تكن هناك قيمة بعد "مجمعة" في القياسات الخاصة بك، ولم يتم تمكين الدالة "Roll-up" أثناء إعداد البيانات. لن تكون هناك قيمة قياس محسوبة للبعد "المجمع"، ستظهر كعقدة رمادية في الشجرة، ويمكن توسيعها لعرض العقد التابعة لها.

وسيلة إيضاح لشجرة التشخيص

هناك ثلاثة أنواع من العقد في شجرة التشخيص:

  • العقدة الزرقاء، والتي تتوافق مع سلسلة زمنية ذات قيمة قياس حقيقية.
  • العقدة الرمادية، التي تتوافق مع سلسلة زمنية ظاهرية بدون قيمة قياس، فهي عقدة منطقية.
  • العقدة الحمراء، التي تتوافق مع السلسلة الزمنية الأكثر تأثيراً للحادث الحالي.

لكل حالة غير طبيعية للعقدة يتم وصفها بواسطة لون حد العقدة

  • الحد الأحمر يعني أن هناك حالة شاذة تم التقاطها في السلسلة الزمنية المقابلة للطوابع الزمنية للحادث.
  • الحد غير الأحمر يعني عدم وجود حالات شاذة تم التقاطها في السلسلة الزمنية المقابلة للطوابع الزمنية للحادث.

وضع العرض

هناك وضعان للعرض لشجرة التشخيص: إظهار سلسلة الحالات الشاذة فقط أو إظهار النسب الرئيسية.

  • إظهار وضع سلسلة الحالات الشاذة فقط يمكِّن العميل من التركيز على الحالات الشاذة الحالية التي تم التقاطها على سلاسل مختلفة وتشخيص السبب الجذري للسلسلة الأكثر تأثيراً.
  • إظهار النسب الرئيسية من شأنه تمكين العميل من التحقق من الحالة غير الطبيعية للنسب الرئيسية للسلسلة الأكثر تأثيراً. في هذا الوضع، سوف تظهر الشجرة كلتا السلسلتين مع الكشف عن الحالات الشاذة وسلسلة دون حالات شاذة. ولكن المزيد من التركيز على سلسلة هامة.

تحليل الخيارات

  • إظهار نسبة دلتا

    "نسبة دلتا" هي النسبة المئوية لدلتا العقدة الحالية مقارنة بدلتا العقدة الأصل. فيما يلي الصيغة:

    (القيمة الحقيقية للعقدة الحالية - القيمة المتوقعة للعقدة الحالية) / (القيمة الحقيقية للعقدة الأصل - القيمة المتوقعة للعقدة الأصل) * 100%

    يستخدم هذا لتحليل المساهمة الرئيسية لدلتا العقدة الأصل.

  • إظهار نسبة القيمة

    "نسبة القيمة" هي النسبة المئوية لقيمة العقدة الحالية مقارنة بقيمة العقدة الأصل. فيما يلي الصيغة:

    (القيمة الحقيقية للعقدة الحالية / القيمة الحقيقية للعقدة الأصل) * 100%

    يتم استخدام هذا لتقييم نسبة العقدة الحالية داخل الكل.

باستخدام "شجرة التشخيص"، يمكن للعملاء تحديد موقع السبب الجذري للحادث الحالي في بعد محدد. وهذا يزيل بشكل كبير جهود العميل لعرض كل حالة شاذة فردية أو محورية من خلال أبعاد مختلفة للعثور على مساهمة الحالات الشاذة الرئيسية.

الخطوة 3: عرض رؤى التشخيص عبر المقاييس باستخدام "الرسم البياني للمقاييس"

في بعض الأحيان، من الصعب تحليل مشكلة من خلال التحقق من الحالة الشاذة لقياس واحد، وتحتاج إلى ربط قياسات متعددة معًا. يمكن للعملاء تكوين رسم بياني للقياسات، والذي يشير إلى العلاقة بين القياسات. راجع كيفية إنشاء رسم بياني للقياسات للبدء.

تحقق من حالة الشذوذ في بُعد السبب الجذري ضمن "الرسم البياني للقياسات"

باستخدام نتيجة التشخيص عبر الأبعاد أعلاه، يقتصر السبب الجذري على قيمة بُعد محددة. ثم استخدم "الرسم البياني للقياسات"، وقم بالتصفية حسب بُعد السبب الجذري الذي تم تحليله للتحقق من حالة الشذوذ في القياسات الأخرى.

على سبيل المثال، إذا كان هناك حادث تم التقاطه على قياسات "الإيرادات". السلسلة الأكثر تأثيراً هي في المنطقة العالمية مع "المنطقة" = "SUM". وباستخدام التشخيص عبر الأبعاد، كان السبب الجذري موجوداً في "المنطقة" = "Karachi". هناك رسم بياني للقياسات تم تكوينه مسبقاً، بما في ذلك قياسات "الإيرادات" و"التكلفة" و"DAU" و"PLT(وقت تحميل الصفحة)" و"CHR(معدل الوصول إلى ذاكرة التخزين المؤقت)".

سيقوم Metrics Advisor تلقائياً بتصفية الرسم البياني للقياسات حسب بُعد السبب الجذري لـ "المنطقة" = "Karachi" وعرض حالة الشذوذ لكل قياس. من خلال تحليل العلاقة بين القياسات وحالة الشذوذ، يمكن للعملاء الحصول على مزيد من الرؤى لما هو السبب الجذري النهائي.

Cross metrics analysis

من خلال تطبيق عامل تصفية أبعاد السبب الجذري على الرسم البياني للقياسات، سيتم ربط الحالات الشاذة على كل قياس في الطابع الزمني للحدث الحالي تلقائياً. وينبغي أن تكون هذه الحالات الشاذة مرتبطة بالسبب الجذري المحدد للحادث الحالي.

Auto related anomalies

الخطوات التالية