Project Flash - استخدام Azure Resource Graph لمراقبة توفر Azure Virtual Machine

Azure Resource Graph هو أحد الحلول التي تقدمها Flash. Flash هو الاسم الداخلي لمشروع مخصص لبناء آلية قوية وموثوقة وسريعة للعملاء لمراقبة صحة الجهاز الظاهري (VM).

تتناول هذه المقالة استخدام Azure Resource Graph لمراقبة توفر Azure Virtual Machine. للحصول على نظرة عامة على حلول Flash، راجع نظرة عامة على Flash.

للحصول على وثائق خاصة بالحلول الأخرى التي تقدمها Flash، اختر من المقالات التالية:

Azure Resource Graph - HealthResources

هذه الميزة متوفرة حاليا بشكل عام. إنه مفيد لإجراء تحقيقات واسعة النطاق. يوفر تجربة سهلة الاستخدام للغاية لاسترداد المعلومات باستخدام لغة استعلام kusto (KQL). كما يمكن أن يكون بمثابة مركز مركزي لمعلومات الموارد ويسمح باسترداد سهل للبيانات التاريخية.

بالإضافة إلى حالات توفر الأجهزة الظاهرية المتدفقة بالفعل، قمنا بنشر تعليقات توضيحية حول توفر الجهاز الظاهري إلى Azure Resource Graph (ARG) لإسناد الفشل التفصيلي وتحليل وقت التعطل، جنبا إلى جنب مع تمكين آلية تعقب التغيير لمدة 14 يوما لتتبع التغييرات التاريخية في توفر الجهاز الظاهري لتصحيح الأخطاء بسرعة. مع هذه الإضافات الجديدة، يسعدنا الإعلان عن التوفر العام لمعلومات توفر الجهاز الظاهري في مجموعة بيانات HealthResources في ARG! مع هذا العرض يمكن للمستخدمين:

  • الاستعلام بكفاءة عن أحدث لقطة من توفر الجهاز الظاهري عبر جميع اشتراكات Azure في وقت واحد وفي زمن انتقال منخفض للمراقبة الدورية والأسطولية.
  • قم بتقييم التأثير بدقة على اتفاقيات مستوى الخدمة للأعمال على مستوى الأسطول وسرعة تشغيل إجراءات التخفيف الحاسمة، استجابة للاضطرابات ونوع توقيع الفشل.
  • قم بإعداد لوحات معلومات مخصصة للإشراف على الصحة الشاملة للتطبيقات من خلال ضم معلومات توفر الجهاز الظاهري مع بيانات تعريف الموارد الموجودة في ARG.
  • تعقب التغييرات ذات الصلة في توفر الجهاز الظاهري عبر نافذة متجددة مدتها 14 يوما، باستخدام آلية تتبع التغيير لإجراء تحقيقات مفصلة.

نماذج الاستعلامات

الشروع في العمل

يمكن للمستخدمين الاستعلام عن ARG عبر PowerShell أو REST API أو Azure CLI أو حتى مدخل Microsoft Azure. توضح الخطوات التالية بالتفصيل كيفية الوصول إلى البيانات من مدخل Microsoft Azure.

  1. بمجرد الوصول إلى مدخل Microsoft Azure، انتقل إلى Resource Graph Explorer.

    Screenshot of the Azure Resource Graph Explorer landing page on the Azure portal.

  2. حدد علامة التبويب جدول وانقر فوق الجدول HealthResources لاسترداد أحدث لقطة من معلومات توفر الجهاز الظاهري (حالة التوفر والتعليقات التوضيحية الصحية).

    Screenshot of an Azure Resource Graph Explorer Window depicting the latest VM availability states and VM availability annotations in the Health Resources table.

هناك نوعان من الأحداث التي تم ملؤها في جدول HealthResources:

Snapshot of the type of events in the Health Resources table, as shown in Resource Graph Explorer on the Azure portal.

  • حالة صحة الموارد/التوفر

يشير هذا الحدث إلى أحدث حالة توفر لجهاز ظاهري، استنادا إلى فحوصات السلامة التي يتم إجراؤها بواسطة النظام الأساسي ل Azure الأساسي. حالات التوفر التي نبعثها حاليا للأجهزة الظاهرية هي:

  • متوفر: الجهاز الظاهري قيد التشغيل كما هو متوقع.
  • غير متوفر: اكتشفنا اضطرابات في الأداء العادي للجهاز الظاهري، وبالتالي، لن تعمل التطبيقات كما هو متوقع.
  • غير معروف: النظام الأساسي غير قادر على الكشف بدقة عن صحة الجهاز الظاهري. يمكن للمستخدمين عادة التحقق مرة أخرى في بضع دقائق للحصول على حالة محدثة.

لاستقصاء أحدث حالة توفر للجهاز الظاهري، راجع حقل الخصائص، الذي يحتوي على التفاصيل التالية:

عينة

{
 "targetResourceType": "Microsoft.Compute/virtualMachines",
 "previousAvailabilityState": "Available",
 "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "occurredTime": "2022-10-11T11:13:59.9570000Z",
 "availabilityState": "Unavailable"
 }

وصف الخاصية

الخاصية الوصف فئة صحة الموارد المقابلة (RHC)
targetResourceType نوع المورد الذي تتدفق البيانات الصحية له resourceType
targetResourceId معرف المورد resourceId
حدث وقت الطابع الزمني عندما يصدر النظام الأساسي أحدث حالة توفر eventTimestamp
حالة التوفر السابقة حالة التوفر السابقة للجهاز الظاهري حالة الصحة السابقة
حالة التوفر حالة التوفر الحالية للجهاز الظاهري currentHealthStatus

راجع قسم HealthResources في وثائق استعلامات العينات للحصول على قائمة باستعلامات البداية لاستكشاف هذه البيانات بشكل أكبر.

  • تعليقات توضيحية على الموارد/الصحة (تمت إضافتها حديثا)

يحدد هذا الحدث سياق أي تغييرات على توفر الجهاز الظاهري، من خلال تفصيل سمات الفشل الضرورية لمساعدة المستخدمين على التحقيق في التعطيل والتخفيف منه حسب الحاجة. راجع القائمة الكاملة للتعليقات التوضيحية لتوافر الأجهزة الظاهرية المنبعثة من النظام الأساسي. يمكن تصنيف هذه التعليقات التوضيحية على نطاق واسع إلى ثلاثة مستودعات:

  • التعليقات التوضيحية لوقت التعطل: تصدر هذه التعليقات التوضيحية عندما يكتشف النظام الأساسي انتقال توفر الجهاز الظاهري إلى غير متوفر. (على سبيل المثال، أثناء تعطل المضيف غير المتوقع، عمليات الإصلاح المعاد تمهيدها).
  • التعليقات التوضيحية الإعلامية: يتم إصدار هذه التعليقات التوضيحية أثناء أنشطة وحدة التحكم دون أي تأثير على توفر الجهاز الظاهري. (مثل تخصيص الجهاز الظاهري/إيقاف/حذف/بدء). عادة، لا يلزم اتخاذ أي إجراء إضافي من العملاء استجابة لذلك.
  • التعليقات التوضيحية المتدهورة: يتم إصدار هذه التعليقات التوضيحية عند الكشف عن توفر الجهاز الظاهري ليكون في خطر. (على سبيل المثال، عندما تتنبأ نماذج التنبؤ بالفشل بمكون جهاز متدهور يمكن أن يتسبب في إعادة تشغيل الجهاز الظاهري في أي وقت). نحث المستخدمين بشدة على إعادة النشر بحلول الموعد النهائي المحدد في رسالة التعليق التوضيحي، لتجنب أي فقدان غير متوقع للبيانات أو وقت تعطل. قد تتلقى تنبيها في مجموعات مقياس الجهاز الظاهري Azure Resource Health أو سجل النشاط في أحد السيناريوهات التالية:
    • الأجهزة الظاهرية في مجموعات مقياس الجهاز الظاهري Azure قيد الإيقاف أو إلغاء التخصيص أو الحذف أو البدء.
    • قمت بإجراء عمليات التحجيم أو التحجيم على مجموعات مقياس الجهاز الظاهري.
    • يشير التنبيه إلى أن صحة النظام الأساسي المجمع لمجموعات مقياس الجهاز الظاهري في حالة عابرة من "متدهور".

لاستقصاء التعليقات التوضيحية المرتبطة بتوفر الجهاز الظاهري لمورد، إن وجد، راجع حقل الخصائص، الذي يحتوي على التفاصيل التالية:

عينة

{
 "targetResourceType": "Microsoft.Compute/virtualMachines", "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "annotationName": "VirtualMachineHostRebootedForRepair",
 "occurredTime": "2022-09-25T20:21:37.5280000Z",
 "category": "Unplanned",
 "summary": "We're sorry, your virtual machine isn't available because an unexpected failure on the host server. Azure has begun the auto-recovery process and is currently rebooting the host server. No further action is required from you at this time. The virtual machine will be back online after the reboot completes.",
 "context": "Platform Initiated",
 "reason": "Unexpected host failure"
 }

وصف الخاصية

الخاصية الوصف RHC المطابق
targetResourceType نوع المورد الذي تتدفق البيانات الصحية له resourceType
targetResourceId معرف المورد resourceId
حدث وقت الطابع الزمني عند إصدار أحدث حالة توفر بواسطة النظام الأساسي eventTimestamp
اسم التعليق التوضيحي اسم التعليق التوضيحي المنبعث eventName
السبب نظرة عامة موجزة على تأثير التوفر الذي لاحظه العميل العنوان
الفئة يشير إلى ما إذا كان نشاط النظام الأساسي الذي قام بتشغيل التعليق التوضيحي إما صيانة مخطط لها أو إصلاح غير مخطط له. لا ينطبق هذا الحقل على الأحداث التي بدأها العميل/الجهاز الظاهري. القيم المحتملة: مخطط لها، غير مخطط لها، غير قابلة للتطبيق، خالية الفئة
السياق يشير إلى ما إذا كان النشاط الذي قام بتشغيل التعليق التوضيحي بسبب مستخدم أو عملية معتمدة (بدأها العميل) أو النظام الأساسي Azure (الذي بدأه النظام الأساسي) أو النشاط في نظام التشغيل الضيف الذي أدى إلى تأثير التوفر (تم بدء تشغيل الجهاز الظاهري). القيم المحتملة: يبدأ النظام الأساسي، يبدأه المستخدم، يبدأه الجهاز الظاهري، غير قابل للتطبيق، خال السياق
الملخص. بيان يوضح بالتفصيل سبب انبعاث التعليقات التوضيحية، إلى جانب خطوات المعالجة التي يمكن للمستخدمين اتخاذها الملخص.

راجع قسم HealthResources في وثائق استعلامات العينات للحصول على قائمة باستعلامات البداية لاستكشاف هذه البيانات بشكل أكبر.

لدينا تحسينات متعددة مخططة لبيانات تعريف التعليق التوضيحي التي تظهر في مجموعة بيانات HealthResources. تمنح عمليات الإثراء هذه المستخدمين إمكانية الوصول إلى سمات فشل أكثر ثراء لإعداد استجابة للتعطل بشكل حاسم. بالتوازي، نهدف إلى تمديد مدة البحث التاريخي إلى 30 يوما كحد أدنى حتى يتمكن المستخدمون من تعقب التغييرات السابقة بشكل شامل في توفر الجهاز الظاهري.

الخطوات التالية

لمعرفة المزيد حول الحلول المقدمة، انتقل إلى مقالة الحل المقابلة:

للحصول على نظرة عامة حول كيفية مراقبة أجهزة Azure الظاهرية، راجع مراقبة أجهزة Azure الظاهرية ومرجع مراقبة أجهزة Azure الظاهرية.