تقييم صحة نظام مجموعة AKS

هذا المقال جزء من سلسلة. ابدأ بنظرة عامة.

لبدء ممارسة الفرز، قم بتقييم الصحة العامة للمجموعة والشبكات.

الأدوات

هناك العديد من الأدوات والميزات التي يمكنك استخدامها لتشخيص المشكلات وحلها في مجموعة Azure Kubernetes Service (AKS).

في مدخل Microsoft Azure، حدد مورد نظام مجموعة AKS. توجد هذه الأدوات والميزات في جزء التنقل.

  • تشخيص المشكلات وحلها: يمكنك استخدام هذه الأداة للمساعدة في تحديد المشكلات وحلها داخل مجموعتك.

  • صحة الموارد: يمكنك استخدام هذه الأداة للمساعدة في تشخيص مشاكل الخدمة التي قد تؤثر على موارد Azure والحصول على دعم لها. توفر هذه الأداة معلومات حول الحالة الصحية الحالية والسابقة لمواردك.

  • توصيات Advisor: يعمل Azure Advisor كمستشار سحابي مخصص، ويرشدك إلى اتباع أفضل الممارسات لتحسين عمليات توزيع Azure. يمكنك استخدام Advisor لتحليل تكوين الموارد وبيانات تتبع الاستخدام. يقترح Advisor حلولا حتى تتمكن من تحسين فعالية التكلفة والأداء والموثوقية والأمان.

  • السجلات: استخدم هذه الميزة للوصول إلى سجلات المجموعة والمقاييس المخزنة في مساحة عمل Log Analytics . يمكنك مراقبة وتحليل سجلات مجموعتك ومقاييسها لتوفير رؤى وتحسين استكشاف الأخطاء وإصلاحها.

استخدم هذه الأدوات والميزات حتى تتمكن من تشخيص المشكلات وحلها بشكل فعال، وتحسين نشر نظام مجموعة AKS، ومراقبة صحة موارد Azure وأدائها.

تشخيص المشكلات وحلها

توفر ميزة تشخيص المشكلات وحلها مجموعة شاملة من الأدوات للمساعدة في تحديد وحل المشكلات المختلفة المتعلقة بم مجموعتك. حدد فئة استكشاف الأخطاء وإصلاحها الأكثر صلة بمشكلتك.

Screenshot that shows the Diagnose and solve problems page.

للتحقق من صحة نظام المجموعة، قد تختار:

  • توفر وحدة نظام المجموعة والتحكم وأدائها: تحقق مما إذا كانت هناك أي مشكلات في توفر الخدمة أو التقييد تؤثر على صحة نظام المجموعة.
  • مشكلات الاتصال: تحقق مما إذا كانت هناك أخطاء في تحليل نظام أسماء المجالات (DNS) لنظام المجموعة أو إذا كان مسار الاتصال الصادر به مشكلات في الاتصال.

صحة الموارد

استخدم ميزة صحة الموارد لتحديد مشكلات نظام المجموعة ومشاكل الخدمة التي يمكن أن تؤثر على صحة نظام المجموعة والحصول على الدعم لها. قم بإعداد تنبيه مورد حتى تتمكن من مراقبة صحة نظام المجموعة بسهولة. توفر ميزة صحة المورد تقريرا عن الصحة الحالية والسابقة لنظام المجموعة الخاص بك. هناك أربع حالات صحية:

  • متوفر: تشير هذه الحالة إلى عدم وجود أحداث تم اكتشافها تؤثر على صحة نظام المجموعة. إذا تم استرداد نظام المجموعة من وقت التعطل غير المخطط له خلال آخر 24 ساعة، يظهر إعلام تم حله مؤخرا.

  • غير متوفر: تشير هذه الحالة إلى أنه تم الكشف عن حدث نظام أساسي مستمر أو حدث غير عام يؤثر على صحة نظام المجموعة.

  • غير معروف: تشير هذه الحالة إلى أن الميزة لم تتلق أي معلومات حول المورد لأكثر من 10 دقائق. تظهر هذه الحالة عادة عند إلغاء تخصيص جهاز ظاهري. هذه الحالة ليست إشارة نهائية لحالة المورد، ولكنها يمكن أن تكون نقطة بيانات مفيدة لاستكشاف الأخطاء وإصلاحها.

  • متدهور: تشير هذه الحالة إلى أن هناك خسارة في الأداء للمجموعة الخاصة بك، ولكن نظام المجموعة لا يزال متاحا للاستخدام.

تظهر لقطة الشاشة التالية نظرة عامة على صحة الموارد.

Screenshot that shows the AKS resource health overview.

لمزيد من المعلومات، راجع نظرة عامة على صحة موارد Azure.

Advisor

يقدم Advisor توصيات قابلة للتنفيذ لمساعدتك على تحسين مجموعات AKS الخاصة بك من أجل الموثوقية والأمان والتميز التشغيلي وكفاءة الأداء. يمكنك استخدام Advisor لتحسين أداء نظام المجموعة بشكل استباقي وتجنب المشكلات المحتملة. حدد توصية للحصول على معلومات مفصلة حول كيفية تحسين نظام المجموعة.

Screenshot that shows the Advisor for AKS result with actions.

تظهر لقطة الشاشة التالية موارد التوصية المحددة.

Screenshot that shows the Advisor for AKS result sample 2. لمزيد من المعلومات، راجع نظرة عامة على Advisor.

Log Analytics

يوفر Log Analytics رؤى حول صحة نظام المجموعة. للوصول إلى مساحة عمل Log Analytics، انتقل إلى مجموعة AKS وحدد Logs في جزء التنقل.

يمكنك اختيار استعلامات معرفة مسبقا لتحليل صحة نظام المجموعة.

Screenshot that shows queries.

استخدم الاستعلامات المضمنة للاستعلام عن السجلات والمقاييس التي تم جمعها في مساحة عمل Log Analytics. تصف القائمة التالية وظائف بعض الاستعلامات في فئات التوفر وسجلات الحاوية والتشخيص.

  • ‏‏التوفر

    • حالة الجاهزية لكل استعلام عقدة : عرض عدد جميع العقد في نظام المجموعة حسب حالة الجاهزية.

    • سرد كافة عدد pods مع استعلام المرحلة : عرض عدد كافة pods حسب المرحلة، مثل فشل أو تعليق أو غير معروف أو قيد التشغيل أو نجح.

  • سجلات الحاوية

    • البحث عن قيمة في استعلام جدول سجلات الحاوية: ابحث عن صفوف في جدول ContainerLogs حيث يحتوي LogEntry على معلمة سلسلة محددة.

    • سرد سجلات الحاوية لكل استعلام مساحة اسم: عرض سجلات الحاوية من مساحات الأسماء في نظام المجموعة.

  • تشخيص

    • استعلام سجلات التحجيم التلقائي لنظام المجموعة: استعلام عن سجلات من مقياس المجموعة التلقائي. يمكن أن يوفر هذا الاستعلام معلومات حول سبب تغيير حجم نظام المجموعة بشكل غير متوقع لأعلى أو لأسفل.

    • استعلام سجلات خادم Kubernetes API: الاستعلام عن سجلات من خادم Kubernetes API.

    • استعلام مخزون الصور: سرد جميع صور الحاوية وحالتها.

    • قراءة قرص Prometheus في الثانية لكل استعلام عقدة : عرض مقاييس قراءة قرص Prometheus من مساحة اسم Kubernetes الافتراضية كمسار زمني.

    • مثيلات متوسط نمو استخدام وحدة المعالجة المركزية من استعلام الأسبوع الماضي: إظهار متوسط نمو وحدة المعالجة المركزية حسب المثيل في الأسبوع الماضي، بترتيب تنازلي.

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكتاب الرئيسيون:

المساهم الآخر:

لمشاهدة ملفات تعريف LinkedIn غير العامة، سجل الدخول إلى LinkedIn.