أفضل الممارسات لمراقبة Kubernetes باستخدام Azure Monitor

توفر هذه المقالة أفضل الممارسات لمراقبة صحة وأداء Azure Kubernetes Service (AKS) ومجموعات Kubernetes التي تدعم Azure Arc. تستند الإرشادات إلى الركائز الخمس لتميز البنية الموضحة في Azure Well-Architected Framework.

الموثوقيه

نعترف بحدوث حالات الفشل في السحابة. وبدلاً من محاولة منع الفشل تماماً، فإن الهدف هو الحد من آثار مكون فاشل واحد. استخدم المعلومات التالية للاستفادة بشكل أفضل من Azure Monitor لضمان موثوقية مجموعات Kubernetes وبيئة المراقبة.

قائمة اختيار التصميم

  • تمكين استخراج مقاييس Prometheus لنظام مجموعتك.
  • تمكين نتائج تحليلات الحاوية لجمع السجلات وبيانات الأداء من مجموعتك.
  • إنشاء إعدادات التشخيص لتجميع سجلات وحدة التحكم لمجموعات AKS.
  • تمكين تنبيهات Prometheus الموصى بها.
  • تأكد من توفر مساحة عمل Log Analytics التي تدعم نتائج تحليلات الحاوية.

توصيات التكوين

التوصية الميزة
تمكين استخراج مقاييس Prometheus لنظام مجموعتك. قم بتمكين Prometheus على مجموعتك باستخدام خدمة Azure Monitor المدارة ل Prometheus إذا لم يكن لديك بيئة Prometheus بالفعل. استخدم Azure Managed Grafana لتحليل بيانات Prometheus التي تم جمعها. راجع تخصيص استخراج مقاييس Prometheus في خدمة Azure Monitor المدارة ل Prometheus لجمع مقاييس إضافية تتجاوز التكوين الافتراضي.
تمكين نتائج تحليلات الحاوية لجمع السجلات وبيانات الأداء من مجموعتك. تجمع نتائج تحليلات الحاوية سجلات stdout/stderr ومقاييس الأداء وأحداث Kubernetes من كل عقدة في مجموعتك. يوفر لوحات المعلومات والتقارير لتحليل هذه البيانات، بما في ذلك توفر العقد والمكونات الأخرى. استخدم Log Analytics لتحديد أي أخطاء توفر في السجلات التي تم جمعها.
إنشاء إعدادات التشخيص لتجميع سجلات وحدة التحكم لمجموعات AKS. تنفذ AKS سجلات مستويات التحكم كسجلات موارد في Azure Monitor. قم بإنشاء إعداد تشخيص لإرسال هذه السجلات إلى مساحة عمل Log Analytics حتى تتمكن من استخدام استعلامات السجل لتحديد الأخطاء والمشكلات التي تؤثر على التوفر.
تمكين تنبيهات Prometheus الموصى بها. تقوم التنبيهات في Azure Monitor بإعلامك بشكل استباقي عند اكتشاف المشكلات. ابدأ بمجموعة من قواعد تنبيه Prometheus الموصى بها التي تكتشف مشكلات التوفر والأداء الأكثر شيوعا مع مجموعتك. من المحتمل إضافة تنبيهات بحث السجل باستخدام البيانات التي تم جمعها بواسطة نتائج تحليلات الحاوية.
تأكد من توفر مساحة عمل Log Analytics التي تدعم نتائج تحليلات الحاوية. تعتمد نتائج تحليلات الحاوية على مساحة عمل Log Analytics. راجع أفضل الممارسات لسجلات Azure Monitor للحصول على توصيات لضمان موثوقية مساحة العمل.

Security

الأمان هو أحد أهم جوانب أي تصميم. يوفر Azure Monitor ميزات لاستخدام كل من مبدأ الامتياز الأقل والدفاع المتعمق. استخدم المعلومات التالية لمراقبة مجموعات Kubernetes والتأكد من وصول المستخدمين المصرح لهم فقط إلى البيانات المجمعة.

قائمة اختيار التصميم

  • استخدم مصادقة الهوية المدارة لنظام المجموعة للاتصال ب Container insights.
  • ضع في اعتبارك استخدام ارتباط Azure الخاص لنظام المجموعة للاتصال بمساحة عمل Azure Monitor باستخدام نقطة نهاية خاصة.
  • استخدم تحليلات نسبة استخدام الشبكة لمراقبة نسبة استخدام الشبكة من وإلى مجموعتك.
  • تمكين إمكانية مراقبة الشبكة.
  • تأكد من أمان مساحة عمل Log Analytics التي تدعم نتائج تحليلات الحاوية.

توصيات التكوين

التوصية الميزة
استخدم مصادقة الهوية المدارة لنظام المجموعة للاتصال ب Container insights. مصادقة الهوية المدارة هي الافتراضية للمجموعات الجديدة. إذا كنت تستخدم المصادقة القديمة، يجب الترحيل إلى الهوية المدارة لإزالة المصادقة المحلية المستندة إلى الشهادة.
ضع في اعتبارك استخدام ارتباط Azure الخاص لنظام المجموعة للاتصال بمساحة عمل Azure Monitor باستخدام نقطة نهاية خاصة. تخزن خدمة Azure المدارة ل Prometheus بياناتها في مساحة عمل Azure Monitor التي تستخدم نقطة نهاية عامة بشكل افتراضي. يتم تأمين الاتصال إلى نقاط النهاية العامة بتشفير شامل. إذا كنت تحتاج إلى نقطة نهاية خاصة، يمكنك استخدام ارتباط Azure الخاص للسماح لنظام المجموعة بالاتصال بمساحة العمل من خلال الشبكات الخاصة المعتمدة. يمكن أيضا استخدام الارتباط الخاص لفرض استيعاب بيانات مساحة العمل من خلال ExpressRoute أو VPN.

راجع الارتباط الخاص لاستيعاب البيانات لمساحة عمل Prometheus وAzure Monitor المدارة للحصول على تفاصيل حول تكوين نظام المجموعة الخاص بك للارتباط الخاص. راجع استخدام نقاط النهاية الخاصة لمساحة عمل Prometheus وAzure Monitor المدارة للحصول على تفاصيل حول الاستعلام عن بياناتك باستخدام ارتباط خاص.
استخدم تحليلات نسبة استخدام الشبكة لمراقبة نسبة استخدام الشبكة من وإلى مجموعتك. تحلل تحليلات نسبة استخدام الشبكة سجلات تدفق Azure Network Watcher NSG لتوفير رؤى حول تدفق نسبة استخدام الشبكة في سحابة Azure. استخدم هذه الأداة للتأكد من عدم وجود تسرب للبيانات للمجموعة الخاصة بك والكشف عن ما إذا كانت هناك أي عناوين IP عامة غير ضرورية مكشوفة.
تمكين إمكانية مراقبة الشبكة. توفر الوظيفة الإضافية لمراقبة الشبكة ل AKS إمكانية المراقبة عبر الطبقات المتعددة في مكدس شبكات Kubernetes. مراقبة ومراقبة الوصول بين الخدمات في نظام المجموعة (حركة المرور بين الشرق والغرب).
تأكد من أمان مساحة عمل Log Analytics التي تدعم نتائج تحليلات الحاوية. تعتمد نتائج تحليلات الحاوية على مساحة عمل Log Analytics. راجع أفضل الممارسات لسجلات Azure Monitor للحصول على توصيات لضمان أمان مساحة العمل.

تحسين التكلفة

يشير تحسين التكلفة إلى طرق لتقليل النفقات غير الضرورية وتحسين الكفاءة التشغيلية. يمكنك تقليل التكلفة بشكل كبير ل Azure Monitor من خلال فهم خيارات التكوين والفرص المختلفة لتقليل كمية البيانات التي يجمعها. راجع تكلفة Azure Monitor واستخدامه لفهم الطرق المختلفة التي يفرضها Azure Monitor وكيفية عرض فاتورتك الشهرية.

إشعار

راجع تحسين التكاليف في Azure Monitor للحصول على توصيات تحسين التكلفة عبر جميع ميزات Azure Monitor.

قائمة اختيار التصميم

  • لا تقم بتمكين مجموعة نتائج تحليلات الحاوية لمقاييس Prometheus.
  • تكوين مجموعة الوكلاء لتعديل جمع البيانات في نتائج تحليلات الحاوية.
  • تعديل الإعدادات لجمع بيانات القياس بواسطة نتائج تحليلات الحاوية.
  • قم بتعطيل مجموعة نتائج تحليلات الحاوية لبيانات القياس إذا لم تستخدم تجربة نتائج تحليلات الحاوية في مدخل Microsoft Azure.
  • إذا لم تستعلم عن جدول سجلات الحاوية بانتظام أو تستخدمه للتنبيهات، فكونه كسجلات أساسية.
  • تقييد مجموعة سجلات الموارد التي لا تحتاج إليها.
  • استخدم التسجيل الخاص بالموارد لسجلات موارد AKS وتكوين الجداول كسجلات أساسية.
  • استخدم OpenCost لجمع تفاصيل حول تكاليف Kubernetes.

توصيات التكوين

التوصية الميزة
لا تقم بتمكين مجموعة نتائج تحليلات الحاوية لمقاييس Prometheus في مساحة عمل Log Analytics إذا قمت بتمكين استخراج المقاييس باستخدام Prometheus. بالإضافة إلى استخراج مقاييس Prometheus من مجموعتك باستخدام خدمة Azure Monitor المدارة ل Prometheus، يمكنك تكوين نتائج تحليلات الحاوية لجمع مقاييس Prometheus في مساحة عمل Log Analytics. هذا زائد عن الحاجة مع البيانات في Prometheus المدارة وسينتج عنه تكلفة إضافية.
تكوين عامل لتعديل جمع البيانات في نتائج تحليلات الحاوية. تحليل البيانات التي تم جمعها بواسطة نتائج تحليلات الحاوية كما هو موضح في التحكم في الاستيعاب لتقليل التكلفة وضبط التكوين لإيقاف جمع البيانات التي لا تحتاج إليها.
تعديل الإعدادات لجمع بيانات القياس بواسطة نتائج تحليلات الحاوية. راجع تمكين إعدادات تحسين التكلفة للحصول على تفاصيل حول تعديل كل من التردد الذي يتم فيه جمع البيانات القياسية ومساحات الأسماء التي يتم جمعها بواسطة نتائج تحليلات الحاوية.
قم بتعطيل مجموعة نتائج تحليلات الحاوية لبيانات القياس إذا لم تستخدم تجربة نتائج تحليلات الحاوية في مدخل Microsoft Azure. تجمع نتائج تحليلات الحاوية العديد من نفس قيم القياس مثل Managed Prometheus. يمكنك تعطيل جمع هذه المقاييس عن طريق تكوين نتائج تحليلات الحاوية لتجميع السجلات والأحداث فقط كما هو موضح في تمكين إعدادات تحسين التكلفة في نتائج تحليلات الحاوية. يعطل هذا التكوين تجربة نتائج تحليلات الحاوية في مدخل Microsoft Azure، ولكن يمكنك استخدام Grafana لتصور مقاييس Prometheus وتحليلات السجل لتحليل بيانات السجل التي تم جمعها بواسطة نتائج تحليلات الحاوية.
إذا لم تستعلم عن جدول سجلات الحاوية بانتظام أو تستخدمه للتنبيهات، فكونه كسجلات أساسية. قم بتحويل مخطط نتائج تحليلات الحاوية إلى ContainerLogV2 المتوافق مع السجلات الأساسية ويمكن أن يوفر وفورات كبيرة في التكاليف كما هو موضح في التحكم في الاستيعاب لتقليل التكلفة.
تقييد مجموعة سجلات الموارد التي لا تحتاج إليها. يتم تنفيذ سجلات وحدة التحكم لمجموعات AKS كسجلات موارد في Azure Monitor. إنشاء إعداد تشخيص لإرسال هذه البيانات إلى مساحة عمل Log Analytics. راجع تجميع سجلات وحدة التحكم لمجموعات AKS للحصول على توصيات حول الفئات التي يجب عليك جمعها.
استخدم التسجيل الخاص بالموارد لسجلات موارد AKS وتكوين الجداول كسجلات أساسية. يدعم AKS إما وضع تشخيص Azure أو الوضع الخاص بالموارد لسجلات الموارد. حدد سجلات الموارد لتمكين خيار تكوين الجداول للسجلات الأساسية، والتي توفر رسوم استيعاب مخفضة للسجلات التي تستعلم عنها أحيانا فقط ولا تستخدمها للتنبيه.
استخدم OpenCost لجمع تفاصيل حول تكاليف Kubernetes. OpenCost هو مشروع بيئة الاختبار المعزولة CNCF مفتوح المصدر ومحايد للمورد لفهم تكاليف Kubernetes ودعم قدرتك على رؤية تكلفة AKS. يقوم بتصدير بيانات التكلفة التفصيلية بالإضافة إلى تسعير Azure الخاص بالعميل إلى تخزين Azure لمساعدة مسؤول نظام المجموعة في تحليل التكاليف وتصنيفها.

التميز التشغيلي

يشير التميز التشغيلي إلى العمليات المطلوبة للحفاظ على تشغيل الخدمة بشكل موثوق في الإنتاج. استخدم المعلومات التالية لتقليل المتطلبات التشغيلية لمراقبة مجموعات Kubernetes.

قائمة اختيار التصميم

  • راجع إرشادات مراقبة جميع طبقات بيئة Kubernetes الخاصة بك.
  • استخدم Kubernetes التي تدعم Azure Arc لمراقبة مجموعاتك خارج Azure.
  • استخدم خدمات Azure المدارة للأدوات الأصلية السحابية.
  • دمج مجموعات AKS في أدوات المراقبة الحالية.
  • استخدم نهج Azure لتمكين جمع البيانات من مجموعة Kubernetes.

توصيات التكوين

التوصية الميزة
راجع إرشادات مراقبة جميع طبقات بيئة Kubernetes الخاصة بك. مراقبة أداء مجموعة Kubernetes باستخدام نتائج تحليلات الحاوية يتضمن إرشادات وأفضل الممارسات لمراقبة بيئة Kubernetes بأكملها من طبقات الشبكة والكتلة والتطبيق.
استخدم Kubernetes التي تدعم Azure Arc لمراقبة مجموعاتك خارج Azure. يسمح Kubernetes الذي يدعم Azure Arc بمراقبة مجموعات Kubernetes التي تعمل في السحب الأخرى باستخدام نفس الأدوات مثل مجموعات AKS الخاصة بك، بما في ذلك نتائج تحليلات الحاوية والخدمة المدارة ل Azure Monitor ل Prometheus.
استخدم خدمات Azure المدارة للأدوات الأصلية السحابية. تدعم خدمة Azure Monitor المدارة ل Prometheus وAzure Managed Grafana جميع ميزات الأدوات الأصلية السحابية Prometheus وGrafana دون الحاجة إلى تشغيل بنيتها الأساسية. يمكنك توفير هذه الأدوات بسرعة وإلحاق مجموعات Kubernetes بأقل حمل. تسمح لك هذه الخدمات بالوصول إلى مكتبة واسعة من قواعد المجتمع ولوحات المعلومات لمراقبة بيئة Kubernetes الخاصة بك.
دمج مجموعات AKS في أدوات المراقبة الحالية. إذا كان لديك استثمار موجود في Prometheus وGrafana، فدمج مجموعات AKS والخدمات المدارة من Azure في بيئتك الحالية باستخدام الإرشادات في مراقبة مجموعات Kubernetes باستخدام خدمات Azure والأدوات الأصلية السحابية.
استخدم نهج Azure لتمكين جمع البيانات من مجموعة Kubernetes. استخدم نهج Azure لتمكين جمع البيانات لتمكين مقاييس Prometheus ونتائج تحليلات الحاوية وإعدادات التشخيص. وهذا يضمن مراقبة أي مجموعات جديدة تلقائيا وفرض تكوين المراقبة الخاصة بها.

كفاءة الأداء

كفاءة الأداء هي قدرة حمل عملك على تغيير الحجم لتلبية المطالب التي يضعها المستخدمون عليها بطريقة فعالة. استخدم المعلومات التالية لمراقبة أداء مجموعات Kubernetes والتأكد من تكوينها لتحقيق أقصى أداء.

قائمة اختيار التصميم

  • تمكين مجموعة من مقاييس Prometheus لمجموعتك.
  • تمكين نتائج تحليلات الحاوية لتعقب أداء نظام المجموعة.
  • تمكين تنبيهات Prometheus الموصى بها.

توصيات التكوين

التوصية الميزة
تمكين مجموعة من مقاييس Prometheus لمجموعتك. Prometheus هو حل مقاييس سحابية أصلية من Cloud Native Compute Foundation والأداة الأكثر شيوعا المستخدمة لجمع وتحليل البيانات القياسية من مجموعات Kubernetes. قم بتمكين Prometheus على مجموعتك باستخدام خدمة Azure Monitor المدارة ل Prometheus إذا لم يكن لديك بيئة Prometheus بالفعل. استخدم Azure Managed Grafana لتحليل بيانات Prometheus التي تم جمعها.

راجع تخصيص استخراج مقاييس Prometheus في خدمة Azure Monitor المدارة ل Prometheus لجمع مقاييس إضافية تتجاوز التكوين الافتراضي.
تمكين نتائج تحليلات الحاوية لتعقب أداء نظام المجموعة. عند تمكين نتائج تحليلات الحاوية لمجموعة Kubernetes الخاصة بك، يمكنك استخدام طرق العرض والمصنفات لتتبع أداء مكونات نظام المجموعة. قد تتداخل هذه البيانات مع البيانات التي تم جمعها بواسطة Prometheus. راجع تحسين التكلفة للحصول على توصيات تتعلق بالتكلفة.
تمكين تنبيهات Prometheus الموصى بها. تقوم التنبيهات في Azure Monitor بإعلامك بشكل استباقي عند اكتشاف المشكلات. ابدأ بمجموعة من قواعد تنبيه Prometheus الموصى بها التي تكتشف مشكلات التوفر والأداء الأكثر شيوعا مع مجموعتك. من المحتمل إضافة تنبيهات بحث السجل باستخدام البيانات التي تم جمعها بواسطة نتائج تحليلات الحاوية.

الخطوة التالية