مراقبة خدمة Azure Kubernetes (AKS)

إذا كان لديك تطبيقات وعمليات أعمال مهمة تعتمد على موارد Azure، فستريد مراقبة هذه الموارد لمعرفة مدى توفرها وأدائها وتشغيلها. توضح هذه المقالة بيانات المراقبة التي تم إنشاؤها بواسطة AKS وتحليلها باستخدام Azure Monitor. إذا كنت غير معتاد على ميزات Azure Monitor الشائعة في كافة خدمات Azure التي تستخدمها، فاقرأ مراقبة موارد Azure باستخدام Azure Monitor.

هام

Kubernetes هو نظام موزع معقد مع العديد من الأجزاء المتحركة لذلك يلزم المراقبة على مستويات متعددة. على الرغم من أن AKS هي خدمة Kubernetes مدارة، فإن نفس الصرامة حول المراقبة على مستويات متعددة لا تزال مطلوبة. توفر هذه المقالة معلومات عالية المستوى وأفضل الممارسات لمراقبة نظام مجموعة AKS. راجع ما يلي للحصول على تفاصيل إضافية.

مراقبة البيانات

تقوم AKS بإنشاء نفس أنواع بيانات المراقبة مثل موارد Azure الأخرى الموضحة في مراقبة البيانات من موارد Azure. راجع مراقبة مرجع بيانات AKS للحصول على معلومات مفصلة حول المقاييس والسجلات التي تم إنشاؤها بواسطة AKS. تجمع خدمات وميزات Azure الأخرى بيانات أخرى وتمكن خيارات التحليل الأخرى كما هو موضح في الرسم التخطيطي والجدول التاليين.

Diagram of collection of monitoring data from AKS.

المصدر ‏‏الوصف
قياسات النظام الأساسي يتم جمع مقاييس النظام الأساسي تلقائيا لمجموعات AKS دون أي تكلفة. يمكنك تحليل هذه المقاييس باستخدام مستكشف المقاييس أو استخدامها للتنبيهات القياسية.
مقاييس Prometheus عند تمكين استخراج المقاييس لنظام المجموعة الخاص بك، يتم تجميع مقاييس Prometheus بواسطة خدمة Azure Monitor المدارة ل Prometheus وتخزينها في مساحة عمل Azure Monitor. قم بتحليلها باستخدام لوحات معلومات تم إنشاؤها مسبقا في Azure Managed Grafana ومع تنبيهات Prometheus.
سجلات الأنشطة يتم جمع سجل النشاط تلقائيا لمجموعات AKS دون أي تكلفة. تتعقب هذه السجلات المعلومات مثل وقت إنشاء نظام مجموعة أو تغيير التكوين. أرسل سجل النشاط إلى مساحة عمل Log Analytics لتحليله مع بيانات السجل الأخرى.
سجلات الموارد يتم تنفيذ سجلات وحدة التحكم ل AKS كسجلات موارد. قم بإنشاء إعداد تشخيص لإرسالها إلى مساحة عمل Log Analytics حيث يمكنك تحليلها والتنبيه عليها باستخدام استعلامات السجل في Log Analytics.
نتائج تحليلات الحاوية تجمع نتائج تحليلات الحاوية سجلات وبيانات أداء مختلفة من مجموعة بما في ذلك تدفقات stdout/stderr وتخزنها في مساحة عمل Log Analytics ومقاييس Azure Monitor. قم بتحليل هذه البيانات باستخدام طرق العرض والمصنفات المضمنة مع نتائج تحليلات الحاوية أو مع مستكشف Log Analytics والمقاييس.

مراقبة صفحة نظرة عامة في مدخل Microsoft Azure

توفر علامة التبويب Monitoring في صفحة Overview طريقة سريعة للبدء في عرض بيانات المراقبة في مدخل Azure لكل نظام مجموعة AKS. يتضمن ذلك الرسوم البيانية مع المقاييس الشائعة للمجموعة مفصولة بتجمع عقدة. انقر على أي من هذه الرسوم البيانية لمزيد من التحليل للبيانات في مستكشف المقاييس.

تتضمن صفحة Overview أيضا ارتباطات إلى Managed Prometheus و Container insights للمجموعة الحالية. إذا لم تكن قد قمت بتمكين هذه الأدوات بالفعل، فستتم مطالبتك بذلك. قد ترى أيضا شعارا في أعلى الشاشة يوصي بتمكين ميزات أخرى لتحسين مراقبة نظام المجموعة.

Screenshot of AKS overview page.

تلميح

الوصول إلى ميزات المراقبة لجميع مجموعات AKS في اشتراكك من قائمة المراقبة في مدخل Microsoft Azure، أو لمجموعة AKS واحدة من قسم Monitor في قائمة خدمات Kubernetes.

‏‫عمليات تكامل‬

يمكن استخدام خدمات Azure التالية وميزات Azure Monitor للمراقبة الإضافية لمجموعات Kubernetes. يمكنك تمكين هذه الميزات أثناء إنشاء مجموعة AKS من علامة التبويب Integrations في مدخل Microsoft Azure أو Azure CLI أو Terraform أو Azure Policy أو إلحاق نظام المجموعة بها لاحقا. قد تتحمل كل من هذه الميزات تكلفة، لذا راجع معلومات التسعير لكل منها قبل تمكينها.

الخدمة / الميزة ‏‏الوصف
نتائج تحليلات الحاوية يستخدم إصدار حاوية من عامل Azure Monitor لجمع سجلات stdout/stderr وأحداث Kubernetes من كل عقدة في نظام المجموعة الخاص بك، ما يدعم مجموعة متنوعة من سيناريوهات المراقبة لمجموعات AKS. يمكنك تمكين المراقبة لمجموعة AKS عند إنشائها باستخدام Azure CLI أو Azure Policy أو مدخل Azure أو Terraform. إذا لم تقم بتمكين نتائج تحليلات الحاوية عند إنشاء نظام المجموعة الخاص بك، فشاهد تمكين نتائج تحليلات الحاوية لمجموعة Azure Kubernetes Service (AKS) للحصول على خيارات أخرى لتمكينها.

تخزن نتائج تحليلات الحاوية معظم بياناتها في مساحة عمل Log Analytics، وستستخدم عادة نفس مساحة عمل تحليلات السجل مثل سجلات الموارد لنظام مجموعتك. راجع تصميم بنية مساحة عمل Log Analytics للحصول على إرشادات حول عدد مساحات العمل التي يجب استخدامها ومكان تحديد موقعها.
خدمة Azure Monitor المدارة ل Prometheus Prometheus هو حل مقاييس سحابية أصلية من Cloud Native Compute Foundation والأداة الأكثر شيوعا المستخدمة لجمع وتحليل البيانات القياسية من مجموعات Kubernetes. خدمة Azure Monitor المدارة ل Prometheus هي حل مراقبة متوافق مع Prometheus مدار بالكامل في Azure. إذا لم تقم بتمكين Prometheus المدار عند إنشاء نظام المجموعة الخاص بك، فشاهد تجميع مقاييس Prometheus من مجموعة AKS للحصول على خيارات أخرى لتمكينها.

تقوم خدمة Azure Monitor المدارة ل Prometheus بتخزين بياناتها في مساحة عمل Azure Monitor، والتي ترتبط بمساحة عمل Grafana بحيث يمكنك تحليل البيانات باستخدام Azure Managed Grafana.
Azure Managed Grafana التنفيذ المدار بالكامل ل Grafana، وهو نظام أساسي لتصور البيانات مفتوح المصدر يستخدم عادة لتقديم بيانات Prometheus. تتوفر لوحات معلومات Grafana متعددة معرفة مسبقا لمراقبة Kubernetes واستكشاف الأخطاء وإصلاحها بالكامل. إذا لم تقم بتمكين Grafana المدارة عند إنشاء نظام المجموعة، فشاهد ربط تفاصيل مساحة عمل Grafana حول ربطها بمساحة عمل Azure Monitor حتى تتمكن من الوصول إلى مقاييس Prometheus لنظام المجموعة الخاص بك.

المقاييس

تلعب المقاييس دورا مهما في مراقبة نظام المجموعة، وتحديد المشكلات، وتحسين الأداء في مجموعات AKS. يتم التقاط مقاييس النظام الأساسي باستخدام خادم المقاييس الجاهزة المثبت في مساحة اسم نظام kube، والذي يقوم بشكل دوري بمسح المقاييس من جميع عقد Kubernetes التي يقدمها Kubelet. يجب عليك أيضا تمكين مقاييس Azure Managed Prometheus لجمع مقاييس الحاوية ومقاييس كائن Kubernetes، مثل حالة كائن عمليات التوزيع. راجع تجميع مقاييس Prometheus من مجموعة AKS لإرسال البيانات إلى خدمة Azure المدارة ل Prometheus.

Screenshot of enabling Managed Prometheus for existing cluster.

السجلات

وحدة تحكم AKS/سجلات الموارد

يتم تنفيذ سجلات وحدة التحكم لمجموعات AKS كسجلات موارد في Azure Monitor. لا يتم تجميع سجلات الموارد وتخزينها حتى تقوم بإنشاء إعداد تشخيص لتوجيهها إلى موقع واحد أو أكثر. سترسلها عادة إلى مساحة عمل Log Analytics، حيث يتم تخزين معظم بيانات نتائج تحليلات الحاوية.

راجع إنشاء إعدادات تشخيص للعملية التفصيلية لإنشاء إعداد تشخيص باستخدام مدخل Microsoft Azure أو CLI أو PowerShell. عند إنشاء إعداد تشخيص، فإنك تحدد فئات السجلات المراد تجميعها. يتم سرد فئات AKS في مرجع بيانات مراقبة AKS.

هام

يمكن أن تكون هناك تكلفة كبيرة عند جمع سجلات الموارد ل AKS، خاصة لسجلات تدقيق kube. ضع في اعتبارك التوصيات التالية لتقليل كمية البيانات التي تم جمعها:

  • تعطيل تسجيل تدقيق kube عند عدم الحاجة.
  • تمكين المجموعة من kube-audit-admin، والذي يستبعد أحداث تدقيق الحصول على قائمة و.
  • تمكين السجلات الخاصة بالموارد كما هو موضح أدناه وتكوين AKSAudit الجدول كسجلات أساسية.

راجع مراقبة مجموعات Kubernetes باستخدام خدمات Azure والأدوات الأصلية السحابية لمزيد من التوصيات وتحسين التكلفة وAzure Monitor لمزيد من الاستراتيجيات لتقليل تكاليف المراقبة.

Screenshot of AKS diagnostic setting dialog box.

يدعم AKS إما وضع تشخيص Azure أو الوضع الخاص بالموارد لسجلات الموارد. يحدد هذا الجداول في مساحة عمل Log Analytics حيث يتم إرسال البيانات. يرسل وضع تشخيص Azure جميع البيانات إلى جدول AzureDiagnostics، بينما يرسل الوضع الخاص بالموارد البيانات إلى AKS Audit وAKS Audit مسؤول وAKS Control Plane كما هو موضح في الجدول في سجلات الموارد.

يوصى بوضع خاص بالموارد ل AKS للأسباب التالية:

  • من الأسهل الاستعلام عن البيانات لأنها موجودة في جداول فردية مخصصة ل AKS.
  • يدعم التكوين كسجلات أساسية لتحقيق وفورات كبيرة في التكاليف.

لمزيد من المعلومات حول الفرق بين أوضاع المجموعة بما في ذلك كيفية تغيير إعداد موجود، راجع تحديد وضع المجموعة.

إشعار

لا تتوفر القدرة على تحديد وضع المجموعة في مدخل Microsoft Azure في جميع المناطق حتى الآن. بالنسبة للمناطق التي لم يتوفر فيها بعد، استخدم CLI لإنشاء إعداد التشخيص باستخدام أمر مثل ما يلي:

az monitor diagnostic-settings create --name AKS-Diagnostics --resource /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourceGroups/myresourcegroup/providers/Microsoft.ContainerService/managedClusters/my-cluster --logs '[{""category"": ""kube-audit"",""enabled"": true}, {""category"": ""kube-audit-admin"", ""enabled"": true}, {""category"": ""kube-apiserver"", ""enabled"": true}, {""category"": ""kube-controller-manager"", ""enabled"": true}, {""category"": ""kube-scheduler"", ""enabled"": true}, {""category"": ""cluster-autoscaler"", ""enabled"": true}, {""category"": ""cloud-controller-manager"", ""enabled"": true}, {""category"": ""guard"", ""enabled"": true}, {""category"": ""csi-azuredisk-controller"", ""enabled"": true}, {""category"": ""csi-azurefile-controller"", ""enabled"": true}, {""category"": ""csi-snapshot-controller"", ""enabled"": true}]'  --workspace /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourcegroups/myresourcegroup/providers/microsoft.operationalinsights/workspaces/myworkspace --export-to-resource-specific true

نموذج سجل العينة

هام

عند تحديد Logs من القائمة لمجموعة AKS، يتم فتح Log Analytics مع تعيين نطاق الاستعلام إلى نظام المجموعة الحالي. وهذا يعني أن استعلامات السجل سوف تتضمن بيانات من هذا المورد فقط. إذا كنت ترغب في تشغيل استعلام يتضمن بيانات من مجموعات أو بيانات أخرى من خدمات Azure الأخرى، فحدد Logs من قائمة Azure Monitor . راجع نطاق الاستعلام عن السجل والزمن في Azure Monitor Log Analytics للحصول على التفاصيل.

إذا كان إعداد التشخيص لنظام المجموعة يستخدم وضع تشخيص Azure، يتم تخزين سجلات الموارد ل AKS في جدول AzureDiagnostics. يمكنك تمييز السجلات المختلفة باستخدام عمود الفئة. للحصول على وصف لكل فئة، راجع سجلات الموارد المرجعية لـ AKS.

‏‏الوصف الاستعلام عن السجل
عدد السجلات لكل فئة
(وضع تشخيص Azure)
AzureDiagnostics
| حيث ResourceType == "MANAGEDCLUSTERS"
| تلخيص count() حسب الفئة
جميع سجلات خادم واجهة برمجة التطبيقات
(وضع تشخيص Azure)
AzureDiagnostics
| where Category == "kube-apiserver"
جميع سجلات تدقيق kube في نطاق زمني
(وضع تشخيص Azure)
let starttime = datetime("2023-02-23");
let endtime = datetime("2023-02-24");
AzureDiagnostics
| حيث TimeGenerated بين(وقت البدء.. وقت الانتهاء)
| where Category == "kube-audit"
| توسيع الحدث = parse_json (log_s)
| توسيع HttpMethod = tostring(event.verb)
| توسيع المستخدم = tostring(event.user.username)
| توسيع Apiserver = pod_s
| توسيع SourceIP = tostring(event.sourceIPs[0])
| Project TimeGenerated, Category, HttpMethod, User, Apiserver, SourceIP, OperationName, event
كافة سجلات التدقيق
(وضع خاص بالموارد)
AKSAudit
جميع سجلات التدقيق باستثناء أحداث تدقيق الحصول على قائمة
(وضع خاص بالموارد)
AKSAudit مسؤول
جميع سجلات خادم واجهة برمجة التطبيقات
(وضع خاص بالموارد)
AKSControlPlane
| where Category == "kube-apiserver"

للوصول إلى مجموعة من الاستعلامات التي تم إنشاؤها مسبقا في مساحة عمل Log Analytics، راجع واجهة استعلامات Log Analytics وحدد نوع المورد Kubernetes Services. للحصول على قائمة بالاستعلامات الشائعة لرؤى الحاوية، راجع استعلامات نتائج تحليلات الحاوية.

وحدة بيانات AKS/سجلات نتائج تحليلات الحاوية

تجمع Container Insights أنواعا مختلفة من بيانات تتبع الاستخدام من الحاويات ومجموعات Kubernetes لمساعدتك في مراقبة واستكشاف الأخطاء وإصلاحها والحصول على رؤى حول التطبيقات الحاوية التي تعمل في مجموعات AKS الخاصة بك. للحصول على قائمة بالجداول والأوصاف التفصيلية الخاصة بها التي تستخدمها نتيجة تحليلات الحاوية، راجع مرجع جدول Azure Monitor. تتوفر كل هذه الجداول للاستعلامات الخاصة بالسجل.

تسمح لك إعدادات تحسين التكلفة بتخصيص بيانات المقاييس التي تم جمعها من خلال عامل نتائج تحليلات الحاوية والتحكم فيها. تدعم هذه الميزة إعدادات جمع البيانات لتحديد الجدول الفردي والفواصل الزمنية لجمع البيانات ومساحات الأسماء لاستبعاد جمع البيانات من خلال قواعد تجميع بيانات Azure Monitor (DCR). تتحكم هذه الإعدادات في حجم الاستيعاب وتقلل من تكاليف مراقبة نتائج تحليلات الحاوية. يمكن تخصيص نتائج تحليلات الحاوية البيانات المجمعة من خلال مدخل Microsoft Azure، باستخدام الخيارات التالية. يؤدي تحديد أي خيارات أخرى غير الكل (الافتراضي) إلى عدم توفر تجربة نتائج تحليلات الحاوية.

التجميع الجداول ملاحظات
الكل (افتراضي) جميع جداول نتائج تحليلات الحاوية القياسية مطلوب لتمكين مرئيات نتائج تحليلات الحاوية الافتراضية
الأداء Perf و InsightsMetrics
السجلات والأحداث ContainerLog أو ContainerLogV2، KubeEvents، KubePodInventory يوصى به إذا قمت بتمكين مقاييس Prometheus المدارة
أحمال العمل والنشرات وHPAs InsightsMetrics، KubePodInventory، KubeEvents، ContainerInventory، ContainerNodeInventory، KubeNodeInventory، KubeServices
وحدات التخزين الثابتة InsightsMetrics، KubePVInventory

Screenshot of AKS data plane logs collection configuration page.

يلتقط تجميع السجلات والأحداث السجلات من ContainerLog أو ContainerLogV2 وKubeEvents وجداول KubePodInventory، ولكن ليس المقاييس. المسار الموصى به لجمع المقاييس هو تمكين خدمة Azure Monitor المدارة Prometheus ل Prometheus من مجموعة AKS الخاصة بك واستخدام Azure Managed Grafana لتصور البيانات. لمزيد من المعلومات، راجع إدارة مساحة عمل Azure Monitor.

مخطط ContainerLogV2

يوفر Azure Monitor Container Insights مخططا لسجلات الحاوية المعروفة باسم ContainerLogV2، وهو الخيار الموصى به. يتضمن هذا التنسيق الحقول التالية لتسهيل الاستعلامات الشائعة لعرض البيانات المتعلقة ب AKS ومجموعات Kubernetes الممكنة في Azure Arc:

  • ContainerName
  • PodName
  • PodNamespace

بالإضافة إلى ذلك، يتوافق هذا المخطط مع خطة بيانات السجلات الأساسية، والتي توفر بديلا منخفض التكلفة لسجلات التحليلات القياسية. تتيح لك خطة بيانات السجل الأساسية توفير تكلفة استيعاب السجلات المطولة عالية الحجم وتخزينها في مساحة عمل Log Analytics لتصحيح الأخطاء واستكشاف الأخطاء وإصلاحها والتدقيق، ولكن ليس للتحليليات والتنبيهات. لمزيد من المعلومات، راجع إدارة الجداول في مساحة عمل Log Analytics. ContainerLogV2 هو النهج الموصى به وهو المخطط الافتراضي للعملاء الذين يبنون نتائج تحليلات الحاوية باستخدام مصادقة الهوية المدارة باستخدام ARM وBicep وTerraform والنهج ومدخل Azure. لمزيد من المعلومات حول كيفية تمكين ContainerLogV2 إما من خلال قاعدة تجميع البيانات (DCR) الخاصة بالمجموعة أو ConfigMap، راجع تمكين مخطط ContainerLogV2.

الرسوم المرئية

يعد تصور البيانات مفهوما أساسيا يسهل على مسؤولي النظام والمهندسين التشغيليين استهلاك المعلومات المجمعة. بدلا من النظر إلى البيانات الأولية، يمكنهم استخدام التمثيلات المرئية، التي تعرض البيانات بسرعة وتكشف عن الاتجاهات التي قد تكون مخفية عند النظر إلى البيانات الأولية. يمكنك استخدام لوحات معلومات Grafana أو مصنفات Azure الأصلية لتصور البيانات.

Azure Managed Grafana

الطريقة الأكثر شيوعا لتحليل بيانات Prometheus وتقديمها هي باستخدام لوحة معلومات Grafana. يتضمن Azure Managed Grafana لوحات معلومات تم إنشاؤها مسبقا لمراقبة مجموعات Kubernetes بما في ذلك العديد من المعلومات التي تقدم معلومات مشابهة مثل طرق عرض نتائج تحليلات الحاوية. هناك أيضا العديد من لوحات المعلومات التي أنشأها المجتمع لتصور جوانب متعددة من مجموعة Kubernetes من المقاييس التي تم جمعها بواسطة Prometheus.

Screenshot of Grafana.

مصنفات

مصنفات Azure Monitor هي ميزة في Azure Monitor توفر لوحة مرنة لتحليل البيانات وإنشاء تقارير مرئية غنية. تساعدك المصنفات على إنشاء تقارير مرئية تساعد في تحليل البيانات. يوصى بالتقارير في نتائج تحليلات الحاوية خارج الصندوق لمصنفات Azure. يوفر Azure مصنفات مضمنة لكل خدمة، بما في ذلك Azure Kubernetes Service (AKS)، والتي يمكنك الوصول إليها من مدخل Microsoft Azure. في قائمة Azure Monitor في مدخل Microsoft Azure، حدد Containers. في قسم Monitoring، حدد Insights، واختر مجموعة معينة، ثم حدد علامة التبويب Reports. يمكنك أيضا عرضها من معرض المصنفات في Azure Monitor.

على سبيل المثال، يوفر مصنف تحسين نظام المجموعة محللات متعددة تمنحك عرضا سريعا لصحة وأداء مجموعة Kubernetes. يحتوي على محللات متعددة يوفر كل منها معلومات مختلفة تتعلق بالمجموعة الخاصة بك. لا يتطلب المصنف أي تكوين بمجرد تمكين نتائج تحليلات الحاوية على نظام المجموعة. تتضمن القدرات البارزة القدرة على الكشف عن فشل فحص الحياة وتردداتها، وتحديد وتجميع الحالات الشاذة للأحداث التي تشير إلى الزيادات الأخيرة في حجم الحدث للتحليل الذي يمكن الوصول إليه بشكل أكبر، وتحديد الحاويات ذات حدود وطلبات وحدة المعالجة المركزية والذاكرة العالية أو المنخفضة، بالإضافة إلى الحد المقترح وقيم الطلب لهذه الحاويات التي تعمل في مجموعات AKS. لمزيد من المعلومات حول هذه المصنفات، راجع التقارير في نتائج تحليلات الحاوية.

التنبيهات

تساعدك تنبيهات Azure Monitor على اكتشاف المشكلات ومعالجتها قبل أن يلاحظها المستخدمون من خلال إعلامك بشكل استباقي عندما تشير بيانات Azure Monitor المجمعة إلى أنه قد تكون هناك مشكلة في البنية الأساسية السحابية أو التطبيق. فهي تسمح لك بتحديد المشكلات ومعالجتها في نظامك قبل أن يلاحظها عملاؤك. يمكنك تعيين التنبيهات على القياسات، السجلات، سجل النشاط. أنواع التنبيهات المختلفة لها مزايا وعيوب.

هناك نوعان من قواعد القياس المستخدمة من قبل نتائج تحليلات الحاوية استنادا إلى مقاييس Prometheus أو مقاييس النظام الأساسي.

تنبيهات تستند إلى مقاييس Prometheus

عند تمكين مجموعة من مقاييس Prometheus لمجموعتك، يمكنك تنزيل مجموعة من قواعد تنبيه Prometheus الموصى بها. يتضمن ذلك القواعد التالية:

المستوى التنبيهات
مستوى الجراب KubePodCrashLooping
لم تكتمل المهمة في الوقت المناسب
تمت إعادة تشغيل حاوية الجراب في آخر ساعة واحدة
الحالة الجاهزة للجرابات أقل من 80٪
عدد الحجيرات في الحالة الفاشلة أكبر من 0
KubePodNotReadyByController
KubeStatefulSetGenerationMismatch
KubeJobNotCompleted
KubeJobFailed
متوسط استخدام وحدة المعالجة المركزية لكل حاوية أكبر من 95٪
متوسط استخدام الذاكرة لكل حاوية أكبر من 95٪
KubeletPodStartUpLatencyHigh
مستوى نظام المجموعة متوسط استخدام PV أكبر من 80٪
KubeDeploymentReplicasMismatch
KubeStatefulSetReplicasMismatch
KubeHpaReplicasMismatch
KubeHpaMaxedOut
KubeCPUQuotaOvercommit
KubeMemoryQuotaOvercommit
KubeVersionMismatch
KubeClientErrors
CPUThrottlingHigh
KubePersistentVolumeFillingUp
KubePersistentVolumeInodesFillingUp
KubePersistentVolumeErrors
مستوى العقدة متوسط استخدام وحدة المعالجة المركزية للعقدة أكبر من 80٪
ذاكرة مجموعة العمل لعقدة أكبر من 80٪
عدد حاويات OOM التي تم إيقافها أكبر من 0
KubeNodeUnreachable
KubeNodeNotReady
KubeNodeReadinessFlapping
KubeContainerWaiting
KubeDaemonSetNotScheduled
KubeDaemonSetMisScheduled
KubeletPlegDurationHigh
KubeletServerCertificateExpiration
KubeletClientCertificateRenewalErrors
KubeletServerCertificateRenewalErrors
KubeQuotaAlmostFull
KubeQuotaFullyUsed
KubeQuotaExceed

التنبيهات المستندة إلى قياس النظام الأساسي

يسرد الجدول التالي قواعد التنبيه القياسي الموصى بها لمجموعات AKS. تستند هذه التنبيهات إلى مقاييس النظام الأساسي للمجموعة.

شرط ‏‏الوصف
النسبة المئوية > لاستخدام وحدة المعالجة المركزية 95 يتم إطلاقه عندما يتجاوز متوسط استخدام وحدة المعالجة المركزية عبر جميع العقد الحد.
النسبة المئوية > لمجموعة عمل الذاكرة 100 يتم إطلاقه عندما يتجاوز متوسط مجموعة العمل عبر جميع العقد الحد.

التنبيهات المستندة إلى السجل

تسمح لك تنبيهات السجل بالتنبيه على مستوى البيانات وسجلات وحدة التحكم. تشغيل الاستعلامات على فترات محددة مسبقا وإنشاء تنبيه استنادا إلى النتائج. يمكنك التحقق من عدد سجلات معينة أو إجراء عمليات حسابية استنادا إلى الأعمدة الرقمية.

راجع كيفية إنشاء تنبيهات السجل من Container Insights وكيفية الاستعلام عن السجلات من Container Insights. يمكن لتنبيهات السجل قياس أمرين مختلفين، يمكن استخدامهما للمراقبة في سيناريوهات مختلفة:

  • عدد النتائج: حساب عدد الصفوف التي تم إرجاعها بواسطة الاستعلام ويمكن استخدامها للعمل مع أحداث مثل سجلات أحداث Windows وSyslog واستثناءات التطبيق.
  • حساب قيمة: إجراء عملية حسابية استنادا إلى عمود رقمي ويمكن استخدامها لتضمين أي عدد من الموارد. مثال على ذلك هو النسبة المئوية لوحدة المعالجة المركزية.

اعتمادا على سيناريو التنبيه المطلوب، يجب إنشاء استعلامات السجل لمقارنة DateTime بالوقت الحالي باستخدام now عامل التشغيل والعودة ساعة واحدة. لمعرفة كيفية إنشاء تنبيهات تستند إلى السجل، راجع إنشاء تنبيهات السجل من نتائج تحليلات الحاوية.

إمكانية مراقبة الشبكة

تعد إمكانية مراقبة الشبكة جزءا مهما من الحفاظ على مجموعة Kubernetes سليمة وأداء. من خلال جمع البيانات وتحليلها حول حركة مرور الشبكة، يمكنك الحصول على رؤى حول كيفية تشغيل نظام المجموعة وتحديد المشكلات المحتملة قبل أن تتسبب في انقطاعات أو تدهور في الأداء.

عند تمكين الوظيفة الإضافية Network Observability، فإنه يجمع ويحول المقاييس المفيدة إلى تنسيق Prometheus، والذي يمكن تصوره في Grafana. عند التمكين، يتم استيعاب المقاييس المجمعة تلقائيا في خدمة Azure Monitor المدارة ل Prometheus. تتوفر لوحة معلومات Grafana في مستودع لوحة معلومات Grafana العامة لتصور مقاييس مراقبة الشبكة التي تم جمعها بواسطة Prometheus. لمزيد من المعلومات، راجع إعداد مراقبة الشبكة للحصول على إرشادات مفصلة.

الخطوات التالية

  • راجع مراقبة مرجع بيانات AKS للحصول على مرجع القياسات والسجلات والقيم المهمة الأخرى التي تم إنشاؤها بواسطة AKS.