نعترف بحدوث حالات الفشل في السحابة. وبدلاً من محاولة منع الفشل تماماً، فإن الهدف هو الحد من آثار مكون فاشل واحد. استخدم المعلومات التالية لمراقبة الأجهزة الظاهرية وأحمال عمل العميل الخاصة بهم للفشل.
توضح هذه المقالة الموثوقية ل Azure Monitor كجزء من Azure Well-Architected Framework. إطار عمل Azure Well-Architected هو مجموعة من المبادئ التوجيهية التي يمكن استخدامها لتحسين جودة حمل العمل. يتكون الإطار من خمس ركائز للتميز الهيكلي:
الموثوقيه
الأمان
تحسين التكلفة
التميز التشغيلي
كفاءة الأداء
سجلات Azure Monitor
توفر مساحات عمل Log Analytics درجة عالية من الموثوقية. يتحقق مسار الاستيعاب، الذي يرسل البيانات المجمعة إلى مساحة عمل Log Analytics، من أن مساحة عمل Log Analytics تعالج كل سجل سجل بنجاح قبل أن تزيل السجل من الأنابيب. إذا لم يكن مسار الاستيعاب متوفرا، فإن العوامل التي ترسل المخزن المؤقت للبيانات وتعيد محاولة إرسال السجلات لعدة ساعات.
ميزات Azure Monitor Logs التي تعزز المرونة
توفر سجلات Azure Monitor العديد من الميزات التي تعزز مرونة مساحات العمل مع أنواع مختلفة من المشكلات. يمكنك استخدام هذه الميزات بشكل فردي أو مجتمعة، اعتمادا على احتياجاتك.
يوفر هذا الفيديو نظرة عامة على خيارات الموثوقية والمرونة المتوفرة لمساحات عمل Log Analytics:
الحماية داخل المنطقة باستخدام مناطق التوفر
تحتوي كل منطقة Azure تدعم مناطق التوفر على مجموعة من مراكز البيانات المجهزة ببنية أساسية مستقلة للطاقة والتبريد والشبكات.
مناطق توفر سجلات Azure Monitor زائدة عن الحاجة، ما يعني أن Microsoft تنشر طلبات الخدمة وتنسخ البيانات عبر مناطق مختلفة في المناطق المدعومة. إذا كان الحدث يؤثر على منطقة واحدة، تستخدم Microsoft منطقة توفر مختلفة في المنطقة بدلا من ذلك، تلقائيا. لا تحتاج إلى اتخاذ أي إجراء لأن التبديل بين المناطق سلس.
في معظم المناطق، تدعم مناطق توفر سجلات Azure Monitor مرونة البيانات، ما يعني أن بياناتك المخزنة محمية من فقدان البيانات المتعلقة بحالات الفشل في المناطق، ولكن قد لا تزال عمليات الخدمة تتأثر بالحوادث الإقليمية. إذا كانت الخدمة غير قادرة على تشغيل الاستعلامات، فلا يمكنك عرض السجلات حتى يتم حل المشكلة.
تدعم مجموعة فرعية من مناطق التوفر التي تدعم مرونة البيانات أيضا مرونة الخدمة، ما يعني أن عمليات خدمة Azure Monitor Logs - على سبيل المثال، استيعاب السجل والاستعلامات والتنبيهات - يمكن أن تستمر في حالة فشل المنطقة.
تحمي مناطق التوفر من الحوادث المتعلقة بالبنية الأساسية، مثل فشل التخزين. فهي لا تحمي من المشكلات على مستوى التطبيق، مثل عمليات نشر التعليمات البرمجية الخاطئة أو فشل الشهادات، والتي تؤثر على المنطقة بأكملها.
النسخ الاحتياطي للبيانات من جداول معينة باستخدام التصدير المستمر
يجب أن يكون حساب التخزين الذي تقوم بتصدير البيانات إليه في نفس منطقة مساحة عمل Log Analytics. لحماية السجلات التي تم استيعابها والوصول إليها، حتى إذا كانت منطقة مساحة العمل معطلة، استخدم حساب تخزين متكرر جغرافيا، كما هو موضح في توصيات التكوين.
لا توفر آلية التصدير الحماية من الحوادث التي تؤثر على مسار الاستيعاب أو عملية التصدير نفسها.
ملاحظة
يمكنك الوصول إلى البيانات في حساب تخزين من سجلات Azure Monitor باستخدام عامل تشغيل البيانات الخارجية. ومع ذلك، يتم تخزين البيانات المصدرة في الكائنات الثنائية كبيرة الحجم لمدة خمس دقائق ويمكن أن يكون تحليل البيانات التي تمتد على الكائنات الثنائية كبيرة الحجم المتعددة مرهقا. لذلك، يعد تصدير البيانات إلى حساب تخزين آلية نسخ احتياطي جيدة للبيانات، ولكن وجود البيانات التي تم نسخها احتياطيا في حساب تخزين ليس مثاليا إذا كنت بحاجة إليها للتحليل في سجلات Azure Monitor. يمكنك الاستعلام عن كميات كبيرة من بيانات الكائن الثنائي كبير الحجم باستخدام Azure Data Explorer أو Azure Data Factory أو أي أداة وصول تخزين أخرى.
حماية البيانات عبر المناطق ومرونة الخدمة باستخدام النسخ المتماثل لمساحة العمل (معاينة)
النسخ المتماثل لمساحة العمل (معاينة) هو الحل الأكثر اتساعا للمرونة لأنه ينسخ مساحة عمل Log Analytics والسجلات الواردة إلى منطقة أخرى.
يحمي النسخ المتماثل لمساحة العمل كلا من سجلاتك وعمليات الخدمة، ويسمح لك بمتابعة مراقبة أنظمتك في حالة حدوث أحداث متعلقة بالبنية الأساسية أو التطبيقات على مستوى المنطقة.
على النقيض من مناطق التوفر، التي تديرها Microsoft من طرف إلى طرف، تحتاج إلى مراقبة صحة مساحة العمل الأساسية وتحديد وقت التبديل إلى مساحة العمل في المنطقة الثانوية والعودة.
قائمة اختيار التصميم
لضمان مرونة الخدمة والبيانات في مواجهة الحوادث على مستوى المنطقة، قم بتمكين النسخ المتماثل لمساحة العمل.
لضمان الحماية داخل المنطقة من فشل مركز البيانات، قم بإنشاء مساحة العمل الخاصة بك في منطقة تدعم مناطق التوفر.
للنسخ الاحتياطي عبر المناطق للبيانات في جداول معينة، استخدم ميزة التصدير المستمر لإرسال البيانات إلى حساب تخزين منسوخ جغرافيا.
مراقبة صحة مساحات عمل Log Analytics.
توصيات التكوين
التوصية
الميزة
لضمان أكبر درجة من المرونة، قم بتمكين النسخ المتماثل لمساحة العمل.
المرونة عبر المناطق لبيانات مساحة العمل وعمليات الخدمة.
عند الحاجة، قم بالتبديل إلى مساحة العمل الثانوية حتى يتم حل المشكلات التي تؤثر على مساحة العمل الأساسية. يمكنك متابعة استيعاب السجلات والاستعلام عن البيانات واستخدام لوحات المعلومات والتنبيهات و Sentinel في مساحة العمل الثانوية. يمكنك أيضا الوصول إلى السجلات التي تم تناولها قبل تبديل المنطقة.
هذه ميزة مدفوعة، لذا ضع في اعتبارك ما إذا كنت تريد نسخ جميع السجلات الواردة، أو بعض تدفقات البيانات فقط.
إذا كان ذلك ممكنا، قم بإنشاء مساحة العمل الخاصة بك في منطقة تدعم مرونة خدمة Azure Monitor.
المرونة داخل المنطقة لبيانات مساحة العمل وعمليات الخدمة في حالة حدوث مشكلات في مركز البيانات.
تدعم مناطق التوفر التي تدعم مرونة الخدمة أيضا مرونة البيانات. وهذا يعني أنه حتى إذا أصبح مركز البيانات بأكمله غير متوفر، فإن التكرار بين المناطق يسمح لعمليات خدمة Azure Monitor، مثل الاستيعاب والاستعلام، بمتابعة العمل، وتظل السجلات التي تم استيعابها متوفرة.
توفر مناطق التوفر حماية داخل المنطقة، ولكنها لا تحمي من المشكلات التي تؤثر على المنطقة بأكملها.
إنشاء مساحة العمل الخاصة بك في منطقة تدعم مرونة البيانات.
الحماية داخل المنطقة من فقدان السجلات في مساحة العمل الخاصة بك في حالة حدوث مشكلات في مركز البيانات.
يعني إنشاء مساحة العمل الخاصة بك في منطقة تدعم مرونة البيانات أنه حتى إذا أصبح مركز البيانات بأكمله غير متوفر، فإن السجلات التي تم استيعابها آمنة. إذا كانت الخدمة غير قادرة على تشغيل الاستعلامات، فلا يمكنك عرض السجلات حتى يتم حل المشكلة.
تكوين تصدير البيانات من جداول معينة إلى حساب تخزين يتم نسخه نسخا متماثلا عبر المناطق.
الاحتفاظ بنسخة احتياطية من بيانات السجل في منطقة مختلفة.
تسمح لك ميزة تصدير البيانات في Azure Monitor بتصدير البيانات المرسلة باستمرار إلى جداول معينة إلى تخزين Azure حيث يمكن الاحتفاظ بها لفترات طويلة. استخدم حساب التخزين المتكرر جغرافيا (GRS) أو التخزين المتكرر للمنطقة الجغرافية (GZRS) للحفاظ على أمان بياناتك حتى إذا أصبحت منطقة بأكملها غير متوفرة. لجعل بياناتك قابلة للقراءة من المناطق الأخرى، قم بتكوين حساب التخزين الخاص بك للوصول للقراءة إلى المنطقة الثانوية. لمزيد من المعلومات، راجع تكرار تخزين Azure على منطقة ثانوية ووصول قراءة Azure Storage إلى البيانات في المنطقة الثانوية.
بالنسبة للجداول التي لا تدعم تصدير البيانات المستمر، يمكنك استخدام أساليب أخرى لتصدير البيانات، بما في ذلك Logic Apps، لحماية بياناتك. هذا هو في المقام الأول حل لتلبية التوافق للاحتفاظ بالبيانات حيث يمكن أن يكون من الصعب تحليل البيانات واستعادتها إلى مساحة العمل.
تصدير البيانات عرضة للحوادث الإقليمية لأنه يعتمد على استقرار البنية الأساسية لبرنامج ربط العمليات التجارية لاستيعاب Azure Monitor في منطقتك. لا يوفر مرونة ضد الحوادث التي تؤثر على مسار الاستيعاب الإقليمي.
مراقبة صحة مساحات عمل Log Analytics.
استخدم تحليلات مساحة عمل Log Analytics لتعقب الاستعلامات الفاشلة وإنشاء تنبيه الحالة الصحية لإعلامك بشكل استباقي إذا أصبحت مساحة العمل غير متوفرة بسبب فشل مركز بيانات أو إقليمي.
مقارنة ميزات مرونة سجلات Azure Monitor
ميزة
مرونة الخدمة
النسخ الاحتياطي للبيانات
التوافر العالي
نطاق الحماية
الإعداد
التكلفة
النسخ المتماثل لمساحة العمل
✅
✅
✅
الحماية عبر المناطق من الحوادث على مستوى المنطقة
تمكين النسخ المتماثل لمساحة العمل وقواعد جمع البيانات ذات الصلة. التبديل بين المناطق حسب الحاجة.
استنادا إلى عدد GBs المنسوخة نسخا متماثلا والمنطقة.
مجموعات التوافر
✅ في المناطق المدعومة
✅
✅
الحماية داخل المنطقة من مشكلات مركز البيانات
تمكين تلقائيا في المناطق المدعومة.
بلا تكلفة
تصدير البيانات المستمر
✅
الحماية من فقدان البيانات بسبب فشل إقليمي 1
تمكين لكل جدول.
تكلفة تصدير البيانات + كائن ثنائي كبير الحجم للتخزين أو مراكز الأحداث
1 يوفر تصدير البيانات حماية عبر المناطق إذا قمت بتصدير السجلات إلى حساب تخزين منسوخ جغرافيا. في حالة وقوع حادث، يتم نسخ البيانات المصدرة مسبقا احتياطيا ومتاحة بسهولة؛ ومع ذلك، قد تفشل عملية تصدير أخرى، اعتمادا على طبيعة الحادث.
التنبيهات
توفر تنبيهات Azure Monitor درجة عالية من الموثوقية دون أي قرارات تصميم. غالبا ما يتم تخفيف الحالات التي قد يحدث فيها فقدان مؤقت لبيانات التنبيه من خلال ميزات مكونات Azure Monitor الأخرى.
قائمة اختيار التصميم
تكوين قواعد تنبيه صحة الخدمة.
تكوين قواعد تنبيه صحة الموارد.
تجنب حدود الخدمة لقواعد التنبيه التي تنتج إعلامات واسعة النطاق.
توصيات التكوين
التوصية
الميزة
تكوين قواعد تنبيه صحة الخدمة.
ترسل لك تنبيهات حالة الخدمة إعلامات بالانقطاعات، وتعطل الخدمة، والصيانة المخطط لها، والنصائح الأمنية. راجع إنشاء قاعدة تنبيه أو تحريرها.
تكوين قواعد تنبيه صحة الموارد.
يمكن لتنبيهات صحة الموارد إعلامك في الوقت الفعلي تقريبا عندما يكون لهذه الموارد تغيير في حالتها الصحية. راجع إنشاء قاعدة تنبيه أو تحريرها.
تجنب حدود الخدمة لقواعد التنبيه التي تنتج إعلامات واسعة النطاق.
إذا كانت لديك قواعد تنبيه قد ترسل عددا كبيرا من الإعلامات، فقد تصل إلى حدود الخدمة للخدمة التي تستخدمها لإرسال رسائل البريد الإلكتروني أو إعلامات الرسائل القصيرة. تكوين الإجراءات البرمجية أو اختيار أسلوب إعلام بديل أو موفر للتعامل مع الإعلامات واسعة النطاق. راجع حدود الخدمة للإعلامات.
الأجهزة الظاهرية
قائمة اختيار التصميم
إنشاء قواعد تنبيه التوفر لأجهزة Azure الظاهرية.
إنشاء قاعدة تنبيه رسالة كشف أخطاء الاتصال للعامل للتحقق من صحة العامل.
تكوين جمع البيانات والتنبيه لمراقبة موثوقية سير عمل العميل.
توصيات التكوين
التوصية
الوصف
إنشاء قواعد تنبيه التوفر لأجهزة Azure الظاهرية.
استخدم مقياس التوفر (معاينة) لتعقب وقت تشغيل جهاز Azure الظاهري. بينما يمكنك تمكين قاعدة تنبيه التوفر بسرعة لجهاز فردي باستخدام التنبيهات الموصى بها، فإن قاعدة تنبيه واحدة تستهدف مجموعة موارد أو اشتراك تمكن تنبيه التوفر لجميع الأجهزة الظاهرية في هذا النطاق لمنطقة معينة. هذا أسهل في الإدارة من إنشاء قاعدة تنبيه لكل جهاز ظاهري ويضمن مراقبة أي أجهزة ظاهرية جديدة تم إنشاؤها في النطاق تلقائيا. لا تتطلب قاعدة التنبيه هذه تثبيت عامل Azure Monitor على الجهاز الظاهري، ولكنها غير متوفرة للأجهزة الظاهرية خارج Azure.
إنشاء قاعدة تنبيه رسالة كشف أخطاء الاتصال للعامل للتحقق من صحة العامل.
يرسل عامل Azure Monitor رسالة كشف أخطاء الاتصال إلى مساحة عمل Log Analytics كل دقيقة. استخدم قاعدة تنبيه بحث السجل باستخدام رسالة كشف أخطاء الاتصال للعامل ليتم تنبيهه عندما يتوقف العامل عن إرسال رسالة كشف أخطاء الاتصال، وهو مؤشر على أن الجهاز الظاهري متوقف عن التشغيل أو أن العامل غير سليم ولا تتم مراقبة أحمال عمل العميل. تتطلب قاعدة التنبيه هذه تثبيت عامل Azure Monitor على الجهاز الظاهري وتطبيقه على كل من أجهزة Azure الظاهرية وغير Azure.
تكوين جمع البيانات والتنبيه لمراقبة موثوقية سير عمل العميل.
تمكين نتائج تحليلات الحاوية لجمع السجلات وبيانات الأداء من مجموعتك.
تجمع نتائج تحليلات الحاوية سجلات stdout/stderr ومقاييس الأداء وأحداث Kubernetes من كل عقدة في مجموعتك. يوفر لوحات المعلومات والتقارير لتحليل هذه البيانات، بما في ذلك توفر العقد والمكونات الأخرى. استخدم Log Analytics لتحديد أي أخطاء توفر في السجلات التي تم جمعها.
إنشاء إعدادات التشخيص لتجميع سجلات وحدة التحكم لمجموعات AKS.
تنفذ AKS سجلات مستويات التحكم كسجلات موارد في Azure Monitor. قم بإنشاء إعداد تشخيص لإرسال هذه السجلات إلى مساحة عمل Log Analytics حتى تتمكن من استخدام استعلامات السجل لتحديد الأخطاء والمشكلات التي تؤثر على التوفر.
تمكين تنبيهات Prometheus الموصى بها.
تقوم التنبيهات في Azure Monitor بإعلامك بشكل استباقي عند اكتشاف المشكلات. ابدأ بمجموعة من قواعد تنبيه Prometheus الموصى بها التي تكتشف مشكلات التوفر والأداء الأكثر شيوعا مع مجموعتك. من المحتمل إضافة تنبيهات بحث السجل باستخدام البيانات التي تم جمعها بواسطة نتائج تحليلات الحاوية.
تأكد من توفر مساحة عمل Log Analytics التي تدعم نتائج تحليلات الحاوية.
تعتمد نتائج تحليلات الحاوية على مساحة عمل Log Analytics. راجع أفضل الممارسات لسجلات Azure Monitor للحصول على توصيات لضمان موثوقية مساحة العمل.