الموثوقية في Azure Traffic Manager

تحتوي هذه المقالة على توصيات موثوقية محددة ل Azure Traffic Manager بالإضافة إلى التعافي من الكوارث عبر المناطق ودعم استمرارية الأعمال ل Azure Traffic Manager.

للحصول على نظرة عامة أكثر تفصيلا حول مبادئ الموثوقية في Azure، راجع موثوقية Azure.

توصيات الموثوقية

يحتوي هذا القسم على توصيات لتحقيق المرونة والتوافر. وتنقسم كل توصية إلى إحدى فئتين:

  • تغطي عناصر الحماية مناطق مثل عناصر التكوين والوظيفة المناسبة للمكونات الرئيسية التي تشكل حمل عمل Azure، مثل إعدادات تكوين موارد Azure والتبعيات على الخدمات الأخرى وما إلى ذلك.

  • تغطي عناصر المخاطر مناطق مثل متطلبات التوفر والاسترداد والاختبار والمراقبة والنشر والعناصر الأخرى التي تزيد من فرص حدوث مشاكل في البيئة إذا تركت دون حل.

مصفوفة أولوية توصيات الموثوقية

توضع علامة على كل توصية وفقا لمصفوفة الأولوية التالية:

الصورة أولوية ‏‏الوصف
درجة عالية الإصلاح الفوري مطلوب.
متوسط إصلاح في غضون 3-6 أشهر.
منخفض تحتاج إلى مراجعة.

ملخص توصيات الموثوقية

الفئة أولوية التوصية
‏‏التوفر يجب أن تكون حالة Traffic Manager Monitor متصلة
يجب أن تحتوي ملفات تعريف Traffic manager على أكثر من نقطة نهاية واحدة
كفاءة النظام يجب أن تكون قيمة TTL لملفات تعريف المستخدمين في 60 ثانية
التعافي من الكوارث. تكوين نقطة نهاية واحدة على الأقل داخل منطقة أخرى
تأكد من تكوين نقطة النهاية إلى "(كل العالم)" لملفات التعريف الجغرافية

التوافر

يجب أن تكون حالة مراقب Traffic Manager متصلة

يجب أن تكون حالة المراقبة متصلة لتوفير تجاوز الفشل لحمل عمل التطبيق. إذا كانت صحة Traffic Manager تعرض حالة متدهورة ، فقد تكون حالة نقطة نهاية واحدة أو أكثر أيضا متدهورة.

لمزيد من المعلومات، راجع مراقبة نقطة نهاية Traffic Manager.

لاستكشاف حالة متدهورة وإصلاحها على Azure Traffic Manager، راجع استكشاف أخطاء الحالة المتدهورة وإصلاحها في Azure Traffic Manager.

يجب أن تحتوي ملفات تعريف Traffic manager على أكثر من نقطة نهاية واحدة

عند تكوين مدير حركة مرور Azure، يجب توفير نقطتي نهاية على الأقل لتجاوز الفشل في حمل العمل إلى مثيل آخر.

للتعرف على أنواع نقاط نهاية Traffic Manager، راجع نقاط نهاية Traffic Manager.

كفاءة النظام

يجب أن تكون قيمة TTL لملفات تعريف المستخدمين في 60 ثانية

تؤثر مدة البقاء (TTL) على مدى حداثة الاستجابة التي سيحصل عليها العميل عندما يقدم طلبًا إلى Azure Traffic Manager. يعني تقليل قيمة TTL أنه سيتم توجيه العميل إلى نقطة نهاية عاملة بشكل أسرع في حالة تجاوز الفشل. قم بتكوين TTLعلى 60 ثانية لتوجيه نسبة استخدام الشبكة إلى نقطة نهاية صحية بأسرع ما يمكن.

لمزيد من المعلومات حول تكوين DNS TTL، راجع تكوين وقت DNS للعيش.

التعافي من الكوارث

تكوين نقطة نهاية واحدة على الأقل داخل منطقة أخرى

يجب أن تحتوي ملفات التعريف على أكثر من نقطة نهاية واحدة لضمان التوفر إذا فشلت إحدى نقاط النهاية. يوصى أيضا بأن تكون نقاط النهاية في مناطق مختلفة.

للتعرف على أنواع نقاط نهاية Traffic Manager، راجع نقاط نهاية Traffic Manager.

تأكد من تكوين نقطة النهاية إلى "(كل العالم)" لملفات التعريف الجغرافية

بالنسبة للتوجيه الجغرافي، يتم توجيه حركة المرور إلى نقاط النهاية استنادًا إلى مناطق محددة. عندما تفشل منطقة ما، لا يوجد تجاوز فشل محدد مسبقًا. إن وجود نقطة نهاية حيث يتم تكوين التجميع الإقليمي إلى "الكل (العالم)" لملفات التعريف الجغرافية سيتجنب التظليل الأسود لنسبة استخدام الشبكة وضمان بقاء الخدمة متوفرة.

لمعرفة كيفية إضافة نقطة نهاية وتكوينها، راجع إضافة نقاط نهاية أو تعطيلها أو تمكينها أو حذفها أو نقلها.

التعافي من الكوارث عبر المناطق واستمرارية الأعمال

يتعلق التعافي من الكوارث (DR) بالتعافي من الأحداث عالية التأثير، مثل الكوارث الطبيعية أو عمليات النشر الفاشلة التي تؤدي إلى وقت تعطل وفقدان البيانات. بغض النظر عن السبب، فإن أفضل علاج للكارثة هو خطة الإصلاح بعد الكارثة محددة جيدا ومختبرة وتصميم تطبيق يدعم الإصلاح بعد الكارثة بنشاط. قبل البدء في التفكير في إنشاء خطة التعافي من الكوارث، راجع التوصيات لتصميم استراتيجية التعافي من الكوارث.

عندما يتعلق الأمر بالتعافي من الكوارث، تستخدم Microsoft نموذج المسؤولية المشتركة. في نموذج المسؤولية المشتركة، تضمن Microsoft توفر البنية الأساسية الأساسية وخدمات النظام الأساسي. في الوقت نفسه، لا تقوم العديد من خدمات Azure تلقائيا بنسخ البيانات نسخا متماثلا أو الرجوع من منطقة فاشلة للنسخ المتماثل إلى منطقة أخرى ممكنة. بالنسبة إلى هذه الخدمات، أنت مسؤول عن إعداد خطة التعافي من الكوارث التي تعمل مع حمل العمل الخاص بك. توفر معظم الخدمات التي تعمل على عروض النظام الأساسي كخدمة (PaaS) في Azure ميزات وإرشادات لدعم الإصلاح بعد الكارثة ويمكنك استخدام ميزات خاصة بالخدمة لدعم الاسترداد السريع للمساعدة في تطوير خطة الإصلاح بعد الكارثة.

Azure Traffic Manager هو موازن تحميل نسبة استخدام الشبكة المستند إلى DNS يتيح لك توزيع نسبة استخدام الشبكة على التطبيقات العامة عبر مناطق Azure العالمية. كما توفر Traffic Manager لنقاط النهاية العامة لديك درجة عالية من التوفر وقدرة سريعة على الاستجابة.

يستخدم Traffic Manager DNS لتوجيه طلبات العميل إلى نقطة نهاية الخدمة المناسبة استنادا إلى أسلوب توجيه نسبة استخدام الشبكة. كما توفر Traffic Manager مراقبة لقوة عمل كل نقطة من نقاط النهاية. يمكن أن تكون نقطة النهاية عبارة عن أي خدمة يمكن الوصول إليها عبر الإنترنت وتتم استضافتها داخل منصة Azure أو خارجها. توفر Traffic Manager مجموعة من طرق توجيه حركة نقل البيانات وخيارات لمراقبة نقطة النهاية حتى تناسب احتياجات التطبيقات المختلفة ونماذج تجاوز الفشل التلقائي. كما تتميز Traffic Manager بقدرتها على الصمود أمام الفشل، بما في ذلك الفشل في منطقة Azure بأكملها.

التعافي من الكوارث في المنطقة الجغرافية متعددة المناطق

DNS هي واحدة من أكثر الآليات كفاءة لتحويل حركة مرور الشبكة. DNS فعال لأن DNS غالبا ما يكون عموميا وخارجيا لمركز البيانات. كما يتم عزل DNS عن أي حالات فشل إقليمية أو على مستوى منطقة التوفر (AZ).

هناك جانبان تقنيان لإعداد بنية التعافي من الكوارث:

  • استخدام آلية نشر لنسخ المثيلات والبيانات والتكوينات بين البيئات الأساسية والبيئات الاحتياطية. يمكن إجراء هذا النوع من التعافي من الكوارث محليا عبر Azure Site Recovery، راجع وثائق استرداد موقع Azure عبر أجهزة/خدمات شركاء Microsoft Azure مثل Veritas أو NetApp.

  • تطوير حل لتحويل حركة مرور الشبكة/الويب من الموقع الأساسي إلى موقع الاستعداد. يمكن تحقيق هذا النوع من التعافي من الكوارث عبر Azure DNS أو Azure Traffic Manager (DNS) أو موازنات التحميل العمومية التابعة لجهة خارجية.

تركز هذه المقالة بشكل خاص على تخطيط التعافي من الكوارث في Azure Traffic Manager.

الكشف عن الانقطاع والإعلام والإدارة

أثناء وقوع كارثة، يتم التحقق من نقطة النهاية الأساسية وتتغير الحالة إلى متدهورة ويظل موقع التعافي من الكوارث متصلاً بالإنترنت. بشكل افتراضي، ترسل Traffic Manager جميع نسب استخدام الشبكة إلى نقطة النهاية الأساسية (ذات الأولوية القصوى). إذا ظهرت نقطة النهاية الأساسية متدهورة، يقوم Traffic Manager بتوجيه حركة المرور إلى نقطة النهاية الثانية ما دامت صحية. يمكن للمرء تكوين المزيد من نقاط النهاية داخل Traffic Manager التي يمكن أن تكون بمثابة نقاط نهاية إضافية لتجاوز الفشل، أو موازنات تحميل تشارك الحمل بين نقاط النهاية.

إعداد التعافي من الكوارث والكشف عن الانقطاع

عندما يكون لديك بنيات أساسية معقدة ومجموعات متعددة من الموارد القادرة على أداء نفس الوظيفة، يمكنك تكوين Azure Traffic Manager (استناداً إلى DNS) للتحقق من صحة مواردك وتوجيه حركة المرور من المورد غير الصحي إلى المورد الصحي.

في الرسم البياني التالي، يكون لكلٍّ من المنطقة الأساسية والمنطقة الثانوية توزيع كامل. يتضمن ذلك الخدمات السحابية وقاعدة البيانات المتزامنة.

رسم تخطيطي لتجاوز الفشل التلقائي باستخدام Azure Traffic Manager.

الشكل - تجاوز الفشل التلقائي باستخدام Azure Traffic Manager

لكن، فقط المنطقة الأساسية هي التي تتعامل بنشاط مع طلبات الشبكة من المستخدمين. تصبح المنطقة الثانوية نشطة فقط عندما تتعرض المنطقة الأساسية لانقطاع الخدمة. في هذه الحالة، تُوجّه جميع طلبات الشبكة الجديدة إلى المنطقة الثانوية. ونظراً لأن النسخ الاحتياطي لقاعدة البيانات يكاد يكون فورياً، فإن كلاً موازني التحميل لديهما عناوين IP يمكن التحقق من صحتها، تكون والمثيلات قيد التشغيل دائماً، توفر هذه الطوبولوجيا خياراً للدخول في RTO منخفض وتجاوز الفشل دون أي تدخل يدوي. يجب أن تكون منطقة تجاوز الفشل الثانوية جاهزة لبدء التشغيل مباشرة بعد فشل المنطقة الأساسية.

يعد هذا السيناريو مثالياً لاستخدام Azure Traffic Manager الذي يحتوي على تحقيقات تحمل في ثناياها عوامل لأنواع مختلفة من عمليات التحقق من الصحة بما في ذلك http / https وTCP. يحتوي Azure Traffic manager أيضاً على محرك قاعدة يمكن تكوينه للفشل عند حدوث فشل كما هو موضح أدناه. دعونا نفكر في الحل التالي باستخدام Traffic Manager:

  • لدى العميل نقطة نهاية المنطقة رقم 1 المعروفة باسم prod.contoso.com مع عنوان IP ثابت مثل 100.168.124.44 ونقطة نهاية المنطقة رقم 2 المعروفة باسم dr.contoso.com مع عنوان IP ثابت مثل 100.168.124.43.
  • يتم مواجهة كل من هذه البيئات عبر خاصية مواجهة عامة مثل موازن التحميل. يمكن تكوين موازن التحميل ليكون له نقطة نهاية تستند إلى DNS أو اسم مجال مؤهل بالكامل (FQDN) كما هو موضح أعلاه.
  • جميع المثيلات في المنطقة 2 في النسخ المتماثل في الوقت الفعلي تقريبا مع المنطقة 1. علاوة على ذلك، يتم تحديث صور الجهاز، ويتم تصحيح جميع بيانات البرامج/التكوين وتتماشى مع المنطقة 1.
  • يتم تكوين التحجيم التلقائي مسبقاً.

لتكوين تجاوز الفشل باستخدام Azure Traffic Manager:

  1. إنشاء ملف تعريف Azure Traffic Manager جديد إنشاء ملف تعريف Azure Traffic manager جديد باسم contoso123 وحدد أسلوب التوجيه كأولوية. إذا كانت لديك مجموعة موارد موجودة مسبقاً تريد إقرانها بها، يمكنك تحديد مجموعة موارد موجودة، وإلا، فقم بإنشاء مجموعة موارد جديدة.

    لقطة شاشة لإنشاء ملف تعريف Traffic Manager.

    الشكل - إنشاء ملف تعريف لمدير حركة المرور

  2. إنشاء نقاط نهاية داخل ملف تعريف Azure Traffic Manager

    في هذه الخطوة، يمكنك إنشاء نقاط نهاية تشير إلى مواقع الإنتاج والتعافي من الكوارث. هنا، اختر النوع كنقطة نهاية خارجية، ولكن إذا كان المورد مستضافاً في Azure، يمكنك اختيار Azure endpoint أيضاً. إذا اخترت Azure endpoint، فحدد Target resource يكون إما خدمة تطبيق أو عنوان IP عام تعينه Azure. يتم تعيين الأولوية على 1 لأنها الخدمة الأساسية للمنطقة 1. وبالمثل، قم بإنشاء نقطة نهاية التعافي من الكوارث داخل Traffic Manager أيضاً.

    لقطة شاشة لإنشاء نقاط نهاية التعافي من الكوارث.

    الشكل - إنشاء نقاط نهاية للتعافي من الكوارث

  3. إعداد تحقيق الصحة وتكوين تجاوز الفشل

    في هذه الخطوة، يمكنك تعيين DNS TTL إلى 10 ثوانٍ، والتي يوقرها معظم المحللين المتكررين الذين يواجهون الإنترنت. يعني هذا التكوين أنه لن يقوم أي محلل DNS بتخزين المعلومات مؤقتاً لأكثر من 10 ثوانٍ.

    بالنسبة لإعدادات شاشة نقطة النهاية، يتم تعيين المسار حالياً عند / أو الجذر، ولكن يمكنك تخصيص إعدادات نقطة النهاية لتقييم مسار، على سبيل المثال، prod.contoso.com/index.

    يوضح المثال أدناه https كبروتوكول التحقيق. ومع ذلك، يمكنك اختيار http أو tcp أيضاً. يعتمد اختيار البروتوكول على التطبيق النهائي. يتم تعيين الفاصل الزمني للتحقيق إلى 10 ثوانٍ، ما يتيح التحقيق السريع، ويتم تعيين إعادة المحاولة إلى 3. ونتيجة لذلك، سيتجاوز Traffic Manager إلى نقطة النهاية الثانية إذا سجلت ثلاثة فواصل زمنية متتالية فشلاً.

    تحدد الصيغة التالية إجمالي الوقت لتجاوز الفشل التلقائي:

    Time for failover = TTL + Retry * Probing interval

    وفي هذه الحالة، القيمة هي 10 + 3 * 10 = 40 ثانية (الحد الأقصى).

    إذا تم تعيين إعادة المحاولة إلى 1 وتم تعيين TTL إلى 10 ثوانٍ، فإن وقت تجاوز الفشل 10 + 1 * 10 = 20 ثانية.

    قم بتعيين إعادة المحاولة إلى قيمة أكبر من 1 للقضاء على فرص تجاوز الفشل بسبب الإيجابيات الخاطئة أو أي نقاط اتصال بسيطة.

    لقطة شاشة لإعداد التحقق من الصحة.

    الشكل - إعداد تحقيق الصحة وتكوين تجاوز الفشل

الخطوات التالية