مشاركة عبر


الموثوقية في Azure Traffic Manager

تحتوي هذه المقالة على التعافي من الكوارث عبر المناطق ودعم استمرارية الأعمال ل Azure Traffic Manager.

التعافي من الكوارث عبر المناطق واستمرارية الأعمال

يشير الإصلاح بعد الكوارث (DR) إلى الممارسات التي تستخدمها المؤسسات للتعافي من الأحداث عالية التأثير، مثل الكوارث الطبيعية أو عمليات النشر الفاشلة التي تؤدي إلى التوقف عن العمل وفقدان البيانات. بغض النظر عن السبب، فإن أفضل علاج للكارثة هو خطة الإصلاح بعد الكارثة محددة جيدا ومختبرة وتصميم تطبيق يدعم الإصلاح بعد الكارثة بنشاط. قبل البدء في إنشاء خطة التعافي من الكوارث، راجع توصيات لتصميم استراتيجية التعافي من الكوارث.

بالنسبة إلى DR، تستخدم Microsoft نموذج المسؤولية المشتركة. في هذا النموذج، تضمن Microsoft توفر البنية الأساسية وخدمات النظام الأساسي. ومع ذلك، لا تقوم العديد من خدمات Azure تلقائيا بنسخ البيانات نسخا متماثلا أو الرجوع من منطقة فاشلة للنسخ المتماثل إلى منطقة أخرى ممكنة. بالنسبة إلى هذه الخدمات، أنت مسؤول عن إعداد خطة التعافي من الكوارث التي تعمل مع حمل العمل الخاص بك. توفر معظم الخدمات التي تعمل على عروض النظام الأساسي كخدمة (PaaS) في Azure ميزات وإرشادات لدعم الإصلاح بعد الكوارث. يمكنك استخدام ميزات خاصة بالخدمة لدعم الاسترداد السريع للمساعدة في تطوير خطة الإصلاح بعد الكارثة.

Azure Traffic Manager هو موازن تحميل نسبة استخدام الشبكة المستند إلى DNS يتيح لك توزيع نسبة استخدام الشبكة على التطبيقات العامة عبر مناطق Azure العالمية. كما توفر Traffic Manager لنقاط النهاية العامة لديك درجة عالية من التوفر وقدرة سريعة على الاستجابة.

يستخدم Traffic Manager DNS لتوجيه طلبات العميل إلى نقطة نهاية الخدمة المناسبة استنادا إلى أسلوب توجيه نسبة استخدام الشبكة. كما توفر Traffic Manager مراقبة لقوة عمل كل نقطة من نقاط النهاية. يمكن أن تكون نقطة النهاية عبارة عن أي خدمة يمكن الوصول إليها عبر الإنترنت وتتم استضافتها داخل منصة Azure أو خارجها. توفر Traffic Manager مجموعة من طرق توجيه حركة نقل البيانات وخيارات لمراقبة نقطة النهاية حتى تناسب احتياجات التطبيقات المختلفة ونماذج تجاوز الفشل التلقائي. كما تتميز Traffic Manager بقدرتها على الصمود أمام الفشل، بما في ذلك الفشل في منطقة Azure بأكملها.

التعافي من الكوارث في المنطقة الجغرافية متعددة المناطق

DNS هي واحدة من أكثر الآليات كفاءة لتحويل حركة مرور الشبكة. DNS فعال لأن DNS غالبا ما يكون عموميا وخارجيا لمركز البيانات. كما يتم عزل DNS عن أي حالات فشل إقليمية أو على مستوى منطقة التوفر (AZ).

هناك جانبان تقنيان لإعداد بنية التعافي من الكوارث:

  • استخدام آلية نشر لنسخ المثيلات والبيانات والتكوينات بين البيئات الأساسية والبيئات الاحتياطية. يمكن إجراء هذا النوع من التعافي من الكوارث محليا عبر Azure Site Recovery، راجع وثائق استرداد موقع Azure عبر أجهزة/خدمات شركاء Microsoft Azure مثل Veritas أو NetApp.

  • تطوير حل لتحويل حركة مرور الشبكة/الويب من الموقع الأساسي إلى موقع الاستعداد. يمكن تحقيق هذا النوع من التعافي من الكوارث عبر Azure DNS أو Azure Traffic Manager (DNS) أو موازنات التحميل العمومية التابعة لجهة خارجية.

تركز هذه المقالة بشكل خاص على تخطيط التعافي من الكوارث في Azure Traffic Manager.

الكشف عن الانقطاع والإعلام والإدارة

أثناء وقوع كارثة، يتم التحقق من نقطة النهاية الأساسية وتتغير الحالة إلى متدهورة ويظل موقع التعافي من الكوارث متصلاً بالإنترنت. بشكل افتراضي، ترسل Traffic Manager جميع نسب استخدام الشبكة إلى نقطة النهاية الأساسية (ذات الأولوية القصوى). إذا ظهرت نقطة النهاية الأساسية متدهورة، يقوم Traffic Manager بتوجيه حركة المرور إلى نقطة النهاية الثانية ما دامت صحية. يمكن للمرء تكوين المزيد من نقاط النهاية داخل Traffic Manager التي يمكن أن تكون بمثابة نقاط نهاية إضافية لتجاوز الفشل، أو موازنات تحميل تشارك الحمل بين نقاط النهاية.

إعداد التعافي من الكوارث والكشف عن الانقطاع

عندما يكون لديك بنيات أساسية معقدة ومجموعات متعددة من الموارد القادرة على أداء نفس الوظيفة، يمكنك تكوين Azure Traffic Manager (استناداً إلى DNS) للتحقق من صحة مواردك وتوجيه حركة المرور من المورد غير الصحي إلى المورد الصحي.

في الرسم البياني التالي، يكون لكلٍّ من المنطقة الأساسية والمنطقة الثانوية توزيع كامل. يتضمن ذلك الخدمات السحابية وقاعدة البيانات المتزامنة.

رسم تخطيطي لتجاوز الفشل التلقائي باستخدام Azure Traffic Manager.

الشكل - تجاوز الفشل التلقائي باستخدام Azure Traffic Manager

لكن، فقط المنطقة الأساسية هي التي تتعامل بنشاط مع طلبات الشبكة من المستخدمين. تصبح المنطقة الثانوية نشطة فقط عندما تتعرض المنطقة الأساسية لانقطاع الخدمة. في هذه الحالة، تُوجّه جميع طلبات الشبكة الجديدة إلى المنطقة الثانوية. ونظراً لأن النسخ الاحتياطي لقاعدة البيانات يكاد يكون فورياً، فإن كلاً موازني التحميل لديهما عناوين IP يمكن التحقق من صحتها، تكون والمثيلات قيد التشغيل دائماً، توفر هذه الطوبولوجيا خياراً للدخول في RTO منخفض وتجاوز الفشل دون أي تدخل يدوي. يجب أن تكون منطقة تجاوز الفشل الثانوية جاهزة لبدء التشغيل مباشرة بعد فشل المنطقة الأساسية.

يعد هذا السيناريو مثالياً لاستخدام Azure Traffic Manager الذي يحتوي على تحقيقات تحمل في ثناياها عوامل لأنواع مختلفة من عمليات التحقق من الصحة بما في ذلك http / https وTCP. يحتوي Azure Traffic manager أيضاً على محرك قاعدة يمكن تكوينه للفشل عند حدوث فشل كما هو موضح أدناه. دعونا نفكر في الحل التالي باستخدام Traffic Manager:

  • لدى العميل نقطة نهاية المنطقة رقم 1 المعروفة باسم prod.contoso.com مع عنوان IP ثابت مثل 100.168.124.44 ونقطة نهاية المنطقة رقم 2 المعروفة باسم dr.contoso.com مع عنوان IP ثابت مثل 100.168.124.43.
  • يتم مواجهة كل من هذه البيئات عبر خاصية مواجهة عامة مثل موازن التحميل. يمكن تكوين موازن التحميل ليكون له نقطة نهاية تستند إلى DNS أو اسم مجال مؤهل بالكامل (FQDN) كما هو موضح أعلاه.
  • جميع المثيلات في المنطقة 2 في النسخ المتماثل في الوقت الفعلي تقريبا مع المنطقة 1. علاوة على ذلك، يتم تحديث صور الجهاز، ويتم تصحيح جميع بيانات البرامج/التكوين وتتماشى مع المنطقة 1.
  • يتم تكوين التحجيم التلقائي مسبقاً.

لتكوين تجاوز الفشل باستخدام Azure Traffic Manager:

  1. إنشاء ملف تعريف Azure Traffic Manager جديد إنشاء ملف تعريف Azure Traffic manager جديد باسم contoso123 وحدد أسلوب التوجيه كأولوية. إذا كان لديك مجموعة موارد موجودة مسبقا ترغب في الارتباط بها، يمكنك اختيار مجموعة موارد موجودة، وإلا أنشئ مجموعة موارد جديدة.

    لقطة شاشة لإنشاء ملف تعريف Traffic Manager.

    الشكل - إنشاء ملف تعريف لمدير حركة المرور

  2. إنشاء نقاط نهاية داخل ملف تعريف Azure Traffic Manager

    في هذه الخطوة، يمكنك إنشاء نقاط نهاية تشير إلى مواقع الإنتاج والتعافي من الكوارث. هنا، اختر النوع كنقطة نهاية خارجية، ولكن إذا كان المورد مستضافاً في Azure، يمكنك اختيار Azure endpoint أيضاً. إذا اخترت Azure endpoint، فحدد Target resource يكون إما خدمة تطبيق أو عنوان IP عام تعينه Azure. يتم تعيين الأولوية على 1 لأنها الخدمة الأساسية للمنطقة 1. وبالمثل، قم بإنشاء نقطة نهاية التعافي من الكوارث داخل Traffic Manager أيضاً.

    لقطة شاشة لإنشاء نقاط نهاية التعافي من الكوارث.

    الشكل - إنشاء نقاط نهاية للتعافي من الكوارث

  3. إعداد تحقيق الصحة وتكوين تجاوز الفشل

    في هذه الخطوة، يمكنك تعيين DNS TTL إلى 10 ثوانٍ، والتي يوقرها معظم المحللين المتكررين الذين يواجهون الإنترنت. يعني هذا التكوين أنه لن يقوم أي محلل DNS بتخزين المعلومات مؤقتاً لأكثر من 10 ثوانٍ.

    بالنسبة لإعدادات شاشة نقطة النهاية، يتم تعيين المسار حالياً عند / أو الجذر، ولكن يمكنك تخصيص إعدادات نقطة النهاية لتقييم مسار، على سبيل المثال، prod.contoso.com/index.

    يوضح المثال أدناه https كبروتوكول التحقيق. ومع ذلك، يمكنك اختيار http أو tcp أيضاً. يعتمد اختيار البروتوكول على التطبيق النهائي. يتم تعيين الفاصل الزمني للتحقيق إلى 10 ثوانٍ، ما يتيح التحقيق السريع، ويتم تعيين إعادة المحاولة إلى 3. ونتيجة لذلك، سيتجاوز Traffic Manager إلى نقطة النهاية الثانية إذا سجلت ثلاثة فواصل زمنية متتالية فشلاً.

    تحدد الصيغة التالية إجمالي الوقت لتجاوز الفشل التلقائي:

    Time for failover = TTL + Retry * Probing interval

    وفي هذه الحالة، القيمة هي 10 + 3 * 10 = 40 ثانية (الحد الأقصى).

    إذا تم تعيين إعادة المحاولة إلى 1 وتم تعيين TTL إلى 10 ثوانٍ، فإن وقت تجاوز الفشل 10 + 1 * 10 = 20 ثانية.

    قم بتعيين إعادة المحاولة إلى قيمة أكبر من 1 للقضاء على فرص تجاوز الفشل بسبب الإيجابيات الخاطئة أو أي نقاط اتصال بسيطة.

    لقطة شاشة لإعداد التحقق من الصحة.

    الشكل - إعداد تحقيق الصحة وتكوين تجاوز الفشل

الخطوات التالية