مشاركة عبر


Reliability in Azure Service Bus

Azure Service Bus هو خدمة وسيط رسائل مؤسسية مدارة بالكامل توفر قدرات مراسلة غير متزامنة موثوقة لفصل التطبيقات والخدمات. يدعم ناقل الخدمة طوابير للتواصل من نقطة إلى نقطة والمواضيع مع اشتراكات لأنماط الرسائل المنشورة والاشتراك. توفر الخدمة ميزات موثوقية مدمجة تشمل متانة الرسائل، وضمان تسليم لمرة واحدة على الأقل، وقوائم انتظار الحروف الميتة للتعامل مع فشل معالجة الرسائل.

عند استخدام Azure، تعد الموثوقية مسؤولية مشتركة. توفر Microsoft مجموعة من الإمكانات لدعم المرونة والاسترداد. أنت مسؤول عن فهم كيفية عمل هذه الإمكانات في جميع الخدمات التي تستخدمها، وتحديد الإمكانات التي تحتاجها لتحقيق أهداف عملك وأهداف وقت التشغيل.

تصف هذه المقالة كيفية جعل حافلات الخدمة مقاومة لمجموعة متنوعة من الانقطاعات والمشاكل المحتملة، بما في ذلك الأعطال المؤقتة، انقطاعات مناطق التوفر، وانقطاعات المناطق. كما يسلط الضوء على بعض المعلومات الأساسية حول اتفاقية مستوى خدمة حافلات الخدمة (SLA).

توصيات نشر الإنتاج

يوفر Azure Well-Architected Framework توصيات عبر الموثوقية والأداء والأمان والتكلفة والعمليات. لفهم كيف تؤثر هذه المجالات على بعضها البعض وتساهم في حل موثوق لخدمة التطبيقات، راجع أفضل ممارسات الهندسة المعمارية لحافل الخدمة Azure في إطار عمل Azure Well-Architected.

نظرة عامة على بنية الموثوقية

يصف هذا القسم بعض الجوانب المهمة لكيفية عمل الخدمة والتي هي الأكثر صلة من منظور الموثوقية. يقدم القسم البنية المنطقية، التي تشمل بعض الموارد والميزات التي تقوم بنشرها واستخدامها. كما يناقش الهيكل المادي ، والذي يوفر تفاصيل حول كيفية عمل الخدمة تحت الأغطية.

العمارة المنطقية

تعمل مساحة الأسماء كحاوية إدارة لناقل الخدمة، ويمكن تكوينها لاستخدام المستوى الأساسي أو القياسي أو المميز. تقوم بتكوين الخدمة على مستوى مساحة الأسماء من خلال تخصيص السعة، وضبط أمان الشبكة، وتمكين Geo-Replication واستعادة Geo-Disaster.

داخل مساحة الاسم، تقوم بنشر قوائم انتظارومواضيع، وهي كيانات رسائل ذات دلالات مختلفة. لمزيد من المعلومات، راجع قوائم انتظار حافلات الخدمة، المواضيع، والاشتراكات.

يمكنك اختياريا تكوين الأقسام في مساحة الأسماء الخاصة بك، مما يوزع الطوابير والمواضيع عبر عدة وسطاء رسائل ومتاجر رسائل. يمكن لمساحة الأسماء استخدام عدة تقسيمات لأداء المعالجة المتوازية والتكبير الأفقي. يخمن ناقل الخدمة فقط الترتيب داخل قسم واحد. يلعب التقسيم دورا رئيسيا في تصميم موثوقية تطبيقك. عند تصميم التطبيق الخاص بك ، قم بإجراء مفاضلة بين زيادة التوفر والاتساق إلى أقصى حد. بالنسبة للطبقة المميزة، يمكنك تفعيل التقسيم في مساحة الاسم. بالنسبة لمساحات الأسماء من المستوى الأساسي والعادي، تقوم بتكوين الأقسام على الكيان واختياريا عند إرسال الرسائل.

يمكنك استخدام ناقل الخدمة ونهجه في التصميم غير المتزامن لزيادة توفر تطبيقاتك. لمزيد من المعلومات، راجع أنماط الرسائل غير المتزامنة والتوافر العالي.

العمارة المادية

يوفر ناقل الخدمة الموارد الأساسية للحوسبة والتخزين. لكل مساحة اسم، يعالج عدة وسطاء رسائل الرسائل، وتخزن عدة متاجر رسائل الرسائل. هناك ثلاث نسخ من متجر الرسائل: واحدة رئيسية واثنتان ثانوية. يحافظ ناقل خدمة Microsoft Azure على مزامنة جميع النسخ الثلاث لعمليات البيانات والإدارة. إذا فشلت النسخة الأساسية، يتم ترقية إحدى النسخ الثانوية إلى النسخة الأساسية دون أي توقف محسوس.

بالنسبة لمساحات الأسماء التي تستخدم المستوى الأساسي أو القياسي، يوفر ناقل الخدمة التكرار من خلال بنية تحتية مشتركة متعددة المستأجرين تقوم تلقائيا بتكرار الرسائل عبر مناطق التوفر حيثما توفرت الفرصة. تحافظ الخدمة على عدة مخازن رسائل وتحافظ على جميع النسخ متزامنة لكل من عمليات البيانات والإدارة.

بالنسبة لمساحات الأسماء من الفئة المميزة، يوفر Service Bus وحدات مراسلة مخصصة، كل منها مزود بموارد وحدة معالجة مركزية وذاكرة مخصصة. يمكن لمساحات الأسماء المميزة الترقيم التوسع تلقائيا بناء على متطلبات عبء العمل. لمزيد من المعلومات، راجع تحديث وحدات الرسائل تلقائيا لمساحة أسماء حافلة الخدمة في Azure.

تمتد بنية ناقل الخدمة عبر عدة أجهزة ورفوف مادية موزعة عبر مجالات الأعطال، مما يقلل من خطر حدوث أعطال كارثية تؤثر على مساحة الاسم الخاصة بك. في المناطق التي تحتوي على مناطق توفر، تمتد البنية التحتية عبر مراكز بيانات مادية منفصلة. تنفذ الخدمة آليات شفافة للكشف عن الأعطال وتجاوز الفشل بحيث تستمر في العمل ضمن مستويات الخدمة المضمونة وعادة دون انقطاعات ملحوظة عند حدوث مثل هذه الأعطال.

المرونة في مواجهة الأعطال العابرة

الأخطاء العابرة هي حالات فشل قصيرة متقطعة في المكونات. تحدث بشكل متكرر في بيئة موزعة مثل السحابة، وهي جزء طبيعي من العمليات. الأخطاء العابرة تصحح نفسها بعد فترة زمنية قصيرة. من المهم أن تتمكن تطبيقاتك من معالجة الأخطاء العابرة، عادة عن طريق إعادة محاولة الطلبات المتأثرة.

يجب أن تتبع جميع التطبيقات المستضافة على السحابة إرشادات معالجة الأخطاء العابرة ل Azure عند الاتصال بأي واجهات برمجة تطبيقات وقواعد بيانات ومكونات أخرى مستضافة على السحابة. لمزيد من المعلومات، راجع توصيات للتعامل مع الأخطاء العابرة.

تتضمن حزمة تطوير الوسائط الخاصة بحافلة الخدمة Azure منطق إعادة المحاولة التلقائي مع ارتداد أسي للعمليات التي تفشل بسبب ظروف مؤقتة مثل انتهاء المهلة في الشبكة أو عدم توفر الخدمة المؤقتة. عندما تواجه التطبيقات انقطاعات مؤقتة عن ناقل الخدمة، تحاول مجموعة تطوير البرمجيات تلقائيا إعادة الاتصال باستخدام سياسة إعادة المحاولة المكونة.

لتحسين التعامل مع الأعطال المؤقتة في تطبيقاتك، استخدم أحدث SDK لناقل الخدمة، والذي يتضمن أحدث ميزات منطق إعادة المحاولة وإدارة الاتصال. لمزيد من المعلومات، راجع مكتبة عملاء Azure Service Bus ل .NET.

المرونة في مواجهة حالات فشل منطقة التوفر

مناطق التوفر هي مجموعات منفصلة فعليا من مراكز البيانات داخل منطقة Azure. عند فشل منطقة واحدة، يمكن أن تفشل الخدمات إلى إحدى المناطق المتبقية.

يدعم ناقل الخدمة عمليات النشر المتكررة في جميع مستويات الخدمة. عند إنشاء مساحة أسماء ناقل خدمة في منطقة مدعومة، يتم تفعيل تكرار المنطقة تلقائيا دون أي تكلفة إضافية. نموذج النشر المتكرر للمناطق ينطبق على جميع ميزات ناقل الخدمة، بما في ذلك التقسيم والجلسات.

يقوم Service Bus بتكرار تكوينك، وبيانات الوصف، وبيانات الرسائل عبر مناطق توفر متعددة في المنطقة. يوفر تكرار المنطقة تجاوز الفشل تلقائيا دون الحاجة إلى أي تدخل منك. جميع مكونات ناقل الخدمة بما في ذلك الحوسبة، الشبكات، والتخزين يتم تكرارها عبر المناطق. حافلة الخدمة لديها احتياطيات سعة كافية للتعامل فورا مع فقدان كامل للمنطقة. حتى إذا أصبحت منطقة توفر كاملة غير متاحة، يستمر ناقل الخدمة في العمل دون فقدان البيانات أو انقطاع تطبيقات المراسلة.

مخطط يوضح مساحة اسم ناقل الخدمة الاحتياطي للمنطقة.

Requirements

  • دعم المنطقة: يمكن نشر مساحات أسماء ناقل الخدمة المتكررة في مناطق Azure مع دعم مناطق التوفر. يفعل برنامج Service Bus تلقائيا دعم منطقة التوفر عند إنشاء مساحة اسم في منطقة مدعومة، دون الحاجة إلى تكوين إضافي.

  • مستويات: جميع مستويات حافلات الخدمة (الأساسية، القياسية، والمميزة) تدعم مناطق التوفر دون الحاجة إلى متطلبات إضافية.

الاعتبارات

تشمل مساحات أسماء حافلات الخدمة عقارا.zoneRedundant في السابق، كان هذا الخاصية مطلوبا لتفعيل مناطق التوفر، لكن هذا السلوك تغير وأصبحت الخاصية zoneRedundant مهملة. قد تظهر false هذه الخاصية حتى عند تفعيل التكرار في المنطقة. جميع مساحات الأسماء في المناطق التي تحتوي على مناطق توفر هي مناطق احتياطية.

التكلفة

تكرار المناطق في حافلة الخدمة لا يضيف تكلفة إضافية.

تكوين دعم منطقة التوفر

تدعم مساحات أسماء ناقل الخدمة تلقائيا تكرار المناطق عند نشرها في المناطق المدعومة. لا يلزم تكوين إضافي.

السلوك عندما تكون جميع المناطق صحية

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحات أسماء ناقل الخدمة لتكرار المناطق وتكون جميع مناطق التوفر عاملة.

  • توجيه حركة المرور بين المناطق. يستخدم ناقل الخدمة نموذجا نشطا-نشطا حيث توزع الرسائل عبر عدة مناطق توافر. يتم توزيع التحميل تلقائيا على اتصالات العملاء عبر المناطق، وتقوم الخدمة بتوجيه العمليات إلى بنية تحتية للمراسلة المتاحة بغض النظر عن المنطقة.

  • النسخ المتماثل للبيانات بين المناطق. يستخدم ناقل الخدمة تكرارا متزامنا عبر مناطق التوفر، بما في ذلك بيانات الوصفا وبيانات الرسائل. يجب أن تصادق نسخ متعددة من مخزن الرسائل على عمليات الكتابة قبل اعتبارها مكتملة، مما يضمن اتساق البيانات عبر المناطق أثناء العمليات العادية.

السلوك أثناء فشل المنطقة

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحات أسماء حافلات الخدمة لتكرار المناطق ويحدث انقطاع في منطقة التوافر.

  • الكشف والاستجابة: تكتشف مايكروسوفت تلقائيا أعطال المناطق وتبدأ الانتقال إلى المناطق الصحية. لا يلزم العميل إجراء لتحويل الفشل على مستوى المنطقة.
  • الإعلام: لا تقوم Microsoft بإعلامك تلقائيا عندما تكون المنطقة معطلة. ومع ذلك، يمكنك استخدام Azure Service Health لفهم السلامة العامة للخدمة، بما في ذلك أي حالات فشل في المنطقة، ويمكنك إعداد تنبيهات حماية الخدمة لإعلامك بالمشكلات.
  • الطلبات النشطة: أثناء فشل المنطقة، قد يسقط ناقل الخدمة طلبات نشطة. إذا تعامل عملاؤك مع الأخطاء العابرة بشكل مناسب عن طريق إعادة المحاولة بعد فترة قصيرة من الزمن ، فإنهم عادة ما يتجنبون تأثيرا كبيرا.

  • فقدان البيانات المتوقع: لا يحدث فقدان بيانات أثناء فشل المنطقة لأن ناقل الخدمة يقوم بتكرار الرسائل عبر المناطق بشكل متزامن قبل التأكيد.

  • وقت التوقف المتوقع: قد يتسبب فشل المنطقة في بضع ثوان من وقت التوقف عن العمل. إذا تعامل عملاؤك مع الأخطاء العابرة بشكل مناسب عن طريق إعادة المحاولة بعد فترة قصيرة من الزمن ، فإنهم عادة ما يتجنبون تأثيرا كبيرا.

  • إعادة توجيه حركة المرور: يكتشف ناقل الخدمة فقدان المنطقة ويعيد توجيه الطلبات الجديدة تلقائيا إلى نسخة أخرى في إحدى مناطق التوفر السليمة.

    عادة ما تتعامل حزمة تطوير ناقل الخدمة مع إدارة الاتصال ومنطق إعادة المحاولة بشكل شفاف.

استعادة المنطقة

عندما تستعيد منطقة التوافر، يقوم ناقل الخدمة تلقائيا بإعادة دمج المنطقة في طوبولوجيا الخدمة النشطة. تبدأ المنطقة المستعادة في استقبال اتصالات جديدة ومعالجة الرسائل جنبا إلى جنب مع المناطق الأخرى. تظل البيانات التي تم نسخها إلى المناطق الباقية أثناء الانقطاع سليمة، ويستأنف النسخ المتماثل المتزامن العادي عبر جميع المناطق. لست بحاجة إلى اتخاذ إجراء لاستعادة المنطقة وإعادة إدماجها.

اختبار فشل المنطقة

يدير ناقل الخدمة توجيه حركة المرور، وفشل التشغيل، واستعادة المناطق في حالات فشل المناطق، لذا لا تحتاج إلى التحقق من عمليات فشل منطقة التوافر أو تقديم مدخلات إضافية.

القدرة على الصمود في وجه الإخفاقات على مستوى المنطقة

يوفر ناقل الخدمة نوعين من الدعم متعدد المناطق، وكلاهما يتطلب مساحات أسماء من المستويات المميزة:

  • يوفر التكرار الجغرافي تكرارا نشطا-سلبيا لكل من بيانات التعريف وبيانات الرسائل بين المنطقة الأساسية والمنطقة الثانوية. استخدم Geo-Replication لمعظم التطبيقات التي تحتاج إلى البقاء مرنة أمام انقطاعات المناطق ولديها تحمل منخفض لفقدان بيانات الرسائل.

  • يوفر Metadata Geo-Disaster Recovery تكرارا نشطا سلبيا للتكوين والبيانات الوصفية بين المنطقة الأساسية والثانوية، لكنه لا يكرر بيانات الرسائل. فكر في استخدام Geo-Disaster Recovery للتطبيقات التي تتعامل مع نسخ بياناتها بنفسها، أو التي لا تحتاج إلى نسخ البيانات.

كل من Geo-Replication والبيانات الوصفية Geo-Disaster الاستعادة تتطلب منك بدء عملية التحويل الوظيفي يدويا أو الترويج لمنطقة ثانوية لتصبح المنطقة الأساسية الجديدة. لا تقوم Microsoft تلقائيا بإجراء تجاوز الفشل أو الترقية، حتى إذا كانت منطقتك الأساسية معطلة.

مساحات الأسماء في مستويين Basic وStandard لا تتضمن ميزات متعددة المناطق الأصلية، لكن يمكنك تنفيذ أنماط تكرار على مستوى التطبيق باستخدام عدة مساحات أسماء عبر المناطق. لمزيد من المعلومات، راجع قسم الحلول متعددة المناطق المخصصة للمرونة أدناه.

Geo-Replication

المستوى المميز يدعم التكرار الجغرافي. تقوم هذه الميزة بتكرار كل من البيانات الوصفية (مثل الكيانات، التكوين، والخصائص) والبيانات (مثل الرسائل في قوائم الانتظار والمواضيع، وخصائص وحالة الرسالة) لمساحة الاسم. تقوم بتكوين نهج النسخ لتكوين وبيانات مساحة الأسماء الخاصة بك. تضمن هذه الميزة بقاء رسائلك متاحة في منطقة أخرى وتسمح لك بالتبديل إلى المنطقة الثانوية عند الحاجة.

استخدم Geo-Replication للسيناريوهات التي تتطلب مرونة ضد انقطاعات المناطق ولديها تحمل منخفض لفقدان بيانات الرسائل.

تمتد مساحة الاسم بشكل أساسي عبر المناطق. إحدى المناطق تعمل كمنطقة رئيسية، والمنطقة الأخرى كمنطقة ثانوية. اشتراكك في Azure يظهر مساحة اسم واحدة.

مخطط يوضح مساحة اسم ناقل الخدمة تم تكوينها للتكرار الجغرافي.

في أي وقت، يمكنك الترويج للمنطقة الثانوية إلى منطقة أساسية. عند الترويج للمنطقة الثانوية، يقوم Service Bus بإعادة توجيه اسم النطاق المؤهل بالكامل (FQDN) في مساحة الأسماء إلى المنطقة الثانوية المختارة ويخفض المنطقة الأساسية السابقة إلى منطقة ثانوية. يمكنك تحديد ما إذا كنت تريد إجراء عرض ترويجي مخطط له، مما يعني أنك تنتظر اكتمال النسخ المتماثل للبيانات، أو عرض ترويجي إجباري، مما قد يؤدي إلى فقدان البيانات.

Note

يستخدم Geo-Replication مصطلح حافلة الخدمة الترقية لأنه يمثل بشكل أفضل عملية الترقية إلى منطقة ثانوية إلى منطقة أولية (ثم خفض رتبة منطقة أولية إلى منطقة ثانوية). قد ترى أيضا مصطلح تجاوز الفشل المستخدم لوصف العملية العامة.

يلخص هذا القسم الجوانب المهمة للتكرار الجغرافي. راجع الوثائق الكاملة لفهم كيفية عملها بالضبط. لمزيد من المعلومات، راجع تكرار الناقل الخدمي.

Requirements

  • دعم المنطقة: يمكنك اختيار أي منطقة Azure تدعم Service Bus كمنطقتك الأساسية أو المنطقة الثانوية. لا تحتاج إلى استخدام المناطق المقترنة ب Azure، لذا يمكنك اختيار مناطق ثانوية استنادا إلى متطلبات زمن الانتقال أو التوافق أو موقع البيانات.

  • المستوي: لتمكين التكرار الجغرافي، يجب أن تستخدم مساحة الاسم الخاصة بك الطبقة المميزة.

  • البيانات الوصفية Geo-Disaster التعافي: لا يمكنك تكوين مساحة أسماء لاستخدام كل من Geo-Replication واستعادة Geo-Disaster.

الاعتبارات

  • قيود الميزات: عند تفعيل التكرار الجغرافي، هناك بعض القيود. لمزيد من المعلومات، راجع تكرار الناقل الخدمي.

  • نقاط النهاية الخاصة: إذا كنت تستخدم نقاط النهاية الخاصة للاتصال بمساحة الاسم الخاصة بك، فستحتاج أيضا إلى تكوين الشبكات في منطقتك الأساسية والثانوية. لمزيد من المعلومات، راجع نقاط النهاية الخاصة في وثائق Azure Event Hubs.

التكلفة

لفهم كيفية عمل التسعير في التكرار الجغرافي، راجع التسعير.

تكوين الدعم متعدد المناطق

السلوك عندما تكون جميع المناطق صحية

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحة اسم ناقل الخدمة للتكرار الجغرافي، وتكون المنطقة الأساسية عاملة.

  • توجيه حركة المرور بين المناطق: تتصل تطبيقات العميل من خلال FQDN لمساحة الاسم الخاصة بك، ومسارات حركة المرور الخاصة بها إلى المنطقة الأساسية.

    المنطقة الأساسية فقط تعالج الرسائل من العملاء بنشاط أثناء العمليات العادية. تستقبل المنطقة الثانوية رسائل مكررة لكنها تبقى سلبية في وضع الاستعداد.

  • تكرار البيانات بين المناطق: سلوك تكرار البيانات بين المنطقة الأساسية والثانوية يعتمد على ما إذا كنت تضبط اقتران النسخ ليستخدم التكرار المتزامن أو غير المتزامن.

    • متزامن: يتم تكرار الرسائل إلى المنطقة الثانوية قبل اكتمال عملية الكتابة.

      يوفر هذا الوضع أكبر ضمان بأن بيانات رسائلك آمنة لأنها يجب أن تكون في المنطقة الأساسية والثانوية. ومع ذلك، فإن التكرار المتزامن يزيد بشكل كبير من تأخير الكتابة للرسائل الواردة. كما يتطلب أن تكون المنطقة الثانوية متاحة لقبول عملية الكتابة، لذا يؤدي انقطاع في المنطقة الثانوية إلى فشل عملية الكتابة.

      • غير متزامن: تكتب الرسائل إلى المنطقة الأساسية ثم تكتمل عملية الكتابة. بعد فترة قصيرة، يقوم بتكرار الرسائل إلى المنطقة الثانوية.

      يوفر هذا الوضع معدل نقل كتابة أعلى من النسخ المتماثل المتزامن نظرا لعدم وجود زمن انتقال للنسخ المتماثل بين المناطق أثناء عمليات الكتابة. أيضا، يمكن لوضع النسخ غير المتزامن تحمل فقدان المنطقة الثانوية مع السماح بعمليات الكتابة في المنطقة الأساسية. ومع ذلك، إذا كانت المنطقة الأساسية بها انقطاع، فقد تكون أي بيانات لم يتم نسخها نسخا متماثلا بعد إلى المنطقة الثانوية غير متوفرة أو مفقودة.

      عند تكوين النسخ المتماثل غير المتزامن، يمكنك تكوين الحد الأقصى لوقت التأخير المقبول لاستغراقه النسخ المتماثل. في أي وقت، يمكنك التحقق من تأخر النسخ المتماثل الحالي باستخدام مقاييس Azure Monitor.

      إذا زاد تأخر النسخ المتماثل غير المتزامن إلى ما بعد الحد الأقصى الذي تحدده، تبدأ المنطقة الأساسية في تقييد الطلبات الواردة بحيث يمكن للنسخ المتماثل اللحاق بالركب. لتجنب هذا الموقف، من المهم تحديد المناطق الثانوية غير البعيدة جغرافيا جدا، والتأكد من أن سعتك كافية لمعدل النقل.

      بعض أنواع البيانات الوصفية يتم تكرارها بشكل متزامن حتى لو اخترت وضع النسخ غير المتزامن.

      لمزيد من المعلومات، راجع أوضاع النسخ المتماثل.

السلوك أثناء انقطاع المنطقة

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحة اسم ناقل الخدمة ل Geo-Replication ويحدث انقطاع في المنطقة الأساسية أو الثانوية.

  • الكشف والاستجابة: أنت مسؤول عن تحديد متى تروج للمنطقة الثانوية لمساحة الاسم لتصبح المنطقة الأساسية الجديدة. لا تتخذ Microsoft هذا القرار أو تبدأ العملية نيابة عنك، حتى إذا كان هناك انقطاع في المنطقة. للمعايير المقترحة التي يجب أخذها في الاعتبار عند اتخاذ قرار الفشل في التمرير، راجع السيناريوهات الموصى بها لتحفيز الترقية.

    لمزيد من المعلومات حول كيفية الترويج لمنطقة ثانوية للانتخابات التمهيدية الجديدة، راجع تدفق الترقية.

    عند الترويج لمنطقة ثانوية، اختر ما إذا كنت تريد إجراء عرض ترويجي مخطط له أو عرض ترويجي إجباري. ينتظر العرض الترويجي المخطط له أن تلحق المنطقة الثانوية بالركب قبل قبول حركة مرور جديدة. يقضي هذا النهج على فقدان البيانات ولكنه يقدم وقت التوقف عن العمل.

    أثناء انقطاع التيار الكهربائي في المنطقة الأساسية، تحتاج عادة إلى إجراء ترقية قسرية. إذا كانت المنطقة الأساسية متاحة وقمت بتشغيل عرض ترويجي لسبب آخر، يمكنك اختيار عرض ترويجي مخطط له.

  • إشعار: مايكروسوفت لا تخبرك تلقائيا عندما تكون المنطقة معطلة. ومع ذلك، يمكنك استخدام Azure Service Health لفهم الصحة العامة للخدمة، بما في ذلك أي أعطال في المناطق، ويمكنك إعداد تنبيهات صحة الخدمة لإبلاغك بالمشاكل.
  • الطلبات النشطة: يعتمد السلوك على ما إذا كان انقطاع المنطقة يحدث في المنطقة الأساسية أو في المنطقة الثانوية:

    • انقطاع المنطقة الأساسية: إذا كانت المنطقة الأساسية غير متوفرة، إنهاء جميع الطلبات النشطة. يجب أن تعيد طلبات العميل محاولة العمليات بعد اكتمال العرض الترويجي.

    • انقطاع المنطقة الثانوية: قد يتسبب الانقطاع في المنطقة الثانوية في حدوث مشكلات في الطلبات النشطة في الحالات التالية:

      • إذا كنت تستخدم وضع النسخ المتماثل المتزامن، فلن تتمكن المنطقة الأساسية من إكمال عمليات الكتابة إذا كانت أي منطقة ثانوية غير متوفرة.

      • إذا استخدمت وضع النسخ غير المتزامن، فإن مساحة الأسماء لديك ستقلل من سرعة ولا تقبل الرسائل الجديدة بعد أن يصل تأخر النسخ إلى الحد الأقصى الذي قمت بتكوينه.

      للاستمرار في استخدام مساحة الأسماء في المنطقة الأساسية، قم بإزالة مساحة الاسم الثانوية من تكوين Geo-Replication الخاص بك.

  • فقدان البيانات المتوقع: يعتمد مقدار فقدان البيانات على نوع العرض الترويجي الذي تقوم به (مخطط له أو إجباري) ووضع النسخ المتماثل (متزامن أو غير متزامن):

    • العرض الترويجي المخطط له: لا يتوقع فقدان البيانات. ومع ذلك ، أثناء انقطاع المنطقة ، قد لا يكون الترويج المخطط له ممكنا لأنه يتطلب توفر جميع المناطق الأولية والثانوية.

    • الترويج القسري، النسخ المتماثل المتزامن: لا يتوقع فقدان البيانات.

    • الترقية القسرية، التكرار غير المتزامن: قد تواجه بعض فقدان البيانات للرسائل الحديثة التي لم تنسخ إلى المنطقة الثانوية، وللتغييرات في الحالة التي لم تكرر بعد. يعتمد المبلغ على تأخر النسخ المتماثل. للتحقق من تأخر النسخ المتماثل الحالي، استخدم مقاييس Azure Monitor.

    إذا أجريت عرضا ترويجيا إلزاميا، لن تتمكن من استرداد البيانات المفقودة، حتى بعد توفر المنطقة الأساسية.

  • التوقف عن العمل المتوقع: يعتمد مقدار وقت التوقف المتوقع على ما إذا كنت ستنفذ عرضا ترويجيا مخططا أو إجباريا:

    • العرض الترويجي المخطط له: الخطوة الأولى في الترويج المخطط لها تكرر البيانات إلى المنطقة الثانوية. عادة ما تكتمل هذه العملية بسرعة ، ولكن في بعض الحالات ، قد يستغرق الأمر ما يصل إلى طول تأخر النسخ المتماثل. بعد اكتمال النسخ المتماثل ، تستغرق عملية الترويج عادة حوالي 5 إلى 10 دقائق. قد يستغرق الأمر أحيانا وقتا أطول لخوادم نظام أسماء النطاقات (DNS) لتحديث الإدخالات ونسخ سجلاتها بالكامل إلى العملاء.

      لا تقبل المنطقة الأساسية عمليات الكتابة أثناء عملية الترويج بأكملها.

      قد لا يكون هذا الخيار ممكنا أثناء انقطاع المنطقة لأنه يتطلب توفر جميع المناطق الأساسية والثانوية.

    • الترقية القسرية: خلال الترقية القسرية، لا تنتظر حافلة الخدمة حتى تكتمل عملية تكرار البيانات، وتبدأ الترقية فورا. تستغرق عملية الترويج عادة حوالي 5 إلى 10 دقائق. قد يستغرق الأمر أحيانا وقتا أطول حتى يتم نسخ إدخالات DNS وتحديثها بالكامل عبر العملاء.

      لا تقبل المنطقة الأساسية عمليات الكتابة أثناء عملية الترويج بأكملها.

  • إعادة توجيه حركة المرور: بعد اكتمال العرض الترويجي، يشير FQDN لمساحة الاسم إلى المنطقة الأساسية الجديدة. لكن إعادة التوجيه هذه تعتمد على مدى سرعة تحديث سجلات DNS الخاصة بالعملاء، بما في ذلك خوادم DNS الخاصة بهم لاحترام وقت البقاء (TTL) لسجلات DNS لمساحة الاسم.

انتعاش المنطقة

بعد استعادة المنطقة الأساسية الأصلية، إذا كنت تريد إعادة مساحة الاسم إلى منطقتها الأساسية الأصلية، فاتبع عملية ترويج المنطقة نفسها.

إذا أجريت عرضا ترويجيا إلزاميا أثناء انقطاع المنطقة، لن تتمكن من استرداد البيانات المفقودة، حتى بعد توفر المنطقة الأساسية.

اختبار حالات فشل المنطقة

لاختبار التكرار الجغرافي، قم مؤقتا بترقية المنطقة الثانوية إلى النقطة الأساسية وتحقق من أن تطبيقات العميل يمكنها التبديل بين المناطق مع أقل قدر من الانقطاع.

راقب مدة العرض الترويجي وتحقق من أن دفاتر التشغيل والأتمتة تعمل بشكل صحيح. بعد الاختبار ، يمكنك الفشل في العودة إلى التكوين الأصلي.

فهم وقت التوقف المحتمل وفقدان البيانات الذي قد تواجهه أثناء عملية العرض الترويجي وبعدها. اختبر Geo-Replication في بيئة غير إنتاجية تعكس تكوين مساحة اسم الإنتاج الخاصة بك.

البيانات الوصفية Geo-Disaster الاسترداد

الطبقة المميزة تدعم بيانات وصفية Geo-Disaster الاستعادة. تعمل هذه الميزة على تحسين التعافي من سيناريوهات الكوارث، بما في ذلك الخسارة الكارثية للمنطقة. Geo-Disaster Recovery يكرر فقط تكوين وبيانات التعريف لمساحة الأسماء الخاصة بك. ومع ذلك، لا يكرر بيانات الرسائل. لدعم التعافي من الكوارث، تضمن هذه الميزة أن مساحة الأسماء في منطقة أخرى تكون مهيأة مسبقا وجاهزة لاستقبال الرسائل من العملاء فورا. يعمل Geo-Disaster Recovery كحل استرداد أحادي الاتجاه ولا يدعم العودة إلى المنطقة الأساسية السابقة.

تعمل ميزة استعادة البيانات الوصفية Geo-Disaster بشكل أفضل للتطبيقات التي لا تحتاج فقط إلى صيانة كل رسالة ويمكنها تحمل فقدان بعض البيانات أثناء سيناريو الكوارث. قد يكون Metadata Geo-Disaster Recovery مناسبا أيضا للتطبيقات التي تكرر البيانات بنفسها، أو التي لا تحتاج إلى تكرار البيانات على الإطلاق. على سبيل المثال، إذا كانت رسائلك تمثل صورا كبيرة تقوم لاحقا بتحويلها إلى صور مصغرة، قد تقرر أنه يمكنك تحمل فقدان بعض الرسائل من منطقة فاشلة إذا استطعت بسرعة استئناف معالجة الرسائل الجديدة في منطقة أخرى، ويمكنك إعادة بناء الرسائل لاحقا لتعويض الركب.

Important

يتيح Geo-Disaster Recovery استمرارية العمليات التي لها نفس التكوين لكنها لا تكرر بيانات الرسائل. إذا كنت بحاجة لتكرار بيانات الرسائل، فكر في استخدام Geo-Replication.

عند تكوين البيانات الوصفية Geo-Disaster الاستعادة، فإنك تنشئ اسما مستعارا تتصل به تطبيقات العميل. الاسم المستعار هو FQDN يوجه جميع نسبة استخدام الشبكة إلى مساحة الاسم الأساسية بشكل افتراضي.

مخطط يوضح حافتين اسميين لناقل الخدمة تم تكوينهما للبيانات الوصفية Geo-Disaster الاستعادة.

في حالة فشل المنطقة الأساسية أو حدوث نوع آخر من الكوارث، يمكنك بدء نقل تجاوز الفشل لمرة واحدة أحادي الاتجاه يدويا من المنطقة الأساسية إلى المنطقة الثانوية في أي وقت. يمكنك اختيار إجراء تحويل آمن للعمل، والذي ينتظر إكمال النسخ قبل الانتقال إلى الثانوي، رغم أن هذا الخيار قد لا يكون متاحا أثناء انقطاع المنطقة. بمجرد بدء التحويل التلقائي، يكتمل تقريبا على الفور. خلال عملية التجاوز الخاطئ، يعيد اسم الاسترداد Geo-Disaster الإشارة إلى مساحة الأسماء الثانوية ويتم إزالة الاقتران.

يلخص هذا القسم الجوانب المهمة لاستعادة Geo-Disaster. راجع الوثائق الكاملة لفهم كيفية عملها بالضبط. لمزيد من المعلومات، راجع Geo-Disaster استعادة حافلة الخدمة.

Requirements

  • دعم المنطقة: يمكنك اختيار أي منطقة Azure تدعم Service Bus كمساحة اسم أساسية أو ثانوية. لا تحتاج إلى استخدام المناطق المقترنة ب Azure، لذا يمكنك اختيار مناطق ثانوية استنادا إلى متطلبات زمن الانتقال أو التوافق أو موقع البيانات.

  • المستوي: لتمكين البيانات الوصفية Geo-Disaster الاستعادة، يجب أن تستخدم كلا المساعي الاسميين الطبقة المميزة.

  • تقسيم: لا يمكن إقران مساحة اسم مقسمة مع مساحة اسم غير مقسمة.

  • البيانات الوصفية Geo-Disaster التعافي: لا يمكنك تكوين مساحة أسماء لاستخدام كل من Geo-Replication واستعادة Geo-Disaster.

الاعتبارات

  • قيود الميزات: عند تفعيل Geo-Disaster Recovery، هناك بعض القيود. لمزيد من المعلومات، راجع النقاط المهمة التي يجب أخذها في الاعتبار والاعتبارات.

  • تعيينات الأدوار: لا يتم نسخ تعيينات التحكم في الوصول المستند إلى الدور (RBAC) من Microsoft Entra إلى الكيانات الموجودة في مساحة الاسم الأساسية إلى مساحة الاسم الثانوية. قم بإنشاء تعيينات الأدوار يدويًا في مساحة الاسم الثانوية لتأمين الوصول إليها.

  • تصميم التطبيق: يتطلب Geo-Disaster الاستعادة اعتبارات محددة عند تصميم تطبيقات العميل. لمزيد من المعلومات، راجع الاعتبارات.

  • نقاط النهاية الخاصة: إذا كنت تستخدم نقاط نهاية خاصة للاتصال بمساحة الاسم الخاصة بك، فقم بتكوين الشبكات في كل من منطقتك الأساسية والثانوية. لمزيد من المعلومات، راجع نقاط النهاية الخاصة.

  • انتقلت مساحات الأسماء من القياسية إلى المميزة: إذا كانت مساحة الاسم الخاصة بك سابقا في المستوى القياسي وقمت بنقلها إلى المستوى المميز، عليك التعامل مع الاسم المستعار بشكل مختلف. لمزيد من المعلومات، راجع خدمة الحافلة القياسية إلى المميزة.

التكلفة

عند تفعيل البيانات الوصفية Geo-Disaster Recovery، تدفع مقابل كل من المساحات الأساسية والثانوية.

تكوين الدعم متعدد المناطق

تخطيط القدرات وإدارتها

عندما تخطط لعمليات توزيع متعددة المناطق، تأكد من أن كلتا المنطقتين لديهما سعة كافية للتعامل مع الحمل الكامل في حالة فشل منطقة واحدة. تظل المنطقة الثانوية سلبية أثناء العمليات العادية، ولكن يجب أن تتعامل على الفور مع حركة المرور بعد تجاوز الفشل. خطط لكيفية توسيع نطاق سعة مساحة الاسم الثانوية بحيث يمكنها تلقي حركة مرور الإنتاج دون تأخير. إذا كان بإمكانك تحمل وقت تعطل إضافي أثناء عملية تجاوز الفشل، فقد تختار توسيع نطاق سعة مساحة الاسم الثانوية أثناء تجاوز الفشل أو بعده. لتقليل وقت التوقف عن العمل، قم بتوفير السعة في مساحة الاسم الثانوية مسبقا بحيث تظل جاهزة لتلقي حمل الإنتاج.

السلوك عندما تكون جميع المناطق صحية

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحة اسم ناقل الخدمة لاستعادة Geo-Disaster، وتكون المنطقة الأساسية عاملة.

  • توجيه حركة المرور بين المناطق: تتصل تطبيقات العميل عبر اسم مستعار Geo-Disaster Recovery لمساحة الاسم الخاصة بك، وتتجه حركة المرور إلى مساحة الأسماء الأساسية في المنطقة الأساسية.

    فقط مساحة الأسماء الأساسية تعالج الرسائل من العملاء بنشاط أثناء العمليات العادية. تظل مساحة الاسم الثانوية سلبية في وضع الاستعداد، وتفشل أي طلبات للوصول إلى البيانات.

  • النسخ المتماثل للبيانات بين المناطق: يتم نسخ بيانات تعريف التكوين فقط بين مساحات الأسماء. يحدث النسخ المتماثل للتكوين بشكل مستمر وغير متزامن.

    تبقى جميع بيانات الرسائل في الفضاء الأساسي فقط ولا تتكاثر إلى مساحة الاسم الثانوية.

السلوك أثناء انقطاع المنطقة

يصف هذا القسم ما يمكن توقعه عندما يتم تكوين مساحة اسم ناقل الخدمة لاستعادة Geo-Disaster ويحدث انقطاع في المنطقة الأساسية.

  • الكشف والاستجابة: أنت مسؤول عن مراقبة سلامة المنطقة وبدء تجاوز الفشل يدويا. لا تقوم Microsoft بإجراء تجاوز الفشل أو ترقية منطقة ثانوية تلقائيا، حتى إذا كانت منطقتك الأساسية معطلة.

    لمزيد من المعلومات حول كيفية بدء التحويل التلقائي، راجع تدفق الفشل (Failoverflow).

    عند بدء تجاوز الفشل (failover) تختار ما إذا كنت ستقوم بتجاوز آمن أو بنظام قياسي (تجاوز إجباري أو يدوي). ينتظر التحويل الآمن حتى يكتمل التكرار إلى المنطقة الثانوية قبل بدء التحويل. يقلل هذا النهج من فقدان البيانات الوصفية لكنه يدخل وقت التوقف عن العمل. يتطلب التبديل الآمن أن تكون المساحات الاسمية ضمن نفس اشتراك Azure.

    أثناء انقطاع الكهرباء في المنطقة الأساسية، عادة ما تحتاج إلى إجراء تحويل إجباري للفشل (failover). إذا كانت المنطقة الأساسية متاحة وقمت بتفعيل التحويل لسبب آخر، قد تختار التحويل المخطط له.

    التحويل التلقائي هو عملية باتجاه واحد، لذا تحتاج إلى إعادة إنشاء اقتران Geo-Disaster Recovery لاحقا. لمزيد من المعلومات، راجع استرداد المنطقة.

  • إشعار: مايكروسوفت لا تخبرك تلقائيا عندما تكون المنطقة معطلة. ومع ذلك، يمكنك استخدام Azure Service Health لفهم الصحة العامة للخدمة، بما في ذلك أي أعطال في المناطق، ويمكنك إعداد تنبيهات صحة الخدمة لإبلاغك بالمشاكل.
  • الطلبات النشطة: تنتهي الطلبات النشطة قيد التقدم عند بدء تجاوز الفشل. يجب أن تعيد تطبيقات العميل محاولة العمليات بعد اكتمال تجاوز الفشل.

  • فقدان البيانات المتوقع:

    • البيانات الوصفية: عادة ما يتم نسخ التكوين وبيانات التعريف إلى مساحة الاسم الثانوية. لكن النسخ المتماثل للبيانات الوصفية يحدث بشكل غير متزامن ، لذلك قد لا يتم تكرار التغييرات الأخيرة ، خاصة التغييرات المعقدة. تحقق من تكوين مساحة الاسم الثانوية قبل وصول العملاء إليها.

    • بيانات الرسائل: بيانات الرسائل لا تتكرر بين المناطق. إذا توقفت المنطقة الأساسية، تصبح الرسائل في مساحة الاسم الأساسية غير متاحة.

      الرسائل لا تضيع بشكل دائم إلا إذا تسببت كارثة كارثية في فقدان كامل للمنطقة الأساسية. إذا تعافت المنطقة، يمكنك استرجاع الرسائل من مساحة الأسماء الأساسية لاحقا.

  • التوقف عن العمل المتوقع: يحدث تجاوز الفشل عادة في غضون 5 إلى 10 دقائق. قد يستغرق العملاء وقتا أطول لنسخ إدخالات DNS وتحديثها بالكامل.

  • إعادة توجيه حركة المرور: العملاء الذين يستخدمون اسم مستعارة Geo-Disaster Recovery للاتصال بمساحة الأسماء يعيدون توجيههم تلقائيا إلى مساحة الاسم الثانوية بعد التحويل التلقائي. لكن إعادة التوجيه هذه تعتمد على خوادم DNS التي تحترم TTL لسجلات DNS لمساحة الاسم والعملاء الذين يتلقون سجلات DNS المحدثة هذه.

انتعاش المنطقة

بعد استعادة المنطقة الأساسية الأصلية، يجب إعادة إنشاء الاقتران يدويا والفشل اختياريا مرة أخرى. أنشئ اقتران جديد لاستعادة Geo-Disaster مع المنطقة المستردة كمنطقة ثانوية، ثم قم بإعادة الفشل مرة أخرى إذا أردت العودة إلى المنطقة الأصلية. تتضمن هذه العملية فقدان محتمل لبيانات الرسائل المرسلة إلى المنصة المؤقتة.

إذا تسببت الكارثة في فقدان جميع المناطق في المنطقة الأساسية، فقد تكون بياناتك غير قابلة للاسترداد. في سيناريوهات أخرى، تبقى بيانات رسائلك في مساحة الأسماء الأساسية من قبل أن يكون التبديل السريع قابلا للاسترجاع. يمكنك الحصول على رسائل تاريخية من مساحة الأسماء الأساسية القديمة بعد استعادة الوصول. أنت مسؤول عن تكوين تطبيقاتك لاستقبال ومعالجة تلك الرسائل. لا تقوم Microsoft باستعادتها تلقائيا إلى منطقتك الثانوية.

اختبار حالات فشل المنطقة

لاختبار عمليات الاستجابة والتعافي من الكوارث، قم بإجراء تجاوز فشل مخطط له أثناء نافذة الصيانة. ابدأ التحويل من مساحة الاسم الأساسية إلى مساحة الاسم الثانوية وتحقق من أن تطبيقاتك يمكنها الاتصال ومعالجة الرسائل من المساحة الأساسية الجديدة.

راقب مدة تجاوز الفشل وتحقق من أن دفاتر التشغيل والأتمتة تعمل بشكل صحيح. بعد الاختبار ، يمكنك الفشل في العودة إلى التكوين الأصلي.

فهم وقت التوقف المحتمل وفقدان البيانات الذي قد تواجهه أثناء عملية تجاوز الفشل وبعدها. اختبر بيانات وصفية Geo-Disaster الاستعادة في بيئة غير إنتاجية تعكس تكوين مساحة اسم الإنتاج الخاصة بك.

حلول مخصصة متعددة المناطق للمرونة

توفر Geo-Replication والبيانات الوصفية Geo-Disaster الاستعادة مرونة ضد انقطاعات المناطق والمشاكل الأخرى، وهي مناسبة لمعظم أعباء العمل. ومع ذلك، قد لا تلبي احتياجاتك في الحالات التالية:

  • لديك متطلبات للتكرار المخصص أو للحفاظ على عدة مناطق نشطة في نفس الوقت.
  • تستخدم مستوى حافلة الخدمة لا يدعم هذه الميزات.

هناك مجموعة من أنماط التصميم لتحقيق أنواع مختلفة من الدعم متعدد المناطق في Service Bus. تتطلب العديد من الأنماط نشر عدة مساحات أسماء وتكوين تطبيقك لاستخدام المساحات الاسمية بشكل مناسب. لمعرفة المزيد، راجع المقالات التالية:

المرونة في صيانة الخدمة

تقوم حافلة الخدمة بصيانة منتظمة. خلال الصيانة المخططة، يتم نقل مساحات الأسماء إلى عقدة احتياطية تحتوي على أحدث التحديثات. مع حدوث هذه النقل، تنفصل SDK الخاصة بالعميل وتعيد الاتصال تلقائيا على مساحة الأسماء. عادة ما تحدث الترقيات خلال 30 ثانية. من المهم أن تكون طلباتك مستعدة لأي انقطاعات عابرة في الشبكة تحدث خلال فترات الصيانة.

لمزيد من المعلومات، راجع إرشادات حول أحداث صيانة Azure لحافلة الخدمة Azure.

النسخ الاحتياطي والاستعادة

ناقل الخدمة ليس مصمما كموقع تخزين طويل الأمد لبياناتك. عادة، يتم تخزين البيانات في موضوع أو طابور لفترة قصيرة، ثم تتم معالجتها أو حفظها في نظام تخزين بيانات آخر، وعندها يتم حذفها. بسبب هذا التصميم، يحتفظ ناقل الخدمة تلقائيا بنسخ مقلدة من بيانات الرسائل، لكنه لا يوفر إمكانية النسخ الاحتياطي والاستعادة لبيانات الرسائل.

بالنسبة للسيناريوهات التي تتطلب الاحتفاظ بالرسائل على المدى الطويل، فكر في تنفيذ أرشفة على مستوى التطبيق إلى Azure Storage أو خدمات التخزين الدائمة الأخرى.

اتفاقية مستوى الخدمة

تصف اتفاقية مستوى الخدمة (SLA) لخدمات Azure التوفر المتوقع لكل خدمة والشروط التي يجب أن يفي بها الحل الخاص بك لتحقيق توقع التوفر هذا. لمزيد من المعلومات، راجع اتفاقيات مستوى الخدمة للخدمات عبر الإنترنت.

يوفر حافلة الخدمة اتفاقية مستوى مستوى (SLA) لجميع مساحات الأسماء. تكون اتفاقية مستوى الخدمة المتاحة أعلى عندما تستوفي مساحة الاسم جميع المعايير التالية:

  • يستخدم الفئة المميزة.
  • يقع في منطقة بها مناطق توفر.
  • يستخدم التقسيم.