التعافي من الكوارث وتجاوز الفشل لملفات Azure

تسعى Microsoft جاهدة لضمان إتاحة خدمات Azure دائمًا. ومع ذلك، قد تحدث انقطاعات غير مخطط لها في الخدمة، ويجب أن يكون لديك خطة للتعافي من الكوارث (DR) للتعامل مع انقطاع الخدمة الإقليمي. يتم التحضير لجزء هام من خطة استرداد الكوارث للفشل إلى نقطة النهاية الثانوية في حالة عدم وجود نقطة النهاية الأساسية. توضح هذه المقالة المفاهيم والعمليات المتضمنة في التعافي من الكوارث (DR) وتجاوز فشل حساب التخزين.

هام

لا تدعم Azure File Sync تجاوز فشل حساب التخزين إلا إذا فشلت خدمة مزامنة التخزين أيضا. وذلك لأن Azure File Sync يتطلب أن يكون حساب التخزين وخدمة مزامنة التخزين في نفس منطقة Azure. إذا تم تجاوز فشل حساب التخزين فقط، فستفشل عمليات المزامنة والطبقة السحابية حتى يتم تجاوز فشل خدمة مزامنة التخزين إلى المنطقة الثانوية. إذا كنت ترغب في تجاوز الفشل عبر حساب تخزين يحتوي على مشاركات ملفات Azure التي يتم استخدامها كنقاط نهاية سحابية في Azure File Sync، راجع أفضل ممارسات استرداد الكوارث ل Azure File Sync واسترداد خادم Azure File Sync.

مقاييس الاسترداد والتكاليف

لصياغة استراتيجية فعالة للتعافي من الكوارث، يجب أن تفهم المؤسسة ما يلي:

  • كم من البيانات يمكن أن تتحمل خسارتها في حالة حدوث انقطاع (هدف نقطة الاسترداد أو هدف نقطة الاسترداد)
  • مدى السرعة التي يحتاجها لكي يكون قادرا على استعادة وظائف الأعمال والبيانات (هدف وقت الاسترداد أو RTO)

تزداد تكلفة الاسترداد بعد الكوارث بشكل عام مع RPO/RTO أقل أو صفر. الشركات التي تحتاج إلى أن تكون قيد التشغيل في غضون ثوان قليلة بعد وقوع كارثة ولا يمكنها تحمل أي فقدان للبيانات ستدفع المزيد مقابل الاسترداد بعد الكارثة، بينما ستدفع الشركات ذات أرقام RPO/RTO أعلى أقل. يوفر Azure حلولا يمكنها العمل مع متطلبات RPO وRTO المختلفة.

اختيار خيار التكرار المناسب

توفر Azure Files خيارات تكرار مختلفة لحماية بياناتك من الأحداث المخطط لها وغير المخطط لها بدءا من حالات الفشل العابر للأجهزة وانقطاع الشبكة والطاقة، إلى الكوارث الطبيعية. يمكن لجميع مشاركات ملفات Azure استخدام التخزين المتكرر محليا (LRS) أو التخزين المتكرر في المنطقة (ZRS). لمزيد من المعلومات، راجع تكرار ملفات Azure.

تدعم Azure Files تجاوز فشل الحساب لحسابات التخزين القياسية المكونة مع التخزين المتكرر جغرافيا (GRS) والتخزين المتكرر للمنطقة الجغرافية (GZRS) للحماية من الانقطاعات الإقليمية. باستخدام تجاوز فشل الحساب، يمكنك بدء عملية تجاوز الفشل لحساب التخزين الخاص بك إذا أصبحت نقطة النهاية الأساسية غير متوفرة. يقوم تجاوز الفشل بتحديث نقطة النهاية الثانوية لتصبح نقطة النهاية الأساسية لحساب التخزين الخاص بك. بمجرد اكتمال تجاوز الفشل، يمكن للعملاء البدء في الكتابة إلى نقطة النهاية الأساسية الجديدة.

لا يزال GRS وGZRS ينطويان على خطر فقدان البيانات لأنه يتم نسخ البيانات إلى المنطقة الثانوية بشكل غير متزامن، ما يعني أن هناك تأخيرا قبل نسخ الكتابة إلى المنطقة الأساسية إلى المنطقة الثانوية. في حالة انقطاع التيار الكهربائي، سيتم فقدان عمليات الكتابة إلى نقطة النهاية الأساسية التي لم يتم نسخها بعد إلى نقطة النهاية الثانوية. وهذا يعني أن الفشل الذي يؤثر على المنطقة الأساسية قد يؤدي إلى فقدان البيانات إذا تعذر استرداد المنطقة الأساسية. الفاصل الزمني بين أحدث عمليات الكتابة إلى المنطقة الأساسية وآخر كتابة إلى المنطقة الثانوية هو RPO. عادة ما يكون لدى Azure Files RPO لمدة 15 دقيقة أو أقل، على الرغم من عدم وجود اتفاقية على مستوى الخدمة حاليا حول المدة التي يستغرقها نسخ البيانات إلى المنطقة الثانوية.

هام

GRS/GZRS غير مدعوم لمشاركات ملفات Azure المتميزة. ومع ذلك، يمكنك المزامنة بين مشاركتي ملفات Azure لتحقيق التكرار الجغرافي.

التصميم لقابلية الوصول العالية

من المهم تصميم تطبيقك لجعله متوفرًا بشكل كبير من البداية. راجع موارد Azure هذه للحصول على إرشادات حول تصميم تطبيقك والتخطيط للتعافي من الكوارث:

نوصي أيضا بتصميم التطبيق الخاص بك للتحضير لإمكانية فشل الكتابة. يجب أن يعرض تطبيقك حالات فشل الكتابة بطريقة تنبهك إلى احتمال حدوث انقطاع في المنطقة الأساسية.

كأفضل ممارسة، قم بتصميم التطبيق الخاص بك للتحقق من خاصية آخر وقت مزامنة لتقييم فقدان البيانات المتوقع. على سبيل المثال، إذا كنت تقوم بتسجيل جميع عمليات الكتابة، فيمكنك مقارنة وقت عمليات الكتابة الأخيرة بوقت المزامنة الأخير لتحديد عمليات الكتابة التي لم تتم مزامنتها مع الثانوي.

تتبع الانقطاعات

يمكنك الاشتراك في Azure Service Health Dashboard لتتبع صحة وحالة Azure Files وخدمات Azure الأخرى.

فهم عملية تجاوز فشل الحساب

يتيح لك تجاوز فشل الحساب المدار من قبل العميل فشل حساب التخزين بالكامل في المنطقة الثانوية إذا أصبح الحساب الأساسي غير متوفر لأي سبب من الأسباب. عند فرض تجاوز فشل إلى المنطقة الثانوية، يمكن للعملاء البدء في كتابة البيانات إلى نقطة النهاية الثانوية بعد اكتمال تجاوز الفشل. عادة ما يستغرق تجاوز الفشل حوالي ساعة. نوصي بتعليق حمل العمل قدر الإمكان قبل بدء تجاوز فشل الحساب.

لمعرفة كيفية بدء تجاوز فشل حساب، راجع بدء تجاوز فشل الحساب.

كيفية عمل تجاوز الفشل في الحساب

في ظل الظروف العادية، يكتب العميل البيانات إلى حساب تخزين في المنطقة الأساسية، ويتم نسخ هذه البيانات بشكل غير متزامن إلى المنطقة الثانوية. تعرض الصورة التالية السيناريو عند توفر المنطقة الأساسية:

رسم تخطيطي يوضح كيفية كتابة العملاء للبيانات إلى حساب التخزين في المنطقة الأساسية.

إذا أصبحت نقطة النهاية الأساسية غير متوفرة لأي سبب من الأسباب، فلن يتمكن العميل من الكتابة إلى حساب التخزين. توضح الصورة التالية السيناريو الذي أصبح فيه الأساسي غير متوفر، ولكن لم يحدث أي استرداد حتى الآن:

رسم تخطيطي يوضح أن الأساسي غير متوفر، لذلك لا يمكن للعملاء كتابة البيانات.

يبدأ العميل تجاوز فشل الحساب إلى نقطة النهاية الثانوية. تقوم عملية تجاوز الفشل بتحديث إدخال DNS الذي يوفره Azure Storage بحيث تصبح نقطة النهاية الثانوية نقطة النهاية الأساسية الجديدة لحساب التخزين الخاص بك، كما هو موضح في الصورة التالية:

رسم تخطيطي يوضح بدء العميل تجاوز فشل الحساب إلى نقطة النهاية الثانوية.

تتم استعادة الوصول إلى الكتابة للحسابات الزائدة جغرافيًا بمجرد تحديث إدخال DNS وتوجيه الطلبات إلى نقطة النهاية الأساسية الجديدة. تظل نقاط نهاية خدمة التخزين الحالية كما هي بعد تجاوز الفشل. لا يتم الاحتفاظ بمقابض الملفات وعقود الإيجار عند تجاوز الفشل، لذلك يجب على العملاء إلغاء تحميل مشاركات الملفات وإعادة تحميلها.

هام

بعد اكتمال تجاوز الفشل، يتم تكوين حساب التخزين ليكون زائدا عن الحاجة محليا في نقطة النهاية/المنطقة الأساسية الجديدة. لاستئناف النسخ المتماثل إلى المرحلة الثانوية الجديدة، قم بتكوين حساب التكرار الجغرافي مرة أخرى.

ضع في اعتبارك أن تحويل حساب تخزين متكرر محليًا لاستخدام التكرار الجغرافي يتكبد التكلفة والوقت على حد سواء. لمزيد من المعلومات، راجع الآثار الهامة المترتبة على تجاوز فشل الحساب.

توقع فقدان البيانات

تنبيه

عادة ما ينطوي تجاوز فشل الحساب على بعض فقدان البيانات. من المهم فهم الآثار المترتبة على بدء تجاوز فشل الحساب.

نظرا لأن البيانات تتم كتابتها بشكل غير متزامن من المنطقة الأساسية إلى المنطقة الثانوية، إذا أصبحت المنطقة الأساسية غير متوفرة، فربما لم يتم نسخ أحدث عمليات الكتابة بعد إلى المنطقة الثانوية.

عند فرض تجاوز فشل، يتم فقدان كافة البيانات في المنطقة الأساسية حيث تصبح المنطقة الثانوية المنطقة الأساسية الجديدة. يتم تكوين المنطقة الأساسية الجديدة لتكون زائدة عن الحاجة محليًا بعد تجاوز الفشل.

يتم الاحتفاظ بجميع البيانات التي تم نسخها بالفعل إلى الثانوي عند حدوث تجاوز الفشل. ومع ذلك، سيتم فقدان أي بيانات مكتوبة إلى الأساسي لم يتم نسخها أيضا إلى الثانوي بشكل دائم.

تحقق من خاصية وقت آخر مزامنة

تشير الخاصية وقت المزامنة الأخير (LST) إلى أحدث وقت تضمن فيه كتابة البيانات من المنطقة الأساسية إلى المنطقة الثانوية. تتوفر جميع البيانات المكتوبة قبل وقت المزامنة الأخير على المستوى الثانوي، بينما قد لا تتم كتابة البيانات المكتوبة بعد وقت المزامنة الأخير إلى الثانوي وقد يتم فقدانها. استخدم هذه الخاصية في حالة انقطاع لتقدير مقدار فقدان البيانات الذي قد تتكبده عن طريق بدء تجاوز فشل الحساب.

للتأكد من أن مشاركات الملفات في حالة متناسقة عند حدوث تجاوز فشل، يتم إنشاء لقطة نظام في المنطقة الأساسية كل 15 دقيقة ويتم نسخها نسخا متماثلا إلى المنطقة الثانوية. عند حدوث تجاوز فشل للمنطقة الثانوية، ستستند حالة المشاركة إلى أحدث لقطة نظام في المنطقة الثانوية. إذا حدث فشل في المنطقة الأساسية، فمن المحتمل أن تكون المنطقة الثانوية خلف المنطقة الأساسية، حيث لن يتم بعد نسخ جميع عمليات الكتابة إلى الأساسي إلى المنطقة الثانوية. نظرا للتأخر الجغرافي أو مشكلات أخرى، قد تكون أحدث لقطة للنظام في المنطقة الثانوية أقدم من 15 دقيقة.

تم نسخ جميع عمليات الكتابة المكتوبة إلى المنطقة الأساسية قبل LST بنجاح إلى المنطقة الثانوية، ما يعني أنها متاحة للقراءة من المنطقة الثانوية. قد يتم نسخ أي عمليات كتابة مكتوبة إلى المنطقة الأساسية بعد وقت المزامنة الأخير أو ربما لم يتم نسخها نسخا متماثلا إلى المنطقة الثانوية، ما يعني أنها قد لا تكون متوفرة لعمليات القراءة.

يمكنك الاستعلام عن قيمة الخاصية Last Sync Time باستخدام Azure PowerShell أو Azure CLI أو مكتبة العميل. الخاصية وقت المزامنة الأخير هي قيمة تاريخ/ وقت غرينيتش. لمزيد من المعلومات، راجع التحقق من الخاصية وقت المزامنة الأخير لحساب تخزين.

توخي الحذر عند الفشل في العودة إلى المرحلة الأساسية الأصلية

كما ذكر سابقا، بعد تجاوز الفشل من المنطقة الأساسية إلى المنطقة الثانوية، يتم تكوين حساب التخزين الخاص بك ليكون مكرر محليا في المنطقة الأساسية الجديدة. يمكنك بعد ذلك تكوين الحساب في المنطقة الأساسية الجديدة للتكرار الجغرافي. عندما يتم تكوين الحساب للتكرار الجغرافي بعد تجاوز الفشل، تبدأ المنطقة الأساسية الجديدة على الفور في نسخ البيانات إلى المنطقة الثانوية الجديدة، والتي كانت الأساسية قبل تجاوز الفشل الأصلي. ومع ذلك، قد يستغرق الأمر بعض الوقت قبل نسخ البيانات الموجودة في الأساسي الجديد بالكامل إلى الثانوي الجديد.

بعد إعادة تكوين حساب التخزين للتكرار الجغرافي، من الممكن بدء عملية استرداد فشل من الإصدار الأساسي الجديد إلى الإصدار الثانوي الجديد. في هذه الحالة، تصبح المنطقة الأساسية الأصلية قبل تجاوز الفشل المنطقة الأساسية مرة أخرى، ويتم تكوينها لتكون إما زائدة عن الحاجة محليا أو متكررة في المنطقة، اعتمادا على ما إذا كان التكوين الأساسي الأصلي هو GRS أو GZRS. يتم فقدان كافة البيانات في المنطقة الأساسية بعد تجاوز الفشل (الثانوية الأصلية) في أثناء عملية إعادة الفشل. إذا لم يتم نسخ معظم البيانات الموجودة في حساب التخزين إلى الثانوي الجديد قبل أن تفشل مرة أخرى، فقد تعاني من فقدان كبير للبيانات.

لتجنب فقدان كبير للبيانات، تحقق من قيمة الخاصية "وقت المزامنة الأخير" قبل الفشل. قارن آخر وقت مزامنة بآخر مرة تمت فيها كتابة البيانات إلى الإصدار الأساسي الجديد لتقييم فقدان البيانات المتوقع.

بعد عملية رد الفشل، يمكنك تكوين المنطقة الأساسية الجديدة لتكون زائدة عن الحاجة جغرافيًا مرة أخرى. إذا تم تكوين الأساسي الأصلي ل LRS، يمكنك تكوينه ليكون GRS. إذا تم تكوين الأساسي الأصلي ل ZRS، يمكنك تكوينه ليكون GZRS. للحصول على خيارات إضافية، راجع تغيير كيفية نسخ حساب التخزين على نسخة متماثلة.

بدء تجاوز فشل الحساب

يمكنك بدء تجاوز فشل الحساب من مدخل Microsoft Azure أو PowerShell أو Azure CLI أو واجهة برمجة تطبيقات موفر موارد تخزين Azure. لمزيد من المعلومات حول كيفية بدء تجاوز الفشل، راجع بدء تجاوز فشل الحساب.

تجاوز الفشل المدار من Microsoft

في الظروف القصوى التي تفقد فيها منطقة بسبب كارثة كبيرة، قد تبدأ Microsoft في تجاوز الفشل الإقليمي. في هذه الحالة، لا يلزم اتخاذ أي إجراء من جانبك. إلى أن يكتمل تجاوز الفشل المدار من قبل Microsoft، لن تتمكن من الوصول للكتابة إلى حساب التخزين الخاص بك.

(راجع أيضًا )