إصلاحات المثيل التلقائية لمجموعات مقياس الجهاز الظاهري Azure

هام

إجراءات الإصلاح Reimage و Restart موجودة حاليا في PREVIEW. للحصول على الشروط القانونية التي تنطبق على ميزات Azure الموجودة في الإصدار التجريبي، أو المعاينة، أو التي لم يتم إصدارها بعد في التوفر العام، راجع شروط الاستخدام التكميلية لمعاينات Microsoft Azure. قد تتغير بعض جوانب هذه الميزة قبل التوفر العام (GA).

يساعد تمكين الإصلاحات التلقائية للمثيلات لمجموعات مقياس الجهاز الظاهري Azure على تحقيق قابلية وصول عالية للتطبيقات من خلال الحفاظ على مجموعة من المثيلات السليمة. إذا تم العثور على مثيل غير صحي بواسطة ملحق Application Health أو فحوصات صحة موازن التحميل، فستحاول إصلاحات المثيل التلقائي استرداد المثيل عن طريق تشغيل إجراءات الإصلاح مثل حذف المثيل غير السليم وإنشاء مثيل جديد لاستبداله، أو إعادة تعيين مثيل غير سليم (معاينة)، أو إعادة تشغيل المثيل غير السليم (معاينة).

متطلبات استخدام إصلاحات المثيل التلقائية

تمكين مراقبة صحة التطبيق لمجموعة تغيير السعة

ينبغي أن تحتوي مجموعة تغيير السعة على مراقبة صحة التطبيق للمثيلات في حالة التمكين. يمكن إجراء مراقبة السلامة باستخدام ملحق Application Health أو فحوصات صحة موازن التحميل، حيث يمكن تمكين واحد فقط في كل مرة. يقوم ملحق صحة التطبيق أو موازن الحمل بفحص نقطة نهاية التطبيق التي تم تكوينها على مثيلات الجهاز الظاهري لتحديد حالة صحة التطبيق. يتم استخدام حالة الصحة هذه بواسطة منسق مجموعة تغيير السعة لمراقبة صحة المثيل وإجراء الإصلاحات عند الحاجة.

تكوين نقطة النهاية لتوفير حالة الصحة

قبل تمكين نهج إصلاح المثيل التلقائي، تأكد من أن مثيلات مجموعة المقياس الخاصة بك تحتوي على نقطة نهاية تطبيق تم تكوينها لإصدار حالة صحة التطبيق. لتكوين الحالة الصحية على ملحق Application Health، يمكنك استخدام إما Binary Health States أو Rich Health States. لتكوين الحالة الصحية باستخدام فحوصات صحة موازن التحميل، راجع سلوك الفحص.

بالنسبة إلى المثيلات التي تم وضع علامة عليها على أنها "غير سليمة" أو "غير معروفة" (تتوفر الحالة غير المعروفة فقط مع ملحق Application Health - Rich Health States)، يتم تشغيل الإصلاحات التلقائية بواسطة مجموعة المقياس. تأكد من تكوين نقطة نهاية التطبيق بشكل صحيح قبل تمكين نهج الإصلاحات التلقائية لتجنب إصلاحات المثيل غير المقصودة، أثناء تكوين نقطة النهاية.

إصدار API

يتم دعم نهج الإصلاحات التلقائية لإصدار واجهة برمجة تطبيقات الحوسبة 2018-10-01 أو أعلى.

repairAction يتم دعم إعداد Reimage (معاينة) وإعادة التشغيل (معاينة) لحساب إصدارات API 2021-11-01 أو أعلى.

القيود المفروضة على تحركات الموارد أو الاشتراكات

لا يتم حالياً دعم عمليات نقل الموارد أو الاشتراك لمجموعات تغيير السعة عند تمكين ميزة الإصلاحات التلقائية.

تقييد مجموعات تغيير سعة fabric للخدمة

هذه الميزة غير مدعومة حالياً لمجموعات تغيير سعة fabric للخدمة.

تقييد الأجهزة الظاهرية مع أخطاء التوفير

لا تدعم الإصلاحات التلقائية حاليا السيناريوهات التي يتم فيها وضع علامة غير سليم على مثيل الجهاز الظاهري بسبب فشل التوفير. يجب تهيئة الأجهزة الظاهرية بنجاح لتمكين قدرات المراقبة الصحية والإصلاح التلقائي.

كيف تعمل إصلاحات المثيل التلقائية؟

تعتمد ميزة الإصلاح التلقائي للمثيلات على مراقبة حالة المثيلات الفردية في مجموعة تغيير سعة. يمكن تكوين مثيلات الجهاز الظاهري في مجموعة تغيير سعة لإصدار حالة صحة التطبيق باستخدام إما ملحق صحة التطبيق أو فحوصات صحة موازن التحميل. إذا تم العثور على مثيل غير صحي، فستقوم مجموعة التحجيم بتنفيذ إجراء إصلاح تم تكوينه مسبقا على المثيل غير السليم. يمكن تمكين إصلاحات المثيل التلقائي في نموذج مجموعة مقياس الجهاز الظاهري باستخدام automaticRepairsPolicy العنصر .

تنتقل عملية إصلاح المثيل التلقائي كما يلي:

  1. يقوم ملحق صحة التطبيق أو فحوصات صحة موازن التحميل باختبار اتصال نقطة نهاية التطبيق داخل كل جهاز ظاهري في مجموعة تغيير السعة للحصول على حالة صحة التطبيق لكل مثيل.
  2. إذا استجابت نقطة النهاية بحالة 200 (موافق)، توضع علامة على المثيل على أنه "صحي". في كل الحالات الأخرى (بما في ذلك إذا كان لا يمكن الوصول إلى نقطة النهاية)، يتم وضع علامة على المثيل بأنه "غير صحي".
  3. عندما يتم العثور على مثيل غير صحي، تطبق مجموعة المقياس إجراء الإصلاح المكون (الافتراضي هو استبدال) على المثيل غير السليم.
  4. يتم إجراء إصلاحات المثيل على دفعات. لا يتم في أي وقت إصلاح أكثر من 5٪ من إجمالي المثيلات في مجموعة تغيير السعة. إذا كانت مجموعة تغيير السعة تحتوي على أقل من 20 مثيلاً، يتم إجراء الإصلاحات لمثيل واحد غير صحي في المرة الواحدة.
  5. تستمر العملية المذكورة أعلاه حتى يتم إصلاح كل المثيلات غير الصحية في مجموعة تغيير السعة.

إجراءات الإصلاح المتوفرة

تنبيه

repairAction الإعداد، حاليا ضمن PREVIEW وغير مناسب لأحمال عمل الإنتاج. لمعاينة إجراءات إصلاح إعادة التشغيل وإعادة التحجيم ، يجب تسجيل اشتراك Azure الخاص بك باستخدام علامة AutomaticRepairsWithConfigurableRepairActions AFEC ويجب أن يكون إصدار واجهة برمجة تطبيقات الحوسبة 2021-11-01 أو أعلى. لمزيد من المعلومات، راجع إعداد ميزات المعاينة في اشتراك Azure.

هناك ثلاثة إجراءات إصلاح متوفرة لإصلاحات المثيلات التلقائية - استبدال وإعادة تعيين (معاينة) وإعادة التشغيل (معاينة). إجراء الإصلاح الافتراضي هو استبدال، ولكن يمكنك التبديل إلى Reimage (معاينة) أو إعادة التشغيل (معاينة) عن طريق التسجيل في المعاينة وتعديل repairAction الإعداد ضمن automaticRepairsPolicy الكائن.

  • يحذف Replace المثيل غير السليم وينشئ مثيلا جديدا لاستبداله. يتم استخدام أحدث نموذج لمجموعة مقياس الجهاز الظاهري لإنشاء المثيل الجديد. إجراء الإصلاح هذا هو الإجراء الافتراضي.

  • تطبق إعادة الصورة عملية إعادة الصورة على المثيل غير السليم.

  • تطبق إعادة التشغيل عملية إعادة التشغيل على المثيل غير السليم.

يقارن الجدول التالي الاختلافات بين إجراءات الإصلاح الثلاثة:

إجراء الإصلاح هل تم الاحتفاظ ب معرف مثيل الجهاز الظاهري؟ هل تم الاحتفاظ ب IP الخاص؟ هل تم الاحتفاظ بقرص البيانات المدارة؟ هل تم الاحتفاظ بقرص نظام التشغيل المدار؟ هل تم الاحتفاظ بالقرص المحلي (المؤقت)؟
الاستبدال لا لا لا لا لا
إعادة تعيين للحالة الأصلية ‏‏نعم‬ نعم نعم لا ‏‏نعم‬
إعادة التشغيل ‏‏نعم‬ نعم نعم نعم ‏‏نعم‬

للحصول على تفاصيل حول تحديث إجراء الإصلاح ضمن نهج الإصلاحات التلقائية، راجع قسم تكوين إجراء إصلاح على نهج الإصلاحات التلقائية .

الدفعات

يتم إجراء عمليات إصلاح المثيل التلقائي على دفعات. في أي وقت من الأوقات، لا يتم إصلاح أكثر من 5٪ من المثيلات في مجموعة تغيير السعة من خلال سياسة الإصلاحات التلقائية. تساعد هذه العملية على تجنب الحذف المتزامن وإعادة إنشاء عدد كبير من المثيلات إذا وجدت غير سليمة في نفس الوقت.

فترة السماح

عندما يمر مثيل بعملية تغيير حالة بسبب إجراء PUT أو PATCH أو POST تم تنفيذه على مجموعة التحجيم، يتم تنفيذ أي إجراء إصلاح على هذا المثيل فقط بعد انتهاء فترة السماح. فترة السماح هي مقدار الوقت اللازم للسماح للمثيل بالعودة إلى الحالة الصحية. تبدأ فترة السماح بعد اكتمال تغيير الحالة، مما يساعد على تجنب أي عمليات إصلاح سابقة لأوانها أو عرضية. يتم الالتزام بفترة السماح لأي مثيل تم إنشاؤه حديثا في مجموعة المقياس، بما في ذلك المثيل الذي تم إنشاؤه نتيجة لعملية الإصلاح. يتم تحديد فترة السماح بالدقائق بتنسيق ISO 8601 ويمكن تعيينها باستخدام الخاصية automaticRepairsPolicy.gracePeriod. يمكن أن تتراوح فترة السماح بين 10 دقائق و90 دقيقة، ولها قيمة افتراضية 10 دقائق.

تعليق الإصلاحات

توفر مجموعات مقياس الجهاز الظاهري القدرة على إيقاف إصلاحات المثيل التلقائي مؤقتا إذا لزم الأمر. تعرض حالة الخدمة للإصلاحات التلقائية ضمن الخصائص orchestrationServices في طريقة عرض مجموعة مقياس الجهاز الظاهري الحالة الحالية للإصلاحات التلقائية. عند اختيار مجموعة تغيير السعة في الإصلاحات التلقائية، يتم تعيين قيمة المعلمة serviceState إلى قيد التشغيل. عند تعليق الإصلاحات التلقائية لمجموعة تغيير سعة، يتم تعيين المعلمة serviceState إلى متوقفة مؤقتاً. إذا تم تعريف automaticRepairsPolicy على مجموعة مقياس ولكن لم يتم تمكين ميزة الإصلاحات التلقائية، فسيتم تعيين المعلمة serviceState إلى Not Running.

إذا استمرت المثيلات التي تم إنشاؤها حديثاً لاستبدال الحالات غير الصحية في مجموعة تغيير سعة في البقاء غير صحية حتى بعد إجراء عمليات الإصلاح بشكل متكرر، فعندئذٍ كإجراء للسلامة، يقوم النظام الأساسي بتحديث serviceState للإصلاحات التلقائية إلى متوقفة مؤقتاً. يمكنك استئناف الإصلاحات التلقائية مرة أخرى عن طريق تعيين قيمة serviceState للإصلاحات التلقائية إلى قيد التشغيل. يتم توفير إرشادات مفصلة في القسم الخاص بعرض حالة الخدمة وتحديثها لسياسة الإصلاحات التلقائية لمجموعة تغيير السعة الخاصة بك.

يمكنك أيضا إعداد قواعد تنبيه Azure لمراقبة تغييرات حالة الخدمة والحصول على إشعار إذا تم تعليق الإصلاحات التلقائية على مجموعة المقياس الخاصة بك. للحصول على التفاصيل، راجع استخدام قواعد تنبيه Azure لمراقبة التغييرات في حالة خدمة إصلاح المثيل التلقائي.

حماية المثيل والإصلاحات التلقائية

إذا كان مثيل في مجموعة مقياس محميا بتطبيق أحد نهج الحماية، فلن يتم إجراء إصلاحات تلقائية على هذا المثيل. ينطبق هذا السلوك على كل من نهج الحماية: الحماية من التحجيم والحمايةمن إجراءات مجموعة التحجيم.

إخطار الإنهاء والإصلاحات التلقائية

إذا تم تمكين ميزة إشعار الإنهاء على مجموعة مقياس، ثم أثناء عملية استبدال، يتبع حذف مثيل غير سليم تكوين إعلام الإنهاء. يتم إرسال إشعار إنهاء من خلال خدمة بيانات تعريف Azure - الأحداث المجدولة - ويتم تأخير حذف المثيل أثناء مهلة التأخير المكونة. ومع ذلك، لا ينتظر إنشاء مثيل جديد لاستبدال المثيل غير السليم حتى تكتمل مهلة التأخير.

تمكين نهج الإصلاحات التلقائية عند إنشاء مجموعة تغيير سعة جديدة

هام

بدءا من نوفمبر 2023، سيتم تعيين مجموعات مقياس الجهاز الظاهري التي تم إنشاؤها باستخدام PowerShell وAzure CLI افتراضيا إلى وضع التنسيق المرن إذا لم يتم تحديد وضع التزامن. لمزيد من المعلومات حول هذا التغيير والإجراءات التي يجب اتخاذها، انتقل إلى كسر التغيير لعملاء VMSS PowerShell/CLI - مركز مجتمع Microsoft

لتمكين نهج الإصلاحات التلقائية أثناء إنشاء مجموعة تغيير سعة جديدة، تأكد من استيفاء كل متطلبات الاشتراك في هذه الميزة. يجب تكوين نقطة نهاية التطبيق بشكل صحيح لمثيلات مجموعة تغيير السعة لتجنب تشغيل إصلاحات غير مقصودة أثناء تكوين نقطة النهاية. بالنسبة لمجموعات المقياس التي تم إنشاؤها حديثا، يتم تنفيذ أي إصلاحات للمثيل فقط بعد اكتمال فترة السماح. لتمكين إصلاح المثيل التلقائي في مجموعة مقياس، استخدم كائن automaticRepairsPolicy في نموذج مجموعة مقياس الجهاز الظاهري.

يمكنك أيضا استخدام قالب التشغيل السريع هذا لنشر مجموعة مقياس الجهاز الظاهري. تحتوي مجموعة المقياس على فحص صحة موازن التحميل وإصلاحات المثيل التلقائية الممكنة مع فترة سماح مدتها 30 دقيقة.

الخطوات التالية لتمكين نهج الإصلاحات التلقائية عند إنشاء مجموعة تغيير سعة جديدة.

  1. انتقل إلى مجموعات مقياس الجهاز الظاهري.
  2. حدد + Add لإنشاء مجموعة مقاييس جديدة.
  3. انتقل إلى علامة تبويب الصحة.
  4. حدد موقع قسم الصحة.
  5. قم بتمكين خيار مراقبة صحة التطبيق.
  6. حدد موقع قسم نهج الإصلاح التلقائي.
  7. قم بتشغيل خيار الإصلاحات التلقائية.
  8. في فترة السماح (دقيقة) ، حدد فترة السماح بالدقائق، تتراوح القيم المسموح بها بين 10 و90 دقيقة.
  9. عند الانتهاء من إنشاء مجموعة المقياس الجديدة، حدد الزر Review + create .

تمكين نهج الإصلاحات التلقائية عند تحديث مجموعة تغيير سعة موجودة

قبل نهج الإصلاحات التلقائية في مجموعة تغيير سعة موجودة، تأكد من استيفاء كل متطلبات الاشتراك في هذه الميزة. يجب تكوين نقطة نهاية التطبيق بشكل صحيح لمثيلات مجموعة تغيير السعة لتجنب تشغيل إصلاحات غير مقصودة أثناء تكوين نقطة النهاية. لتمكين إصلاح المثيل التلقائي في مجموعة مقياس، استخدم كائن automaticRepairsPolicy في نموذج مجموعة مقياس الجهاز الظاهري.

بعد تحديث نموذج مجموعة تغيير سعة موجودة، تأكد من تطبيق أحدث نموذج على كل مثيلات تغيير السعة. ارجع إلى تعليمات كيفية تحديث الأجهزة الظاهرية باستخدام أحدث نموذج لمجموعة تغيير السعة.

يمكنك تعديل نهج الإصلاحات التلقائية لمجموعة تغيير سعة موجودة من خلال مدخل Microsoft Azure.

إشعار

قم بتمكين ملحق Application Health أو فحوصات صحة Load Balancer على مجموعات مقياس الجهاز الظاهري قبل بدء الخطوات التالية.

  1. انتقل إلى مجموعة مقياس الجهاز الظاهري الموجودة.0
  2. ضمن الإعدادات في القائمة على اليمين، حدد الصحة والإصلاح.
  3. قم بتمكين خيار مراقبة صحة التطبيق.

إذا كنت تراقب مجموعة المقياس باستخدام ملحق Application Health:

  1. اختر ملحق Application Health من القائمة المنسدلة Application Health monitor.

  2. من القائمة المنسدلة Protocol، اختر بروتوكول الشبكة المستخدم من قبل التطبيق الخاص بك للإبلاغ عن الصحة. حدد البروتوكول المناسب استنادا إلى متطلبات التطبيق الخاص بك. خيارات البروتوكول هي HTTP أو HTTPS أو TCP.

  3. في مربع تكوين رقم المنفذ، اكتب منفذ الشبكة المستخدم لمراقبة صحة التطبيق.

  4. بالنسبة إلى Path، قم بتوفير مسار نقطة نهاية التطبيق (على سبيل المثال، "/") المستخدم للإبلاغ عن صحة التطبيق.

    إشعار

    سيقوم ملحق Application Health ب ping هذا المسار داخل كل جهاز ظاهري في مجموعة المقياس للحصول على حالة صحة التطبيق لكل مثيل. إذا كنت تستخدم حالات الحماية الثنائية واستجابت نقطة النهاية بالحالة 200 (موافق)، فسيتم وضع علامة على المثيل على أنه "سليم". في كل الحالات الأخرى (بما في ذلك إذا كان لا يمكن الوصول إلى نقطة النهاية)، يتم وضع علامة على المثيل بأنه "غير صحي". لمزيد من خيارات الحالة الصحية، استكشف Rich Health States.

إذا كنت تراقب مجموعة المقياس الخاصة بك باستخدام فحوصات SLB Health:

  • اختر مسبار موازن التحميل من القائمة المنسدلة Application Health monitor.- بالنسبة إلى مسبار صحة Load Balancer، حدد مسبار صحة موجود أو قم بإنشاء مسبار صحة جديد للمراقبة.

لتمكين الإصلاحات التلقائية:

  1. حدد موقع قسم نهج الإصلاح التلقائي.
  2. قم بتشغيل خيار الإصلاحات التلقائية.
  3. في فترة السماح (دقيقة)، حدد فترة السماح بالدقائق. تتراوح القيم المسموح بها بين 10 و90 دقيقة.
  4. عندما تنتهي، حدد حفظ.

تكوين إجراء إصلاح على نهج الإصلاحات التلقائية

تنبيه

repairAction الإعداد، حاليا ضمن PREVIEW وغير مناسب لأحمال عمل الإنتاج. لمعاينة إجراءات إصلاح إعادة التشغيل وإعادة التحجيم ، يجب تسجيل اشتراك Azure الخاص بك باستخدام علامة AutomaticRepairsWithConfigurableRepairActions AFEC ويجب أن يكون إصدار واجهة برمجة تطبيقات الحوسبة 2021-11-01 أو أعلى. لمزيد من المعلومات، راجع إعداد ميزات المعاينة في اشتراك Azure.

repairAction يسمح لك الإعداد ضمن automaticRepairsPolicy بتحديد إجراء الإصلاح المطلوب الذي تم تنفيذه استجابة لمثيل غير صحي. إذا كنت تقوم بتحديث إجراء الإصلاح على نهج إصلاحات تلقائية موجود، يجب أولا تعطيل الإصلاحات التلقائية على مجموعة المقياس وإعادة التمكين باستخدام إجراء الإصلاح المحدث. هذه العملية موضحة في الأمثلة أدناه.

يوضح هذا المثال كيفية تحديث إجراء الإصلاح على مجموعة مقياس باستخدام نهج إصلاحات تلقائية موجود. استخدم إصدار واجهة برمجة التطبيقات 2021-11-01 أو أعلى.

تعطيل نهج الإصلاحات التلقائية الموجودة على مجموعة المقياس

PUT or PATCH on '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}?api-version=2021-11-01'
{
  "properties": {
    "automaticRepairsPolicy": {
            "enabled": "false"
        }
    }
}

إعادة تمكين نهج الإصلاحات التلقائية مع إجراء الإصلاح المطلوب

PUT or PATCH on '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}?api-version=2021-11-01'
{
  "properties": {
    "automaticRepairsPolicy": {
            "enabled": "true",
            "gracePeriod": "PT40M",
            "repairAction": "Reimage"
        }
    }
}

عرض وتحديث حالة الخدمة الخاصة بنهج إصلاحات المثيل التلقائية

استخدم Get Instance View مع إصدار API 2019-12-01 أو أعلى لمجموعة مقياس الجهاز الظاهري لعرض حالة الخدمة للإصلاحات التلقائية ضمن property orchestrationServices.

GET '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}/instanceView?api-version=2019-12-01'
{
  "orchestrationServices": [
    {
      "serviceName": "AutomaticRepairs",
      "serviceState": "Running"
    }
  ]
}

استخدم تعيين حالة خدمة التنسيق لإيقاف حالة الخدمة مؤقتا أو استئنافها للإصلاحات التلقائية.

POST '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}/instanceView?api-version=2023-07-01'

{
  "serviceName": "AutomaticRepairs",
  "action": "Suspend"
}

استكشاف الأخطاء وإصلاحها

الفشل في تمكين نهج الإصلاحات التلقائية

إذا تلقيت خطأ "BadRequest" مع رسالة تفيد "تعذر العثور على العضو "automaticRepairsPolicy" على كائن من النوع "خصائص"، فتحقق من إصدار واجهة برمجة التطبيقات المستخدم لمجموعة مقياس الجهاز الظاهري. مطلوب إصدار API 2018-10-01 أو أعلى لهذه الميزة.

عدم إصلاح المثيل حتى عند تمكين النهج

يمكن أن يكون المثيل في فترة السماح. هذه الفترة هي مقدار الوقت للانتظار بعد أي تغيير في الحالة على المثيل قبل إجراء الإصلاحات، مما يساعد على تجنب أي إصلاحات سابقة لأوانها أو عرضية. ينبغي أن يحدث إجراء الإصلاح بمجرد اكتمال فترة السماح للمثيل.

عرض حالة صحة التطبيق لمثيلات مجموعة تغيير السعة

يمكنك استخدام واجهة برمجة تطبيقات Get Instance View للمثيلات في مجموعة مقياس الجهاز الظاهري لعرض حالة صحة التطبيق. باستخدام Azure PowerShell، يمكنك استخدام cmdlet Get-AzVmssVM بعلامة -InstanceView. يتم توفير حالة صحة التطبيق تحت خاصية vmHealth.

في مدخل Microsoft Azure، يمكنك الاطلاع على حالة الصحة أيضاً. انتقل إلى مجموعة تغيير السعة الموجودة، وحدد المثيلات من القائمة الموجودة على اليمين، وانظر إلى عمود حالة الصحة لمعرفة حالة الصحة لكل مثيل مجموعة تغيير سعة.

الخطوات التالية

تعرّف على كيفية تكوين ملحق صحة التطبيق أو فحوصات صحة موازن التحميل لمجموعات تغيير السعة الخاصة بك.