سيناريوهات تجاوز فشل Kubernetes على جهاز Azure Stack Edge متفاوت المسافات

يتم نشر نظام مجموعة Kubernetes كمنصة مفتوحة المصدر شائعة لتنسيق التطبيقات المعبأة في حاويات. توضح هذه المقالة كيفية عمل Kubernetes على جهاز Azure Stack Edge المكون من عقدتين بما في ذلك أوضاع الفشل واستجابات الجهاز المقابلة.

حول Kubernetes على Azure Stack Edge

على جهاز Azure Stack Edge، يمكنك إنشاء مجموعة Kubernetes عن طريق تكوين الحساب. عند تكوين دور الحساب، يتم نشر نظام مجموعة Kubernetes بما في ذلك العقد الرئيسية والعاملة وتكوينها لك. ثم يتم استخدام هذه المجموعة لنشر حمل العمل عبر kubectlأو IoT Edge أو Azure Arc.

يتوفر جهاز Azure Stack Edge كتكوين من عقدة واحدة أو تكوين عقدتين يشكل مجموعة البنية الأساسية. نظام مجموعة Kubernetes منفصل عن نظام مجموعة البنية الأساسية ويتم نشره أعلى نظام مجموعة البنية الأساسية. يوفر نظام مجموعة البنية الأساسية التخزين المستمر لجهاز Azure Stack Edge الخاص بك بينما تكون مجموعة Kubernetes مسؤولة فقط عن تزامن التطبيق.

يتكون نظام مجموعة Kubernetes من عقدة رئيسية وعقد عاملة. عقد Kubernetes في نظام مجموعة هي الأجهزة الظاهرية التي تقوم بتشغيل التطبيقات الخاصة بك وسير العمل السحابي.

  • عقدة Kubernetes الرئيسية مسؤولة عن الحفاظ على الحالة المطلوبة لنظام المجموعة الخاص بك. تتحكم العقدة الرئيسية أيضا في عقدة العامل.
  • تقوم العقد العاملة بتشغيل التطبيقات الحاوية.

نظام مجموعة Kubernetes على جهاز ثنائي العقدة

يحتوي نظام مجموعة Kubernetes على الجهاز المكون من عقدتين على عقدة رئيسية واحدة وعقدتين عاملتين. الجهاز المكون من عقدتين متوفر بشكل كبير، وإذا فشلت إحدى العقد، يستمر كل من الجهاز وكتلة Kubernetes في التشغيل. لمزيد من المعلومات حول بنية مجموعة Kubernetes، انتقل إلى مفاهيم Kubernetes الأساسية.

على جهاز Azure Stack Edge المكون من عقدتين، يتم تشغيل الجهاز الظاهري الرئيسي Kubernetes والجهاز الظاهري لعامل Kubernetes على العقدة A لجهازك. على العقدة B، يتم تشغيل جهاز ظاهري عامل Kubernetes واحد.

كل جهاز ظاهري عامل في مجموعة Kubernetes هو جهاز Hyper-V ظاهري مثبت. يرتبط الجهاز الظاهري الذي تم تثبيته بالعقدة المحددة التي يعمل عليها. إذا فشلت العقدة A على الجهاز، يفشل الجهاز الظاهري الرئيسي في العقدة B. ولكن الجهاز الظاهري العامل على العقدة A وهو جهاز ظاهري مثبت لا يفشل في العقدة B والعكس صحيح. بدلا من ذلك، تتم إعادة توازن الحجيرات من الجهاز الظاهري العامل على العقدة A على العقدة B.

لكي يكون لدى القرون المعاد توازنها سعة كافية للتشغيل على عقدة الجهاز B، يفرض النظام استخدام ما لا يزيد عن 50٪ من سعة كل عقدة ASE أثناء عمليات نظام مجموعة Azure Stack Edge ثنائية العقدة. يتم استخدام السعة هذا على أساس أفضل جهد وهناك ظروف (على سبيل المثال، أحمال العمل التي تتطلب موارد GPU غير متوفرة عند إعادة توازنها إلى عقدة ASE B) حيث قد لا يكون لدى القرون المعاد توازنها موارد كافية لتشغيلها.

يتم تناول هذه السيناريوهات بالتفصيل في القسم التالي حول أوضاع الفشل والسلوك.

أوضاع الفشل وسلوكه

قد تفشل عقد جهاز Azure Stack Edge في ظل ظروف معينة. يتم جدولة أوضاع الفشل المختلفة واستجابات الجهاز المقابلة في هذا القسم.

فشل عقدة Azure Stack Edge أو إعادة التشغيل

العقدة الإخفاقات الردود
العقدة أ لديها فشل
(العقدة B ليس لديها أي فشل)
يمكن أن تحدث حالات الفشل المحتملة التالية:
  • فشل كل من وحدات PSUs
  • منفذ 3 واحد أو كليهما، المنفذ 4 يفشل
  • فشل المكون الأساسي، بما في ذلك اللوحة الأم و DIMM وقرص نظام التشغيل
  • فشل العقدة بأكملها
    تظهر الاستجابات التالية لكل من هذه الإخفاقات:
    • فشل الجهاز الظاهري الرئيسي Kubernetes من العقدة A إلى العقدة B
    • يستغرق الجهاز الظاهري الرئيسي بضع دقائق للتوصل إلى العقدة B
    • تتم إعادة توازن الحجيرات من العقدة A على العقدة B
    • تستمر أحمال عمل GPU في التشغيل إذا كانت وحدة معالجة الرسومات متوفرة على العقدة B
    العقدة A إعادة التشغيل
    (العقدة B ليس لديها أي فشل)
    إعادة تمهيد العقدة بعد اكتمال العقدة A من إعادة التشغيل وإتاحة الجهاز الظاهري العامل، سيقوم الجهاز الظاهري الرئيسي بإعادة توازن القرون من العقدة B.
    العقدة B لديها حالات فشل
    (العقدة أ ليس لديها أي فشل)
    يمكن أن تحدث حالات الفشل المحتملة التالية:
    • فشل كل من وحدات PSUs
    • منفذ 3 واحد أو كليهما، المنفذ 4 يفشل
    • فشل المكون الأساسي، بما في ذلك اللوحة الأم و DIMM وقرص نظام التشغيل
    • فشل العقدة بأكملها
      تظهر الاستجابات التالية لكل من هذه الإخفاقات:
      • يعيد Kubernetes master VM توازن القرون من العقدة B. قد يستغرق هذا بضع دقائق.
      إعادة تمهيد العقدة B
      (العقدة أ ليس لديها أي فشل)
      إعادة تمهيد العقدة بعد اكتمال إعادة تشغيل العقدة B وإتاحة الجهاز الظاهري العامل، سيقوم الجهاز الظاهري الرئيسي بإعادة توازن القرون من العقدة B.

      تحديثات عقدة Azure Stack Edge

      نوع التحديث الردود
      تحديث عقدة الجهاز يتم تطبيق التحديثات المتداولة على عقد الجهاز وسيتم إعادة تشغيل العقد.
      تحديث خدمة Kubernetes يشمل تحديث خدمة Kubernetes ما يلي:
      • تجاوز فشل الجهاز الظاهري الرئيسي Kubernetes من عقدة الجهاز A إلى عقدة الجهاز B
      • تحديث رئيسي ل Kubernetes.
      • تحديثات عقدة عامل Kubernetes (ليس بالضرورة بهذا الترتيب).
      قد تستغرق عملية التحديث بأكملها 30 دقيقة أو أكثر، وخلال هذه النافذة يتوفر نظام مجموعة Kubernetes لأي عمليات إدارة (مثل نشر حمل عمل جديد). على الرغم من أنه سيتم استنزاف القرون من عقدة الجهاز أثناء تحديثها، فقد تكون أحمال العمل غير متصلة لعدة ثوان أثناء هذه العملية.

      الخطوات التالية

      • تعرف على المزيد حول تخزين Kubernetes على جهاز Azure Stack Edge.
      • فهم نموذج شبكة Kubernetes على جهاز Azure Stack Edge.
      • نشر Azure Stack Edge في مدخل Azure.