Sdílet prostřednictvím


Scénáře převzetí služeb při selhání Kubernetes na clusterovém zařízení Azure Stack Edge

Cluster Kubernetes je nasazený jako oblíbená opensourcová platforma pro orchestraci kontejnerizovaných aplikací. Tento článek popisuje, jak Kubernetes funguje na zařízení Azure Stack Edge se dvěma uzly, včetně režimů selhání a odpovídajících odpovědí na zařízení.

Informace o Kubernetes ve službě Azure Stack Edge

Na zařízení Azure Stack Edge můžete vytvořit cluster Kubernetes konfigurací výpočetních prostředků. Když je výpočetní role nakonfigurovaná, cluster Kubernetes včetně hlavních a pracovních uzlů se nasadí a nakonfiguruje za vás. Tento cluster se pak používá k nasazení úloh přes kubectlIoT Edge nebo Azure Arc.

Zařízení Azure Stack Edge je k dispozici jako konfigurace 1 uzlu nebo konfigurace 2 uzlů, která představuje cluster infrastruktury. Cluster Kubernetes je oddělený od clusteru infrastruktury a je nasazený nad clusterem infrastruktury. Cluster infrastruktury poskytuje trvalé úložiště pro vaše zařízení Azure Stack Edge, zatímco cluster Kubernetes zodpovídá výhradně za orchestraci aplikací.

Cluster Kubernetes se skládá z hlavního uzlu a pracovních uzlů. Uzly Kubernetes v clusteru jsou virtuální počítače, na kterých běží vaše aplikace a cloudové pracovní postupy.

  • Hlavní uzel Kubernetes zodpovídá za udržování požadovaného stavu clusteru. Hlavní uzel také řídí pracovní uzel.
  • Pracovní uzly spouští kontejnerizované aplikace.

Cluster Kubernetes na zařízení se dvěma uzly

Cluster Kubernetes na zařízení s 2 uzly má jeden hlavní uzel a dva pracovní uzly. Zařízení s 2 uzly je vysoce dostupné a pokud některý z uzlů selže, zařízení i cluster Kubernetes stále běží. Další informace o architektuře clusteru Kubernetes najdete v základních konceptech Kubernetes.

Na zařízení Azure Stack Edge s 2 uzly běží hlavní virtuální počítač Kubernetes a pracovní virtuální počítač Kubernetes na uzlu A vašeho zařízení. Na uzlu B je spuštěný jeden pracovní virtuální počítač Kubernetes.

Každý pracovní virtuální počítač v clusteru Kubernetes je připnutý virtuální počítač Hyper-V. Připnutý virtuální počítač je svázaný s konkrétním uzlem, na kterém běží. Pokud uzel A v zařízení selže, hlavní virtuální počítač převezme služby při selhání uzlu B. Pracovní virtuální počítač na uzlu A, který je připnutým virtuálním počítačem, ale nepředá služby při selhání uzlu B a naopak. Místo toho jsou pody z pracovního virtuálního počítače na uzlu A znovu vyváženy na uzlu B.

Aby byly pody znovu vyváženy, aby měly dostatečnou kapacitu ke spuštění na uzlu zařízení B, systém vynucuje, aby se během běžných operací clusteru Azure Stack Edge používalo maximálně 50 % kapacity každého uzlu ASE. Toto využití kapacity se provádí co nejlépe a existují okolnosti (například úlohy, které vyžadují nedostupné prostředky GPU, když jsou znovu vyváženy s uzlem ASE B), ve kterých nemusí mít k dispozici dostatek prostředků ke spuštění.

Tyto scénáře jsou podrobně popsané v další části o režimech selhání a chování.

Režimy selhání a chování

Uzly zařízení Azure Stack Edge můžou selhat za určitých podmínek. V této části jsou uvedeny různé režimy selhání a odpovídající odpovědi na zařízení.

Selhání nebo restartování uzlů Azure Stack Edge

Uzel Selhání Odpovědi
Uzel A má selhání
(Uzel B nemá žádné chyby)
Může dojít k následujícím možným selháním:
  • Oba napájecí zdroje selžou
  • Jeden nebo oba porty 3, selhání portu 4
  • Základní komponenta selže, včetně základní desky, DIMM, disku s operačním systémem
  • Selhání celého uzlu
    U každé z těchto chyb se zobrazují následující odpovědi:
    • Hlavní virtuální počítač Kubernetes převezme služby při selhání z uzlu A do uzlu B
    • Spuštění hlavního virtuálního počítače na uzlu B trvá několik minut.
    • Pody z uzlu A jsou znovu vyváženy na uzlu B.
    • Úlohy GPU stále běží, pokud je GPU k dispozici na uzlu B
    Restartování uzlu A
    (Uzel B nemá žádné chyby)
    Restartování uzlu Po dokončení restartování uzlu A a je k dispozici pracovní virtuální počítač, hlavní virtuální počítač znovu vyrovná pody z uzlu B.
    Uzel B má selhání
    (Uzel A nemá žádné chyby)
    Může dojít k následujícím možným selháním:
    • Oba napájecí zdroje selžou
    • Jeden nebo oba porty 3, selhání portu 4
    • Základní komponenta selže, včetně základní desky, DIMM, disku s operačním systémem
    • Selhání celého uzlu
      U každé z těchto chyb se zobrazují následující odpovědi:
      • Hlavní virtuální počítač Kubernetes znovu vyrovnává pody z uzlu B. Může to trvat několik minut.
      Restartování Node B
      (Uzel A nemá žádné chyby)
      Restartování uzlu Po dokončení restartování uzlu B a je k dispozici pracovní virtuální počítač, hlavní virtuální počítač znovu vyrovná pody z uzlu B.

      Aktualizace uzlů Azure Stack Edge

      Typ aktualizace Odpovědi
      Aktualizace uzlu zařízení Kumulativní aktualizace se použijí na uzly zařízení a uzly se restartují.
      Aktualizace služby Kubernetes Aktualizace služby Kubernetes zahrnuje:
      • Převzetí služeb při selhání hlavního virtuálního počítače Kubernetes z uzlu zařízení A na uzel zařízení B
      • Hlavní aktualizace Kubernetes
      • Aktualizace pracovních uzlů Kubernetes (ne nutně v daném pořadí).
      Celý proces aktualizace může trvat 30 minut nebo déle a během tohoto okna je cluster Kubernetes k dispozici pro všechny operace správy (například nasazení nové úlohy). I když se pody během aktualizace vyprázdní z uzlu zařízení, během tohoto procesu můžou být úlohy offline po dobu několika sekund.

      Další kroky

      • Přečtěte si další informace o úložišti Kubernetes na zařízení Azure Stack Edge.
      • Seznamte se se síťovým modelem Kubernetes na zařízení Azure Stack Edge.
      • Nasaďte Azure Stack Edge na webu Azure Portal.