Dela via


Kubernetes-redundansscenarier på en klustrad Azure Stack Edge-enhet

Kubernetes-klustret distribueras som en populär plattform med öppen källkod för att orkestrera containerbaserade program. Den här artikeln beskriver hur Kubernetes fungerar på din 2-nods Azure Stack Edge-enhet, inklusive fellägen och motsvarande enhetssvar.

Om Kubernetes på Azure Stack Edge

På din Azure Stack Edge-enhet kan du skapa ett Kubernetes-kluster genom att konfigurera beräkningen. När beräkningsrollen har konfigurerats distribueras och konfigureras Kubernetes-klustret, inklusive huvud- och arbetsnoderna, åt dig. Det här klustret används sedan för arbetsbelastningsdistribution via kubectl, IoT Edge eller Azure Arc.

Azure Stack Edge-enheten är tillgänglig som en 1-nodskonfiguration eller en konfiguration med 2 noder som utgör infrastrukturklustret. Kubernetes-klustret är separat från infrastrukturklustret och distribueras ovanpå infrastrukturklustret. Infrastrukturklustret tillhandahåller beständig lagring för din Azure Stack Edge-enhet medan Kubernetes-klustret endast ansvarar för programorkestrering.

Kubernetes-klustret består av en huvudnod och arbetsnoder. Kubernetes-noderna i ett kluster är virtuella datorer som kör dina program och molnarbetsflöden.

  • Kubernetes-huvudnoden ansvarar för att upprätthålla önskat tillstånd för klustret. Huvudnoden styr även arbetsnoden.
  • Arbetsnoderna kör de containerbaserade programmen.

Kubernetes-kluster på tvånodsenhet

Kubernetes-klustret på 2-nodenheten har en huvudnod och två arbetsnoder. Enheten med två noder är mycket tillgänglig och om en av noderna misslyckas fortsätter både enheten och Kubernetes-klustret att köras. Mer information om Kubernetes-klusterarkitekturen finns i Kubernetes kärnbegrepp.

På en Azure Stack Edge-enhet med två noder körs den virtuella Kubernetes-huvuddatorn och en virtuell Kubernetes-arbetsdator på noden A på enheten. På noden B körs en enda virtuell Kubernetes-arbetsdator.

Varje arbets-VM i Kubernetes-klustret är en fäst virtuell Hyper-V-dator. En fäst virtuell dator är kopplad till den specifika nod som den körs på. Om noden A på enheten misslyckas redundansväxlar den virtuella huvuddatorn över till noden B. Men den virtuella arbetsdatorn på noden A som är en fäst virtuell dator redundansväxlar inte till noden B och vice versa. I stället balanseras poddarna från den virtuella arbetsdatorn på nod A om till noden B.

För att de ombalanserade poddarna ska ha tillräckligt med kapacitet för att köras på enhetsnoden B, framtvingar systemet att högst 50 % av varje ASE-nods kapacitet ska användas under vanliga 2-nods Azure Stack Edge-klusteråtgärder. Den här kapacitetsanvändningen utförs på bästa sätt och det finns omständigheter (till exempel arbetsbelastningar som kräver Otillgängliga GPU-resurser när de balanseras om till ASE Node B) där ombalanserade poddar kanske inte har tillräckligt med resurser för att köras.

Dessa scenarier beskrivs i detalj i nästa avsnitt om fellägen och beteende.

Fellägen och beteende

Azure Stack Edge-enhetsnoderna kan misslyckas under vissa förhållanden. De olika fellägena och motsvarande enhetssvar är tabulerade i det här avsnittet.

Azure Stack Edge-nodfel eller omstarter

Nod Fel Svar
Nod A har fel
(Nod B har inga fel)
Följande möjliga fel kan inträffa:
  • Båda PSU:erna misslyckas
  • En eller båda port 3, port 4 misslyckas
  • Kärnkomponenten misslyckas, inkluderar moderkort, DIMM, OS-disk
  • Hela noden misslyckas
    Följande svar visas för vart och ett av dessa fel:
    • Den virtuella Kubernetes-huvuddatorn redundansväxlar från nod A till nod B
    • Den virtuella huvuddatorn tar några minuter att komma upp på nod B
    • Poddar från nod A balanseras om på nod B
    • GPU-arbetsbelastningar fortsätter att köras om GPU är tillgängligt på noden B
    Nod A startas om
    (Nod B har inga fel)
    Omstart av nod När noden A har startats om och den virtuella arbetsdatorn är tillgänglig balanserar den virtuella huvuddatorn om poddarna från noden B.
    Nod B har fel
    (Nod A har inga fel)
    Följande möjliga fel kan inträffa:
    • Båda PSU:erna misslyckas
    • En eller båda port 3, port 4 misslyckas
    • Kärnkomponenten misslyckas, inkluderar moderkort, DIMM, OS-disk
    • Hela noden misslyckas
      Följande svar visas för vart och ett av dessa fel:
      • Kubernetes master VM balanserar om poddar från nod B. Det kan ta några minuter.
      Nod B startas om
      (Nod A har inga fel)
      Omstart av nod När noden B har startats om och den virtuella arbetsdatorn är tillgänglig balanserar den virtuella huvuddatorn om poddarna från noden B.

      Uppdateringar av Azure Stack Edge-noder

      Uppdateringstyp Svar
      Uppdatering av enhetsnod Löpande uppdateringar tillämpas på enhetsnoder och noderna startas om.
      Uppdatering av Kubernetes-tjänsten Kubernetes-tjänstuppdatering innehåller:
      • En redundansväxling av den virtuella Kubernetes-huvuddatorn från enhetsnod A till enhetsnod B
      • En Kubernetes-huvuduppdatering.
      • Kubernetes-arbetsnoduppdateringar (inte nödvändigtvis i den ordningen).
      Hela uppdateringsprocessen kan ta 30 minuter eller mer, och under det här fönstret är Kubernetes-klustret tillgängligt för alla hanteringsåtgärder (som att distribuera en ny arbetsbelastning). Även om poddar töms från enhetsnoden medan den uppdateras kan arbetsbelastningarna vara offline i flera sekunder under den här processen.

      Nästa steg