Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Azure Kubernetes Service (AKS) bewaakt continu de status van werkknooppunten en herstelt de knooppunten automatisch als ze beschadigd raken. Het Azure VM-platform (virtual machine) voert onderhoud uit op VM's die problemen ondervinden. AKS- en Azure-VM's werken samen om serviceonderbrekingen voor clusters te minimaliseren.
In dit artikel leert u hoe de functionaliteit voor automatisch herstel van knooppunten zich gedraagt voor Windows- en Linux-knooppunten.
Hoe AKS controleert op NotReady-knooppunten
AKS gebruikt de volgende regels om te bepalen of een knooppunt niet in orde is en moet worden hersteld:
- Het knooppunt rapporteert de status NotReady bij opeenvolgende controles binnen een tijdsbestek van tien minuten.
- Het knooppunt rapporteert geen status binnen 10 minuten.
U kunt de status van uw knooppunten handmatig controleren met de kubectl get nodes
opdracht.
Hoe automatische reparatie werkt
Notitie
AKS initieert herstelbewerkingen met het gebruikersaccount aks-remediator.
Als AKS een beschadigd knooppunt identificeert dat ten minste vijf minuten niet in orde is, voert AKS de volgende acties uit:
- AKS start het knooppunt opnieuw op.
- Als het knooppunt ongezond blijft na het opnieuw opstarten, wordt het knooppunt door AKS opnieuw geïnstalleerd.
- Als het knooppunt niet in orde blijft na de herinstallatie en het een Linux-knooppunt is, implementeert AKS het knooppunt opnieuw.
AKS probeert het herstart-, herinstallatie- en herimplementatieproces tot drie keer als het knooppunt ongezond blijft. Het gehele autoherstelproces kan tot een uur duren.
Beperkingen
Automatisch herstellen van AKS-knooppunten is een best effort-service en we garanderen niet dat het knooppunt weer in orde is. Als uw knooppunt in een beschadigde status blijft, raden we u ten zeerste aan om handmatig onderzoek naar het knooppunt uit te voeren. Meer informatie over het oplossen van problemen met knooppunt NotReady-status.
Er zijn gevallen waarin AKS geen automatische reparatie uitvoert. Fout bij het automatisch herstellen van het knooppunt kan zich voordoen door het ontwerp of als Azure niet kan detecteren dat er een probleem bestaat. Voorbeelden van wanneer automatisch herstellen niet wordt uitgevoerd, zijn:
- Er wordt geen knooppuntstatus gerapporteerd vanwege een fout in de netwerkconfiguratie.
- Een knooppunt kan in eerste instantie niet worden geregistreerd als een gezond knooppunt.
- Als een van de volgende taints aanwezig is op het knooppunt:
node.cloudprovider.kubernetes.io/shutdown
,ToBeDeletedByClusterAutoscaler
. - Een knooppunt wordt bijgewerkt, wat resulteert in de volgende aantekening op het knooppunt
"cluster-autoscaler.kubernetes.io/scale-down-disabled": "true"
en"kubernetes.azure.com/azure-cluster-autoscaler-scale-down-disabled-reason": "upgrade"
Bewaken van automatische reparatie van knooppunten met Kubernetes-gebeurtenissen
Wanneer AKS automatisch knooppunten repareert in uw cluster, zendt AKS Kubernetes-gebeurtenissen uit van de bron "aks-auto-repair" voor zichtbaarheid. De volgende gebeurtenissen worden weergegeven op een knooppuntobject wanneer automatisch herstellen plaatsvindt.
Zie Kubernetes-gebeurtenissen gebruiken voor probleemoplossing in Azure Kubernetes Service voor meer informatie over het openen, opslaan en configureren van waarschuwingen voor Kubernetes-gebeurtenissen.
Reden | Gebeurtenisbericht | Beschrijving |
---|---|---|
NodeRebootStart | Het automatisch herstel van knooppunten initieert een herstartactie omdat de status NotReady langer dan 5 minuten aanhoudt. | Deze gebeurtenis wordt verzonden om u op de hoogte te stellen wanneer een herstart op uw knooppunt op het punt staat te gebeuren. Deze actie is de eerste in de algehele reeks voor automatisch herstellen van knooppunten. |
Einde van de node-herstart | De herstartactie van automatisch herstel van een knooppunt is voltooid. | Wordt verzonden zodra het opnieuw opstarten is voltooid op het knooppunt. Deze gebeurtenis geeft niet de status (in orde of niet in orde) van het knooppunt aan nadat het opnieuw opstarten is uitgevoerd. |
NodeReimageStart | Omdat de status NotReady langer dan 5 minuten blijft bestaan, initieert het automatisch herstellen van knooppunten een herstelactie. | Deze gebeurtenis wordt verzonden om u op de hoogte te stellen wanneer het opnieuw configureren van uw knooppunt op het punt staat te gebeuren. |
NodeReimageEnd | De herinstallatieactie via automatisch knooppuntherstel is voltooid. | Wordt getriggert zodra de herimage is voltooid op het knooppunt. Deze gebeurtenis duidt niet op de gezondheidstoestand (gezond of ongezond) van het knooppunt na het opnieuw uitvoeren van de image. |
NodeRedeployStart | Het automatische herstel van knooppunten start een heruitrol-actie omdat de status 'NotReady' langer dan 5 minuten aanhoudt. | Deze gebeurtenis wordt verzonden om u te informeren wanneer een herimplementatie op het punt staat uitgevoerd te worden op uw knooppunt. Opnieuw implementeren is de laatste actie in de reeks voor automatisch herstellen van knooppunten. |
NodeRedeployEnd | Herimplementatie vanuit de automatische knooppuntreparatie is voltooid. | Wordt verzonden zodra de implementatie is voltooid op het knooppunt. Deze gebeurtenis geeft niet de gezondheidstoestand (gezond of ongezond) van het knooppunt aan na de herimplementatie. |
Als er fouten optreden tijdens het proces voor automatisch herstellen van knooppunten, worden de volgende gebeurtenissen verzonden met het exacte foutbericht. Meer informatie over het oplossen van veelvoorkomende fouten bij automatisch herstellen van knooppunten.
Notitie
Foutcode in de volgende gebeurtenisberichten varieert, afhankelijk van de gemelde fout.
Reden | Gebeurtenisbericht | Beschrijving |
---|---|---|
NodeRebootError | De opstartactie voor automatisch herstellen van knooppunten is mislukt vanwege een bewerkingsfout. Bekijk hier de foutdetails: Foutcode | Verzonden wanneer er een fout optreedt met de actie voor opnieuw opstarten. |
Fout bij Opnieuw Afbeelden van Node | De automatische herstelactie voor knooppunten is mislukt vanwege een operatiefout. Bekijk hier de foutdetails: Foutcode | Wordt verzonden wanneer er een fout optreedt bij de herinstallatieactie. |
Fout bij Opnieuw Ontplooien van Knoop | De automatische herstelactie van het knooppunt is mislukt door een operationele fout. Bekijk hier de foutdetails: Foutcode | Opgetreden wanneer er een fout optreedt bij de herimplementatie-actie. |
Volgende stappen
Standaard hebt u vanaf het afgelopen 1 uur toegang tot Kubernetes-gebeurtenissen en logboeken in uw AKS-cluster. Als u gebeurtenissen en logboeken van de afgelopen 90 dagen wilt opslaan en er query's op wilt uitvoeren, schakelt u Container Insights in voor meer informatie over het oplossen van problemen in uw AKS-cluster.
Azure Kubernetes Service