Behandeln von Knotenfehlern, auf die Wiederherstellungen folgen
Dieser Artikel hilft bei der Problembehandlung in Szenarien, in denen ein Knoten in einem AKS-Cluster (Microsoft Azure Kubernetes Service) den Knoten nicht bereit status anzeigt, dann aber automatisch in einem fehlerfreien Zustand wiederhergestellt wird.
Problembeschreibung
Sie stellen fest, dass Ihre Anwendung nicht mehr reagiert, während der Knoten meldet, dass er über eine nicht bereit status verfügt. Der Knoten wird jedoch automatisch wiederhergestellt, und jetzt sucht er nach einer Ursachenanalyse (Root Cause Analysis, RCA).
Ursache
Mögliche Ursachen für dieses Problem sind die folgenden Szenarien:
Der API-Server ist nicht verfügbar, und Sie verwenden einen Bereitschaftstest für die Bereitstellung.
Wenn ein Pod ausgeführt wird, aber nicht bereit ist, bedeutet dies, dass der Bereitschaftstest fehlschlägt. Wenn der Bereitschaftstest fehlschlägt, wird der Pod nicht an den Dienst angefügt, und der Datenverkehr wird nicht an den Pod instance weitergeleitet.
Hostfehler für virtuelle Computer (VM) treten auf. Überprüfen Sie die folgenden Informationsquellen, um festzustellen, ob VM-Hostfehler aufgetreten sind:
- AKS-Diagnose
- Azure status
- Azure-Benachrichtigungen (für aktuelle Ausfälle oder Wartungszeiträume)
Prävention
Um dieses Problem in Zukunft zu verhindern, führen Sie eine oder mehrere der folgenden Aktionen aus:
- Stellen Sie sicher, dass Ihre Dienstebene vollständig bezahlt ist.
- Reduzieren Sie die Anzahl der
watch
Anforderungen undget
an den API-Server. - Ersetzen Sie den Knotenpool durch einen fehlerfreien Knotenpool.
Weitere Informationen
- Allgemeine Schritte zur Problembehandlung finden Sie unter Grundlegende Problembehandlung bei Knotenfehlern, die nicht bereit sind.