Übersicht über die Azure Kubernetes Service-Diagnose und Problembehandlung

Das Beheben von Problemen mit dem Azure Kubernetes Service-Cluster (AKS-Cluster) spielt eine wichtige Rolle bei der Wartung Ihres Clusters, insbesondere wenn im Cluster unternehmenskritische Workloads ausgeführt werden. Die AKS-Diagnose und Problembehandlung ist eine intelligente Funktion zur Selbstdiagnose mit folgenden Eigenschaften:

  • Hilft beim Identifizieren und Beheben von Problemen im Cluster
  • Erfordert keine zusätzliche Konfiguration oder Abrechnungskosten

Öffnen der AKS-Diagnose und Problembehandlung

Zum Zugreifen auf die AKS-Diagnose und Problembehandlung gehen Sie folgendermaßen vor:

  1. Navigieren Sie im Azure-Portal zu Ihrem Kubernetes-Cluster.
  2. Klicken Sie im linken Navigationsbereich auf Diagnose und Problembehandlung. Die AKS-Diagnose und Problembehandlung wird geöffnet.
  3. Wählen Sie eine Kategorie aus, die Ihr Clusterproblem am besten beschreibt. Dazu gehen Sie folgendermaßen vor:
    • Verwenden Sie die Schlüsselwörter in der Beschreibung der jeweiligen Kachel auf der Startseite.
    • Geben Sie ein Schlüsselwort, das Ihr Problem am besten beschreibt, in die Suchleiste ein.

screenshot of AKS Diagnose and Solve Problems Homepage.

Anzeigen eines Diagnoseberichts

Um das Tool zu initiieren und die Ergebnisse nahtlos abzurufen, klicken Sie auf die Kachel zur Problembehandlung. Der linke Navigationsbereich enthält die Option Übersicht, mit der alle Diagnosen in dieser bestimmten Kategorie ausgeführt werden. Die ermittelten Probleme des Clusters werden im rechten Bereich angezeigt. Um das Problem umfassend zu verstehen, klicken Sie für jede Kachel auf „Details anzeigen“. Dadurch erhalten Sie eine detaillierte Beschreibung zu Folgendem:

  • Problemzusammenfassung
  • Fehlerdetails
  • Empfohlene Aktionen
  • Links zu hilfreichen Dokumenten
  • Zugehörige Metriken
  • Protokollieren von Daten

Je nach Ergebnis können Sie die detaillierten Anweisungen befolgen oder die Dokumentationslinks verwenden, um das Problem effektiv zu lösen.

Beispielszenario 1: Ich habe festgestellt, dass meine Anwendung getrennt wird oder zeitweilige Verbindungsprobleme auftreten. Daraufhin klicke ich auf die Kachel Konnektivitätsprobleme, um die möglichen Ursachen zu untersuchen.

screenshot of AKS Diagnose and solve problems Results - Networking Tile.

Ich habe eine Diagnosewarnung erhalten, die angibt, dass die Trennung möglicherweise mit meinem Cluster-DNS zusammenhängt. Um weitere Informationen zu erhalten, klicke ich auf Details anzeigen.

Screenshot of AKS Diagnose and solve problems - Networking.

Laut Diagnoseergebnis scheint es, dass das Problem mit bekannten DNS-Problemen oder der VNET-Konfiguration zusammenhängt. Glücklicherweise kann ich die bereitgestellten Dokumentationslinks verwenden, um das Problem zu beheben.

Screenshot of AKS Diagnose and Solve Problems Results - Networking - Cluster DNS.

Wenn das Problem mithilfe der in den Diagnoseergebnissen empfohlenen Dokumentation nicht behoben werden kann, können Sie zum vorherigen Schritt unter „Diagnose“ zurückkehren und auf zusätzliche Dokumentation zugreifen.

Screenshot of AKS Diagnose and solve problem result - Additional - Docs.

Verwenden der AKS-Diagnose und Problembehandlung für Best Practices

Die Bereitstellung von Anwendungen in AKS erfordert die Einhaltung von Best Practices, um optimale Leistung, Verfügbarkeit und Sicherheit zu gewährleisten. Dazu bietet die Kachel Best Practices der AKS-Diagnose und Problembehandlung eine Reihe von Best Practices, die bei der Verwaltung verschiedener Aspekte wie Bereitstellung von VM-Ressourcen, Clusterupgrades, Skalierungsvorgängen, Subnetzkonfiguration und anderen wichtigen Aspekten der Konfiguration eines Clusters helfen können. Die Verwendung der AKS-Diagnose und Problembehandlung kann von entscheidender Bedeutung sein, um sicherzustellen, dass Ihr Cluster den Best Practices entspricht und potenzielle Probleme rechtzeitig und effektiv erkannt und gelöst werden. Indem Sie die AKS-Diagnose und Problembehandlung in Ihre betrieblichen Methoden integrieren, können Sie sich auf die Zuverlässigkeit und Sicherheit Ihrer Anwendung in der Produktion verlassen.

Beispielszenario 2: Mein Cluster scheint in gutem Zustand zu sein. Alle Knoten sind bereit, und meine Anwendung wird ohne Probleme ausgeführt. Ich bin jedoch neugierig, welche Best Practices ich anwenden kann, um potenzielle Probleme zu vermeiden. Deshalb klicke ich auf die Kachel Best Practices. Beim Überprüfen der Empfehlungen stellte ich fest, dass mein Cluster zwar im Moment fehlerfrei erscheint, ich jedoch einiges tun kann, um Probleme mit Latenz, Drosselung oder VM-Betriebszeit in Zukunft zu vermeiden.

Screenshot of AKS Diagnose and solve problem - Best - Practice.

Screenshot of AKS Diagnose and solve problem - Best - result.

Nächste Schritte

  • Verwenden Sie AKS Periscope, um Protokolle zu erfassen, anhand derer Sie Clusterprobleme beheben können.

  • Lesen Sie den Abschnitt Selektierungsverfahren der AKS-Anleitung für die Betriebsvorgänge am 2. Tag.

  • Posten Sie Ihre Fragen oder Ihr Feedback auf UserVoice, indem Sie dem Titel „[Diag]“ hinzufügen.