Überwachen eines einzelnen Azure Stack HCI-Clusters der Version 23H2 mit Insights

Gilt für: Azure Stack HCI, Version 23H2

In diesem Artikel wird beschrieben, wie Sie Insights verwenden, um einen einzelnen Azure Stack HCI-Cluster zu überwachen. Informationen zu mehreren Azure Stack HCI-Clustern finden Sie unter Überwachen mehrerer Azure Stack HCI-Cluster mit Insights.

Insights ist ein Feature von Azure Monitor, mit dem Sie schnell mit der Überwachung Ihres Azure Stack HCI-Clusters beginnen können. Sie können wichtige Metriken, Integritäts- und Nutzungsinformationen zu Clustern, Servern, virtuellen Computern und Speicher anzeigen.

Nehmen Sie sich einen Moment Zeit, um die exemplarische Vorgehensweise des Videos zu Insights für Azure Stack HCI zu watch:

Vorteile

Insights für Azure Stack HCI bietet die folgenden Vorteile:

  • Verwaltet von Azure. Erkenntnisse werden von Azure verwaltet und über die Azure-Portal abgerufen, um sicherzustellen, dass sie immer auf dem neuesten Stand sind. Es ist keine Datenbank- oder spezielle Softwareeinrichtung erforderlich.

  • Skalierbarkeit. Insights kann über 400 Clusterinformationsgruppen über mehrere Abonnements gleichzeitig laden. Es gibt keine Einschränkungen für Cluster, Domäne oder physischen Standort.

  • Individualisierbarkeit. Die Benutzeroberfläche von Insight basiert auf Azure Monitor-Arbeitsmappenvorlagen. Dadurch können Sie die Ansichten und Abfragen ändern, Schwellenwerte ändern oder festlegen, die ihren spezifischen Grenzwerten entsprechen, und diese Anpassungen dann in einer Arbeitsmappe speichern. Anschließend können Sie Diagramme in den Arbeitsmappen an die Azure-Dashboards anheften.

Voraussetzungen

Hier sind die Voraussetzungen für die Verwendung von Insights für Azure Stack HCI:

  • Sie müssen Zugriff auf einen bereitgestellten und registrierten Azure Stack HCI-Cluster haben.

  • Die verwaltete Identität für die Azure-Ressource muss aktiviert sein. Weitere Informationen finden Sie unter Aktivierte erweiterte Verwaltung.

Erkenntnisse aktivieren

Die Aktivierung der Erkenntnisse hilft Ihnen bei der Überwachung aller Azure Stack HCI-Cluster, die derzeit mit dem Log Analytics-Arbeitsbereich verbunden sind, indem nützliche Integritätsmetriken bereitgestellt werden. Insights installiert den Azure Monitor-Agent und hilft Ihnen beim Konfigurieren von Datensammlungsregeln (Data Collection Rules, DCRs) für die Überwachung Ihres Azure Stack HCI-Clusters.

Führen Sie die folgenden Schritte aus, um Insights aus dem Azure-Portal zu aktivieren:

  1. Navigieren Sie auf der Azure-Portal zur Seite Ihrer Azure Stack HCI-Clusterressource, und wählen Sie dann Ihren Cluster aus. Wählen Sie auf der Registerkarte Funktionen die Option Erkenntnisse.

    Screenshot: Kachel

  2. Wählen Sie auf der Seite Insightsdie Option Erste Schritte aus.

    Screenshot der Schaltfläche

  3. Wählen Sie auf der Seite Insights-Konfiguration aus der Dropdownliste Datensammlungsregel einen vorhandenen DCR aus. Der DCR gibt die Ereignisprotokolle und Leistungsindikatoren an, die gesammelt werden müssen, und speichert sie in einem Log Analytics-Arbeitsbereich. Insights erstellt einen Standard-DCR, wenn noch nicht vorhanden ist. Nur die DCRs, die für Insights aktiviert sind, sind enthalten.

    Screenshot: Fenster

  4. (Optional) Sie können auch einen neuen DCR erstellen, indem Sie auf der Seite "Insights-Konfiguration" Create Neu auswählen.

    Wichtig

    Es wird dringend empfohlen, keine eigene DCR zu erstellen. Der von Insights erstellte DCR enthält einen speziellen Datenstrom, der für seinen Betrieb erforderlich ist. Sie können diesen DCR bearbeiten, um weitere Daten zu sammeln, z. B. Windows- und Syslog-Ereignisse. Die DCRs, die durch die AMA-Installation erstellt wurden, verfügen über ein Präfix AzureStackHCI- mit dem DCR-Namen.

    1. Geben Sie auf der Seite Neue Datensammlungsregel das Abonnement, den DCR-Namen und den Namen des Datensammlungsendpunkts (Data Collection Endpoint, DCE) an. DCEs werden verwendet, um auf den Konfigurationsdienst zuzugreifen, um zugeordnete DCRs für den Azure Monitor-Agent abzurufen. Weitere Informationen zu DCE finden Sie unter Datensammlungsendpunkte in Azure Monitor.

      Hinweis

      Wenn Sie private Links für den Agent verwenden, müssen Sie DCEs hinzufügen. Weitere Informationen zu AMA-Netzwerkeinstellungen finden Sie unter Definieren der Netzwerkeinstellungen des Azure Monitor-Agents.

      Screenshot: Fenster der Datensammlungsregel

    2. Wählen Sie die Schaltfläche Überprüfen + erstellen aus.

      Wenn noch kein DCR für den nicht überwachten Cluster erstellt wurde, wird eine mit aktivierten Leistungsindikatoren und aktiviertem Windows-Ereignisprotokollkanal erstellt.

  5. Sehen Sie sich den abschließenden Bildschirm mit einer Zusammenfassung des DCR-Namens, der Anzahl von Ereignisprotokollen, leistungsindikatoren und dem Namen des Log Analytics-Arbeitsbereichs an, in dem Daten gespeichert sind. Klicken Sie auf Einrichten.

    Screenshot: Dropdownauswahl für die Datensammlungsregel

    Nachdem Sie Einrichten ausgewählt haben, werden Sie zur Seite Erweiterungen weitergeleitet, wo Sie die status Ihrer Agentinstallation sehen können. Durch das Konfigurieren von Insights wird AMA automatisch auf allen Knoten des Clusters installiert.

  6. Navigieren Sie zur Seite Ihrer Azure Stack HCI-Clusterressource, und wählen Sie dann Ihren Cluster aus. Insights wird jetzt auf der Registerkarte Funktionen als konfiguriert angezeigt:

    Screenshot: Kachel

Regeln für die Datensammlung

Wenn Sie Insights auf einem Computer mit dem Azure Monitor-Agent aktivieren, müssen Sie einen zu verwendenden DCR angeben. Weitere Informationen zu DCRs finden Sie unter Datensammlungsregeln in Azure Monitor.

Option Beschreibung
Leistungsindikatoren Gibt an, welche Datenleistungsindikatoren vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Diese Leistungsindikatoren werden verwendet, um die Visualisierungen in der Arbeitsmappe Insights aufzufüllen. Derzeit verwendet die Insights-Arbeitsmappe fünf Leistungsindikatoren: Memory()\Available Bytes, , Processor(_Total)\% Processor TimeNetwork Interface()\Bytes Total/sec, RDMA Activity()\RDMA Inbound Bytes/secundRDMA Activity()\RDMA Outbound Bytes/sec
Ereignisprotokollkanal Gibt an, welche Windows-Ereignisprotokolle vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Windows-Ereignisprotokolle werden verwendet, um die Visualisierungen in der Insights-Arbeitsmappe aufzufüllen. Derzeit werden Daten über zwei Windows-Ereignisprotokollkanäle gesammelt: - microsoft-windows-health/operational und microsoft-windows-sddc-management/operational
Log Analytics-Arbeitsbereich Arbeitsbereich zum Speichern der Daten. Nur Arbeitsbereiche mit Insights werden aufgeführt.

Ereigniskanal

Der Microsoft-windows-sddc-management/operational Windows-Ereigniskanal und Microsoft-windows-health/operational wird Ihrem Log Analytics-Arbeitsbereich unter Windows-Ereignisprotokolle hinzugefügt.

Screenshot: Fenster

Durch das Sammeln dieser Protokolle zeigt Insights die Integritäts-status der einzelnen Server, Laufwerke, Volumes und VMs an. Standardmäßig werden fünf Leistungsindikatoren hinzugefügt.

Leistungsindikatoren

Standardmäßig werden fünf Leistungsindikatoren hinzugefügt:

Screenshot: Hinzugefügte Leistungsindikatoren

Die folgende Tabelle beschreibt die Leistungszähler, die überwacht werden:

Leistungsindikatoren BESCHREIBUNG
Arbeitsspeicher(*)\Verfügbare Bytes Verfügbare Bytes ist die Menge des physischen Speichers in Bytes, die sofort für die Belegung eines Prozesses oder für die Systemnutzung zur Verfügung steht.
Netzwerkschnittstelle(*)\Bytes Total/Sek. Die Rate, mit der Bytes über jeden Netzwerkadapter gesendet und empfangen werden, einschließlich Framing-Zeichen. Bytes Total/Sek. ist die Summe aus Bytes Empfangen/Sek. und Bytes Gesendet/Sek.
Prozessor(_Total)% Prozessorzeit Der Prozentsatz der verstrichenen Zeit, in der alle Prozess-Threads den Prozessor für die Ausführung von Befehlen genutzt haben.
RDMA-Aktivität(*)\RDMA Eingehende Bytes/Sek. Rate der über RDMA vom Netzwerkadapter empfangenen Daten pro Sekunde.
RDMA-Aktivität(*)\RDMA Ausgehende Bytes/Sek. Rate der vom Netzwerkadapter über RDMA gesendeten Daten pro Sekunde.

Nachdem Sie Erkenntnisse aktiviert haben, kann es bis zu 15 Minuten dauern, bis die Daten erfasst sind. Wenn der Prozess abgeschlossen ist, können Sie im linken Bereich im Menü Erkenntnisse eine umfassende Visualisierung der Integrität Ihres Clusters anzeigen:

Screenshot: Insight-Visualisierungen

Erkenntnisse deaktivieren

Führen Sie zum Deaktivieren von Insights die folgenden Schritte aus:

  1. Wählen Sie Erkenntnisse auf der Registerkarte Funktionen.

  2. Wählen Sie Erkenntnisse deaktivieren.

    Screenshot: Fenster

Wenn Sie das Insights-Feature deaktivieren, wird die Zuordnung zwischen der Datensammlungsregel und dem Cluster gelöscht, und die Integritätsdienst- und SDDC-Verwaltungsprotokolle werden nicht mehr gesammelt. Vorhandene Daten werden jedoch nicht gelöscht. Wenn Sie diese Daten löschen möchten, wechseln Sie zu Ihrem DCR- und Log Analytics-Arbeitsbereich, und löschen Sie die Daten manuell.

Aktualisieren von Erkenntnissen

Das Steuerelement Erkenntnisse zeigt in den folgenden Fällen eine Meldung über eine notwendige Aktualisierung an:

  • Eine Datensammlungsregel wird geändert.
  • Ein Integritätsereignis aus dem Windows-Ereignisprotokoll wird gelöscht.
  • Jeder der fünf Leistungsindikatoren aus dem Log Analytics-Arbeitsbereich wird gelöscht.

Führen Sie die folgenden Schritte aus, um Insights erneut zu aktivieren:

  1. Wählen Sie das Steuerelement Erkenntnisse innerhalb des Bereichs Funktionen.

  2. Wählen Sie Aktualisieren, um die Visualisierungen erneut anzuzeigen.

    Screenshot: Fenster

Problembehandlung

In diesem Abschnitt finden Sie Anleitungen zum Beheben der Probleme bei der Verwendung von Insights für Azure Stack HCI.

Problembehandlung für leere Arbeitsmappenseiten ohne Auffüllung von Daten

Problem. Es wird eine leere Arbeitsmappenseite ohne Auffüllung von Daten angezeigt, wie im folgenden Screenshot gezeigt:

Screenshot einer leeren Arbeitsmappenseite

Mögliche Ursachen. Es kann mehrere Ursachen für dieses Problem geben, z. B. die kürzliche Konfiguration von Insights oder eine falsche Konfiguration des zugehörigen DCR.

Lösung: Führen Sie die folgenden Schritte nacheinander aus, um das Problem zu beheben:

  1. Wenn Sie Insights kürzlich konfiguriert haben, warten Sie bis zu einer Stunde, bis AMA Daten sammelt.
  2. Überprüfen Sie die Konfiguration des zugeordneten DCR. Stellen Sie sicher, dass Ereigniskanäle und Leistungsindikatoren dem zugeordneten DCR als Datenquellen hinzugefügt werden, wie im Abschnitt Datensammlungsregeln beschrieben.
  3. Wenn das Problem nach der Ausführung der oben genannten Schritte weiterhin besteht und sie weiterhin keine Daten sehen, wenden Sie sich an den Kundensupport, um Unterstützung zu erhalten.

Ausführlichere Anleitungen zur Problembehandlung finden Sie unter Anleitung zur Problembehandlung für den Azure Monitor-Agent.

Visualisierungen der Erkenntnisse

Sobald die Funktion Erkenntnisse aktiviert ist, finden Sie in den folgenden Tabellen Informationen zu allen Ressourcen.

Gesundheitswesen

Liefert Integritätsfehler eines Clusters.

Metrik BESCHREIBUNG Einheit Beispiel
Fehler Kurzbeschreibung von Integritätsfehlern. Wenn Sie auf den Link klicken, öffnet sich ein Seitenfenster mit weiteren Informationen. Keine Einheit PoolCapacityThresholdExceeded
Fehlerhafter Ressourcentyp Der Typ der Ressource, bei der ein Fehler aufgetreten ist. Keine Einheit StoragePool
Fehlerhafte Ressourcen-ID Eindeutige ID für die Ressource, bei der ein Integritätsfehler aufgetreten ist. Eindeutige ID {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
severity Der Schweregrad des Fehlers kann warnend oder kritisch sein. Keine Einheit Warnung
Anfängliche Fehlerzeit Zeitstempel, wann der Server zuletzt aktualisiert wurde. Datetime 09.04.2022, 12:15:42 Uhr

Server

Metrik BESCHREIBUNG Einheit Beispiel
Server Die Namen der Server im Cluster. Keine Einheit VM-1
Letzte Aktualisierung Das Datum und die Uhrzeit der letzten Aktualisierung des Servers. Datetime 09.04.2022, 12:15:42 Uhr
Status Die Integrität der Serverressourcen im Cluster. Der Status kann auf fehlerfrei, warnend, kritisch oder sonstiges stehen Healthy
CPU-Auslastung Der Prozentsatz der Zeit, in der der Prozess die CPU genutzt hat. Percent 56 %
Speicherauslastung Die Speichernutzung des Serverprozesses entspricht dem Zähler Prozess\Private Bytes plus der Größe der im Speicher zugeordneten Daten. Percent 16 %
Logische Prozessoren Die Anzahl der logischen Prozessoren. Anzahl 2
CPUs Die Anzahl der CPUs. Anzahl 2
Betriebszeit Die Zeit, in der eine Maschine, insbesondere ein Computer, in Betrieb ist. Timespan 2.609 Std.
Website Der Name des Standorts, zu dem der Server gehört. Standortname SiteA erhalten bleiben.
Domänenname Die lokale Domain, zu der der Server gehört. Keine Einheit Contoso.local

Virtuelle Computer

Liefert den Status aller virtuellen Maschinen im Cluster. Eine VM kann sich in einem der folgenden Status befinden: Ausführend, Angehalten, Fehlgeschlagen oder Sonstiges (Unbekannt, Startend, Momentaufnahme, Abspeichernd, Anhaltend, Pausieren, Wiederaufnehmen, Angehalten, Ausgesetzt).

Metrik BESCHREIBUNG Einheit Beispiel
Server Name des Servers Keine Einheit Sample-VM-1
Zuletzt aktualisiert Dies gibt das Datum und die Uhrzeit der letzten Aktualisierung des Servers an. Datetime 09.04.2022, 12:24:02 Uhr
VMs gesamt Die Anzahl der VMs in einem Serverknoten. Anzahl 0 von 0 in Ausführung
Wird ausgeführt Die Anzahl der VMs, die in einem Serverknoten ausgeführt werden. Anzahl 2
Beendet Die Anzahl der angehaltenen VMs in einem Serverknoten. Anzahl 3
Fehler Die Anzahl der fehlerhaften VMs in einem Serverknoten. Anzahl 2
Sonstiges Wenn sich der virtuelle Computer in einem der folgenden Zustände befindet (Unbekannt, Starten, Momentaufnahme, Speichern, Anhalten, Anhalten, Fortsetzen, Angehalten, Angehalten), wird er als "Sonstige" betrachtet. Anzahl 2

Storage

Die folgende Tabelle enthält die Integrität von Volumes und Laufwerken im Cluster:

Metrik BESCHREIBUNG Einheit Beispiel
Volumes Der Name des Datenträgers Keine Einheit ClusterPerformanceHistory
Letzte Aktualisierung Das Datum und die Uhrzeit der letzten Aktualisierung des Speichers. Datetime 14.04.2022, 14:58:55 Uhr
Status Der Status des Volumes. Fehlerfrei, warnend, kritisch und sonstige. Healthy
Gesamtkapazität Die Gesamtkapazität des Geräts in Byte während des Berichtszeitraums. Byte 2,5 GB
Verfügbare Kapazität Die verfügbare Kapazität in Byte während des Berichtszeitraums. Byte 20B
IOPS Ein-/Ausgabevorgänge pro Sekunde. Pro Sekunde 45/s
Throughput Anzahl von Bytes pro Sekunde, die die Application Gateway-Instanz bereitgestellt hat. Bytes pro Sekunde 5 B/Sek.
Latency Die Zeit, die für die Fertigstellung der E/A-Anfrage benötigt wird. Second 0,0016 s
Resilienz Die Kapazität, sich von Fehlern zu erholen. Maximiert Datenverfügbarkeit. Keine Einheit Drei-Wege-Spiegel
Deduplizierung Der Prozess der Reduzierung der physischen Anzahl von Datenbytes, die auf dem Datenträger gespeichert werden müssen. Verfügbar oder nicht verfügbar Ja/Nein
Dateisystem Der Typ des Dateisystems. Keine Einheit ReFS

Azure Monitor – Preise

Wenn Sie die Überwachungsvisualisierung aktivieren, werden Protokolle gesammelt aus:

  • Integritätsmanagement (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).

Die Abrechnung erfolgt basierend auf der Menge der erfassten Daten und den Einstellungen für die Datenaufbewahrung Ihres Log Analytics-Arbeitsbereichs.

Für Azure Monitor gelten nutzungsbasierte Preise, und die ersten fünf GB pro Abrechnungskonto und Monat sind kostenlos. Da die Preise aufgrund verschiedener Faktoren wie der verwendeten Azure-Region variieren können, finden Sie mithilfe des Azure Monitor-Preisrechners die aktuellsten Preisberechnungen.

Nächste Schritte