Überwachen eines einzelnen Azure Stack HCI, Version 23H2-Clusters mit Insights

Artikel
07/31/2024

Gilt für: Azure Stack HCI, Version 23H2

In diesem Artikel wird beschrieben, wie Sie Insights verwenden, um einen einzelnen Azure Stack HCI-Cluster zu überwachen. Mehrere Azure Stack HCI-Cluster finden Sie unter Überwachen mehrerer Azure Stack HCI-Cluster mit Insights.

Insights ist ein Feature von Azure Monitor, mit dem Sie schnell mit der Überwachung Ihres Azure Stack HCI-Clusters beginnen können. Sie können wichtige Metriken, Integrität und Nutzungsinformationen zu Cluster, Servern, virtuellen Computern und Speicher anzeigen.

Nehmen Sie sich ein paar Momente Zeit, um sich die exemplarische Vorgehensweise zu Insights für Azure Stack HCI anzusehen:

Vorteile

Insights für Azure Stack HCI bietet die folgenden Vorteile:

Verwaltet von Azure. Insights wird von Azure verwaltet und über die Azure-Portal aufgerufen, um sicherzustellen, dass es immer auf dem neuesten Stand ist. Es ist keine Datenbank- oder spezielle Softwareeinrichtung erforderlich.
Skalierbarkeit. Insights ist in der Lage, mehr als 400 Clusterinformationssätze gleichzeitig über mehrere Abonnements hinweg zu laden. Es gibt keine Einschränkungen für Cluster, Domäne oder physischen Standort.
Individualisierbarkeit. Die Erfahrung von Insight basiert auf Azure Monitor-Arbeitsmappenvorlagen. Auf diese Weise können Sie die Ansichten und Abfragen ändern, Schwellenwerte ändern oder festlegen, die ihren spezifischen Grenzwerten entsprechen, und diese Anpassungen dann in einer Arbeitsmappe speichern. Anschließend können Sie Diagramme in den Arbeitsmappen an die Azure-Dashboards anheften.

Voraussetzungen

Hier sind die Voraussetzungen für die Verwendung von Insights für Azure Stack HCI:

Sie müssen Zugriff auf einen Azure Stack HCI-Cluster haben, der bereitgestellt und registriert ist.
Die verwaltete Identität für die Azure-Ressource muss aktiviert sein. Weitere Informationen finden Sie unter "Erweiterte Verwaltung aktiviert".

Erkenntnisse aktivieren

Die Aktivierung der Erkenntnisse hilft Ihnen bei der Überwachung aller Azure Stack HCI-Cluster, die derzeit mit dem Log Analytics-Arbeitsbereich verbunden sind, indem nützliche Integritätsmetriken bereitgestellt werden. Insights installiert den Azure Monitor Agent und hilft Ihnen, Datensammlungsregeln (DCRs) für die Überwachung Ihres Azure Stack HCI-Clusters zu konfigurieren.

Informationen zum Aktivieren von Insights im großen Maßstab finden Sie unter Aktivieren von Insights für Azure Stack HCI im großen Maßstab mithilfe von Azure-Richtlinien.

Führen Sie die folgenden Schritte aus, um Insights aus dem Azure-Portal zu aktivieren:

Navigieren Sie im Azure-Portal zur Azure Stack HCI-Clusterressourcenseite, und wählen Sie dann Ihren Cluster aus. Wählen Sie auf der Registerkarte Funktionen die Option Erkenntnisse.
Wählen Sie auf der Seite "Insights" die Option "Erste Schritte" aus.
Wählen Sie auf der Insights-Konfigurationsseite einen vorhandenen DCR aus dem Dropdownmenü "Datensammlungsregel " aus. Der DCR gibt die Ereignisprotokolle und Leistungsindikatoren an, die gesammelt und in einem Log Analytics-Arbeitsbereich gespeichert werden müssen. Insights erstellt einen Standard-DCR, wenn es noch nicht vorhanden ist. Nur die DCRs, die für Insights aktiviert sind, sind enthalten.
(Optional) Sie können auch einen neuen DCR erstellen, indem Sie auf der Insights-Konfigurationsseite "Neu erstellen" auswählen.

Wichtig

Es wird dringend empfohlen, keine eigenen DCR zu erstellen. Der von Insights erstellte DCR enthält einen speziellen Datenstrom, der für den Betrieb erforderlich ist. Sie können diesen DCR bearbeiten, um weitere Daten zu sammeln, z. B. Windows- und Syslog-Ereignisse. Die über die AMA-Installation erstellten DCRs weisen ein Präfix AzureStackHCI- mit dem DCR-Namen auf.
1. Geben Sie auf der Seite "Neue Datensammlungsregel " den Namen des Abonnements, den DCR-Namen und den Datensammlungsendpunkt (Data Collection Endpoint, DCE) an. DCEs werden verwendet, um auf den Konfigurationsdienst zuzugreifen, um zugeordnete DCRs für Azure Monitor Agent abzurufen. Weitere Informationen zu DCE finden Sie unter Datensammlungsendpunkte in Azure Monitor.
  
  Hinweis
  
  Wenn Sie private Links für den Agent verwenden, müssen Sie DCEs hinzufügen. Weitere Informationen zu AMA-Netzwerkeinstellungen finden Sie unter Definieren von Azure Monitor Agent-Netzwerkeinstellungen.
2. Wählen Sie die Schaltfläche Überprüfen + erstellen aus.
  
  Wenn für den nicht überwachten Cluster noch kein DCR erstellt wurde, wird eine mit aktivierten Leistungsindikatoren erstellt und der Windows-Ereignisprotokollkanal aktiviert.
Überprüfen Sie den letzten Bildschirm mit einer Zusammenfassung des DCR-Namens, der Anzahl der Ereignisprotokolle, Leistungsindikatoren und des Namens des Log Analytics-Arbeitsbereichs, in dem Daten gespeichert werden. Klicken Sie auf Einrichten.

Nachdem Sie "Einrichten" ausgewählt haben, werden Sie zur Seite "Erweiterungen" umgeleitet, auf der Sie den Status Ihrer Agent-Installation sehen können. Durch die Konfiguration von Insights wird AMA automatisch auf allen Knoten des Clusters installiert.
Wechseln Sie zur Azure Stack HCI-Clusterressourcenseite, und wählen Sie dann Ihren Cluster aus. Insights wird jetzt auf der Registerkarte "Funktionen" als konfiguriert angezeigt:

Datensammlungsregeln in Azure Monitor (Vorschau)

Wenn Sie Insights auf einem Computer mit dem Azure Monitor-Agent aktivieren, müssen Sie einen zu verwendenden DCR angeben. Weitere Informationen zu DCRs finden Sie unter Datensammlungsregeln in Azure Monitor.

Option	Beschreibung
Leistungsindikatoren	Gibt an, welche Datenleistungsindikatoren vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Diese Leistungsindikatoren werden verwendet, um die Visualisierungen in der Insights-Arbeitsmappe aufzufüllen. Derzeit verwendet die Insights-Arbeitsmappe fünf Leistungsindikatoren – `Memory()\Available Bytes`, , `Network Interface()\Bytes Total/sec`, `Processor(_Total)\% Processor Time`, `RDMA Activity()\RDMA Inbound Bytes/sec`und `RDMA Activity()\RDMA Outbound Bytes/sec`
Ereignisprotokollkanal	Gibt an, welche Windows-Ereignisprotokolle vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Windows-Ereignisprotokolle werden verwendet, um die Visualisierungen in der Insights-Arbeitsmappe aufzufüllen. Derzeit werden Daten über zwei Windows-Ereignisprotokollkanäle gesammelt: `- microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational`
Log Analytics-Arbeitsbereich	Arbeitsbereich zum Speichern der Daten. Es werden nur Arbeitsbereiche mit Insights aufgelistet.

Ereigniskanal

Der Microsoft-windows-sddc-management/operational Kanal und Microsoft-windows-health/operational der Windows-Ereigniskanal werden ihrem Log Analytics-Arbeitsbereich unter Windows-Ereignisprotokollen hinzugefügt.

Durch das Sammeln dieser Protokolle zeigt Insights den Integritätsstatus der einzelnen Server, Laufwerke, Volumes und VMs an. Standardmäßig werden fünf Leistungsindikatoren hinzugefügt.

Leistungsindikatoren

Standardmäßig werden fünf Leistungsindikatoren hinzugefügt:

Die folgende Tabelle beschreibt die Leistungszähler, die überwacht werden:

Leistungsindikatoren	Beschreibung
Arbeitsspeicher(*)\Verfügbare Bytes	Verfügbare Bytes ist die Menge des physischen Speichers in Bytes, die sofort für die Belegung eines Prozesses oder für die Systemnutzung zur Verfügung steht.
Netzwerkschnittstelle(*)\Bytes gesamt/s	Die Rate, mit der Bytes über jeden Netzwerkadapter gesendet und empfangen werden, einschließlich Framing-Zeichen. Bytes Total/Sek. ist die Summe aus Bytes Empfangen/Sek. und Bytes Gesendet/Sek.
Processor(_Total)% Processor Time	Der Prozentsatz der verstrichenen Zeit, in der alle Prozess-Threads den Prozessor für die Ausführung von Befehlen genutzt haben.
RDMA-Aktivität(*)\RDMA Eingehende Bytes/Sek.	Rate der über RDMA vom Netzwerkadapter empfangenen Daten pro Sekunde.
RDMA-Aktivität(*)\RDMA Ausgehende Bytes/Sek.	Rate der vom Netzwerkadapter über RDMA gesendeten Daten pro Sekunde.

Nachdem Sie Erkenntnisse aktiviert haben, kann es bis zu 15 Minuten dauern, bis die Daten erfasst sind. Wenn der Prozess abgeschlossen ist, können Sie eine umfassende Visualisierung der Integrität Ihres Clusters aus dem Menü "Insights" im linken Bereich sehen:

Erkenntnisse deaktivieren

Führen Sie die folgenden Schritte aus, um Insights zu deaktivieren:

Wählen Sie Erkenntnisse auf der Registerkarte Funktionen.
Wählen Sie Erkenntnisse deaktivieren.

Wenn Sie das Insights-Feature deaktivieren, wird die Zuordnung zwischen der Datensammlungsregel und dem Cluster gelöscht, und die Integritätsdienst und SDDC-Verwaltungsprotokolle werden nicht mehr gesammelt. Vorhandene Daten werden jedoch nicht gelöscht. Wenn Sie diese Daten löschen möchten, wechseln Sie in Ihren DCR- und Log Analytics-Arbeitsbereich, und löschen Sie die Daten manuell.

Insights aktualisieren

Das Steuerelement Erkenntnisse zeigt in den folgenden Fällen eine Meldung über eine notwendige Aktualisierung an:

Eine Datensammlungsregel wird geändert.
Ein Integritätsereignis aus dem Windows-Ereignisprotokoll wird gelöscht.
Jeder der fünf Leistungsindikatoren aus dem Log Analytics-Arbeitsbereich wird gelöscht.

Führen Sie die folgenden Schritte aus, um Insights erneut zu aktivieren:

Wählen Sie das Steuerelement Erkenntnisse innerhalb des Bereichs Funktionen.
Wählen Sie Aktualisieren, um die Visualisierungen erneut anzuzeigen.

Problembehandlung

Dieser Abschnitt enthält Anleitungen zum Beheben der Probleme bei der Verwendung von Insights für Azure Stack HCI.

Problembehandlung für leere Arbeitsmappenseite ohne aufgefüllte Daten

Ausstellen. Es wird eine leere Arbeitsmappenseite ohne Aufgefüllte Daten angezeigt, wie im folgenden Screenshot gezeigt:

Mögliche Ursachen. Es kann mehrere Ursachen für dieses Problem geben, z. B. die aktuelle Konfiguration von Insights oder eine unsachgemäße Konfiguration des zugeordneten DCR.

Lösung: Führen Sie zum Beheben des Problems die folgenden Schritte in Sequenz aus:

Wenn Sie Insights kürzlich konfiguriert haben, warten Sie bis zu einer Stunde, bis AMA Daten sammelt.
Überprüfen Sie die Konfiguration des zugeordneten DCR. Stellen Sie sicher, dass Ereigniskanäle und Leistungsindikatoren dem zugeordneten DCR als Datenquellen hinzugefügt werden, wie im Abschnitt "Datensammlungsregeln " beschrieben.
Wenn das Problem nach der Ausführung der obigen Schritte weiterhin besteht und weiterhin keine Daten angezeigt werden, wenden Sie sich an den Kundensupport, um Unterstützung zu erhalten.

Ausführlichere Anleitungen zur Problembehandlung finden Sie in den Anleitungen zur Problembehandlung für den Azure Monitor-Agent.

Visualisierungen der Erkenntnisse

Sobald die Funktion Erkenntnisse aktiviert ist, finden Sie in den folgenden Tabellen Informationen zu allen Ressourcen.

Gesundheit

Liefert Integritätsfehler eines Clusters.

Metrik	Beschreibung	Einheit	Beispiel
Fehler	Kurzbeschreibung von Integritätsfehlern. Wenn Sie auf den Link klicken, öffnet sich ein Seitenfenster mit weiteren Informationen.	Keine Einheit	PoolCapacityThresholdExceeded
Fehlerhafter Ressourcentyp	Der Typ der Ressource, bei der ein Fehler aufgetreten ist.	Keine Einheit	StoragePool
Fehlerhafte Ressourcen-ID	Eindeutige ID für die Ressource, bei der ein Integritätsfehler aufgetreten ist.	Eindeutige ID	{1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Severity	Der Schweregrad des Fehlers kann warnend oder kritisch sein.	Keine Einheit	Warnung
Anfängliche Fehlerzeit	Zeitstempel, wann der Server zuletzt aktualisiert wurde.	Datetime	09.04.2022, 12:15:42 Uhr

Server

Metrik	Beschreibung	Einheit	Beispiel
Server	Die Namen der Server im Cluster.	Keine Einheit	VM-1
Letzte Aktualisierung	Das Datum und die Uhrzeit der letzten Aktualisierung des Servers.	Datetime	09.04.2022, 12:15:42 Uhr
Status	Die Integrität der Serverressourcen im Cluster.	Der Status kann auf fehlerfrei, warnend, kritisch oder sonstiges stehen	Healthy
CPU-Auslastung	Der Prozentsatz der Zeit, in der der Prozess die CPU genutzt hat.	Percent	56 %
Speicherauslastung	Die Speichernutzung des Serverprozesses entspricht dem Zähler Prozess\Private Bytes plus der Größe der im Speicher zugeordneten Daten.	Percent	16 %
Logische Prozessoren	Die Anzahl der logischen Prozessoren.	Anzahl	2
CPUs	Die Anzahl der CPUs.	Anzahl	2
Betriebszeit	Die Zeit, in der eine Maschine, insbesondere ein Computer, in Betrieb ist.	Timespan	2.609 Std.
Website	Der Name des Standorts, zu dem der Server gehört.	Sitename	SiteA
Domänenname	Die lokale Domain, zu der der Server gehört.	Keine Einheit	Contoso.local

Virtuelle Computer

Liefert den Status aller virtuellen Maschinen im Cluster. Eine VM kann sich in einem der folgenden Status befinden: Ausführend, Angehalten, Fehlgeschlagen oder Sonstiges (Unbekannt, Startend, Momentaufnahme, Abspeichernd, Anhaltend, Pausieren, Wiederaufnehmen, Angehalten, Ausgesetzt).

Metrik	Beschreibung	Einheit	Beispiel
Server	Name des Servers	Keine Einheit	Sample-VM-1
Zuletzt aktualisiert	Dadurch wird das Datum und die Uhrzeit der letzten Aktualisierung des Servers angezeigt.	Datetime	09.04.2022, 12:24:02 Uhr
VMs gesamt	Die Anzahl der VMs in einem Serverknoten.	Anzahl	0 von 0 in Ausführung
Wird ausgeführt	Die Anzahl der VMs, die in einem Serverknoten ausgeführt werden.	Anzahl	2
Beendet	Die Anzahl der angehaltenen VMs in einem Serverknoten.	Anzahl	3
Fehler	Die Anzahl der fehlerhaften VMs in einem Serverknoten.	Anzahl	2
Andere	Wenn sich der virtuelle Computer in einem der folgenden Zustände befindet (Unknown, Starting, Snapshotting, Saving, Stop, Pausing, Resuming, Paused, Suspended), wird er als "Other" betrachtet.	Anzahl	2

Speicher

Die folgende Tabelle enthält die Integrität von Volumes und Laufwerken im Cluster:

Metrik	Beschreibung	Einheit	Beispiel
Volumes	Der Name des Datenträgers	Keine Einheit	ClusterPerformanceHistory.
Letzte Aktualisierung	Das Datum und die Uhrzeit der letzten Aktualisierung des Speichers.	Datetime	14.04.2022, 14:58:55 Uhr
Status	Der Status des Volumes.	Fehlerfrei, warnend, kritisch und sonstige.	Healthy
Gesamtkapazität	Die Gesamtkapazität des Geräts in Byte während des Berichtszeitraums.	Byte	2,5 GB
Verfügbare Kapazität	Die verfügbare Kapazität in Byte während des Berichtszeitraums.	Byte	20B
Iops	Ein-/Ausgabevorgänge pro Sekunde.	Pro Sekunde	45/s
Durchsatz	Anzahl von Bytes pro Sekunde, die die Application Gateway-Instanz bereitgestellt hat.	Bytes pro Sekunde	5 B/Sek.
Latency	Die Zeit, die für die Fertigstellung der E/A-Anfrage benötigt wird.	Second	0.0016 s
Resilienz	Die Kapazität, sich von Fehlern zu erholen. Maximiert Datenverfügbarkeit.	Keine Einheit	Drei-Wege-Spiegel
Deduplizierung	Der Vorgang zum Verringern der physischen Anzahl von Daten, die auf dem Datenträger gespeichert werden müssen.	Verfügbar oder nicht verfügbar	Ja/Nein
Dateisystem	Der Typ des Dateisystems.	Keine Einheit	ReFS

Azure Monitor – Preise

Wenn Sie die Überwachungsvisualisierung aktivieren, werden Protokolle aus:

Integritätsmanagement (Microsoft-windows-health/operational).
SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).

Sie werden basierend auf der Menge der aufgenommenen Daten und den Datenaufbewahrungseinstellungen Ihres Log Analytics-Arbeitsbereichs in Rechnung gestellt.

Für Azure Monitor gelten nutzungsbasierte Preise, und die ersten fünf GB pro Abrechnungskonto und Monat sind kostenlos. Da die Preise aufgrund verschiedener Faktoren wie der verwendeten Azure-Region variieren können, finden Sie mithilfe des Azure Monitor-Preisrechners die aktuellsten Preisberechnungen.

Freigeben über