Freigeben über


Überwachen eines einzelnen Azure Stack HCI, Version 23H2-Clusters mit Insights

Gilt für: Azure Stack HCI, Version 23H2

In diesem Artikel wird beschrieben, wie Sie Insights verwenden, um einen einzelnen Azure Stack HCI-Cluster zu überwachen. Mehrere Azure Stack HCI-Cluster finden Sie unter Überwachen mehrerer Azure Stack HCI-Cluster mit Insights.

Insights ist ein Feature von Azure Monitor, mit dem Sie schnell mit der Überwachung Ihres Azure Stack HCI-Clusters beginnen können. Sie können wichtige Metriken, Integrität und Nutzungsinformationen zu Cluster, Servern, virtuellen Computern und Speicher anzeigen.

Nehmen Sie sich ein paar Momente Zeit, um sich die exemplarische Vorgehensweise zu Insights für Azure Stack HCI anzusehen:

Vorteile

Insights für Azure Stack HCI bietet die folgenden Vorteile:

  • Verwaltet von Azure. Insights wird von Azure verwaltet und über die Azure-Portal aufgerufen, um sicherzustellen, dass es immer auf dem neuesten Stand ist. Es ist keine Datenbank- oder spezielle Softwareeinrichtung erforderlich.

  • Skalierbarkeit. Insights ist in der Lage, mehr als 400 Clusterinformationssätze gleichzeitig über mehrere Abonnements hinweg zu laden. Es gibt keine Einschränkungen für Cluster, Domäne oder physischen Standort.

  • Individualisierbarkeit. Die Erfahrung von Insight basiert auf Azure Monitor-Arbeitsmappenvorlagen. Auf diese Weise können Sie die Ansichten und Abfragen ändern, Schwellenwerte ändern oder festlegen, die ihren spezifischen Grenzwerten entsprechen, und diese Anpassungen dann in einer Arbeitsmappe speichern. Anschließend können Sie Diagramme in den Arbeitsmappen an die Azure-Dashboards anheften.

Voraussetzungen

Hier sind die Voraussetzungen für die Verwendung von Insights für Azure Stack HCI:

  • Sie müssen Zugriff auf einen Azure Stack HCI-Cluster haben, der bereitgestellt und registriert ist.

  • Die verwaltete Identität für die Azure-Ressource muss aktiviert sein. Weitere Informationen finden Sie unter "Erweiterte Verwaltung aktiviert".

Erkenntnisse aktivieren

Die Aktivierung der Erkenntnisse hilft Ihnen bei der Überwachung aller Azure Stack HCI-Cluster, die derzeit mit dem Log Analytics-Arbeitsbereich verbunden sind, indem nützliche Integritätsmetriken bereitgestellt werden. Insights installiert den Azure Monitor Agent und hilft Ihnen, Datensammlungsregeln (DCRs) für die Überwachung Ihres Azure Stack HCI-Clusters zu konfigurieren.

Informationen zum Aktivieren von Insights im großen Maßstab finden Sie unter Aktivieren von Insights für Azure Stack HCI im großen Maßstab mithilfe von Azure-Richtlinien.

Führen Sie die folgenden Schritte aus, um Insights aus dem Azure-Portal zu aktivieren:

  1. Navigieren Sie im Azure-Portal zur Azure Stack HCI-Clusterressourcenseite, und wählen Sie dann Ihren Cluster aus. Wählen Sie auf der Registerkarte Funktionen die Option Erkenntnisse.

    Screenshot der Kachel

  2. Wählen Sie auf der Seite "Insights" die Option "Erste Schritte" aus.

    Screenshot der Schaltfläche

  3. Wählen Sie auf der Insights-Konfigurationsseite einen vorhandenen DCR aus dem Dropdownmenü "Datensammlungsregel " aus. Der DCR gibt die Ereignisprotokolle und Leistungsindikatoren an, die gesammelt und in einem Log Analytics-Arbeitsbereich gespeichert werden müssen. Insights erstellt einen Standard-DCR, wenn es noch nicht vorhanden ist. Nur die DCRs, die für Insights aktiviert sind, sind enthalten.

    Screenshot des Insights-Konfigurationsfensters.

  4. (Optional) Sie können auch einen neuen DCR erstellen, indem Sie auf der Insights-Konfigurationsseite "Neu erstellen" auswählen.

    Wichtig

    Es wird dringend empfohlen, keine eigenen DCR zu erstellen. Der von Insights erstellte DCR enthält einen speziellen Datenstrom, der für den Betrieb erforderlich ist. Sie können diesen DCR bearbeiten, um weitere Daten zu sammeln, z. B. Windows- und Syslog-Ereignisse. Die über die AMA-Installation erstellten DCRs weisen ein Präfix AzureStackHCI- mit dem DCR-Namen auf.

    1. Geben Sie auf der Seite "Neue Datensammlungsregel " den Namen des Abonnements, den DCR-Namen und den Datensammlungsendpunkt (Data Collection Endpoint, DCE) an. DCEs werden verwendet, um auf den Konfigurationsdienst zuzugreifen, um zugeordnete DCRs für Azure Monitor Agent abzurufen. Weitere Informationen zu DCE finden Sie unter Datensammlungsendpunkte in Azure Monitor.

      Hinweis

      Wenn Sie private Links für den Agent verwenden, müssen Sie DCEs hinzufügen. Weitere Informationen zu AMA-Netzwerkeinstellungen finden Sie unter Definieren von Azure Monitor Agent-Netzwerkeinstellungen.

      Screenshot des Datensammlungsregelfensters.

    2. Wählen Sie die Schaltfläche Überprüfen + erstellen aus.

      Wenn für den nicht überwachten Cluster noch kein DCR erstellt wurde, wird eine mit aktivierten Leistungsindikatoren erstellt und der Windows-Ereignisprotokollkanal aktiviert.

  5. Überprüfen Sie den letzten Bildschirm mit einer Zusammenfassung des DCR-Namens, der Anzahl der Ereignisprotokolle, Leistungsindikatoren und des Namens des Log Analytics-Arbeitsbereichs, in dem Daten gespeichert werden. Klicken Sie auf Einrichten.

    Screenshot der Dropdownauswahl für die Datensammlungsregel.

    Nachdem Sie "Einrichten" ausgewählt haben, werden Sie zur Seite "Erweiterungen" umgeleitet, auf der Sie den Status Ihrer Agent-Installation sehen können. Durch die Konfiguration von Insights wird AMA automatisch auf allen Knoten des Clusters installiert.

  6. Wechseln Sie zur Azure Stack HCI-Clusterressourcenseite, und wählen Sie dann Ihren Cluster aus. Insights wird jetzt auf der Registerkarte "Funktionen" als konfiguriert angezeigt:

    Screenshot der Kachel

Datensammlungsregeln in Azure Monitor (Vorschau)

Wenn Sie Insights auf einem Computer mit dem Azure Monitor-Agent aktivieren, müssen Sie einen zu verwendenden DCR angeben. Weitere Informationen zu DCRs finden Sie unter Datensammlungsregeln in Azure Monitor.

Option Beschreibung
Leistungsindikatoren Gibt an, welche Datenleistungsindikatoren vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Diese Leistungsindikatoren werden verwendet, um die Visualisierungen in der Insights-Arbeitsmappe aufzufüllen. Derzeit verwendet die Insights-Arbeitsmappe fünf Leistungsindikatoren – Memory()\Available Bytes, , Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/secund RDMA Activity()\RDMA Outbound Bytes/sec
Ereignisprotokollkanal Gibt an, welche Windows-Ereignisprotokolle vom Betriebssystem erfasst werden sollen. Diese Option ist für alle Computer erforderlich. Windows-Ereignisprotokolle werden verwendet, um die Visualisierungen in der Insights-Arbeitsmappe aufzufüllen. Derzeit werden Daten über zwei Windows-Ereignisprotokollkanäle gesammelt: - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Log Analytics-Arbeitsbereich Arbeitsbereich zum Speichern der Daten. Es werden nur Arbeitsbereiche mit Insights aufgelistet.

Ereigniskanal

Der Microsoft-windows-sddc-management/operational Kanal und Microsoft-windows-health/operational der Windows-Ereigniskanal werden ihrem Log Analytics-Arbeitsbereich unter Windows-Ereignisprotokollen hinzugefügt.

Screenshot des Fensters

Durch das Sammeln dieser Protokolle zeigt Insights den Integritätsstatus der einzelnen Server, Laufwerke, Volumes und VMs an. Standardmäßig werden fünf Leistungsindikatoren hinzugefügt.

Leistungsindikatoren

Standardmäßig werden fünf Leistungsindikatoren hinzugefügt:

Screenshot mit hinzugefügten Leistungsindikatoren.

Die folgende Tabelle beschreibt die Leistungszähler, die überwacht werden:

Leistungsindikatoren Beschreibung
Arbeitsspeicher(*)\Verfügbare Bytes Verfügbare Bytes ist die Menge des physischen Speichers in Bytes, die sofort für die Belegung eines Prozesses oder für die Systemnutzung zur Verfügung steht.
Netzwerkschnittstelle(*)\Bytes gesamt/s Die Rate, mit der Bytes über jeden Netzwerkadapter gesendet und empfangen werden, einschließlich Framing-Zeichen. Bytes Total/Sek. ist die Summe aus Bytes Empfangen/Sek. und Bytes Gesendet/Sek.
Processor(_Total)% Processor Time Der Prozentsatz der verstrichenen Zeit, in der alle Prozess-Threads den Prozessor für die Ausführung von Befehlen genutzt haben.
RDMA-Aktivität(*)\RDMA Eingehende Bytes/Sek. Rate der über RDMA vom Netzwerkadapter empfangenen Daten pro Sekunde.
RDMA-Aktivität(*)\RDMA Ausgehende Bytes/Sek. Rate der vom Netzwerkadapter über RDMA gesendeten Daten pro Sekunde.

Nachdem Sie Erkenntnisse aktiviert haben, kann es bis zu 15 Minuten dauern, bis die Daten erfasst sind. Wenn der Prozess abgeschlossen ist, können Sie eine umfassende Visualisierung der Integrität Ihres Clusters aus dem Menü "Insights" im linken Bereich sehen:

Screenshot mit Insights-Visualisierungen.

Erkenntnisse deaktivieren

Führen Sie die folgenden Schritte aus, um Insights zu deaktivieren:

  1. Wählen Sie Erkenntnisse auf der Registerkarte Funktionen.

  2. Wählen Sie Erkenntnisse deaktivieren.

    Screenshot des Fensters

Wenn Sie das Insights-Feature deaktivieren, wird die Zuordnung zwischen der Datensammlungsregel und dem Cluster gelöscht, und die Integritätsdienst und SDDC-Verwaltungsprotokolle werden nicht mehr gesammelt. Vorhandene Daten werden jedoch nicht gelöscht. Wenn Sie diese Daten löschen möchten, wechseln Sie in Ihren DCR- und Log Analytics-Arbeitsbereich, und löschen Sie die Daten manuell.

Insights aktualisieren

Das Steuerelement Erkenntnisse zeigt in den folgenden Fällen eine Meldung über eine notwendige Aktualisierung an:

  • Eine Datensammlungsregel wird geändert.
  • Ein Integritätsereignis aus dem Windows-Ereignisprotokoll wird gelöscht.
  • Jeder der fünf Leistungsindikatoren aus dem Log Analytics-Arbeitsbereich wird gelöscht.

Führen Sie die folgenden Schritte aus, um Insights erneut zu aktivieren:

  1. Wählen Sie das Steuerelement Erkenntnisse innerhalb des Bereichs Funktionen.

  2. Wählen Sie Aktualisieren, um die Visualisierungen erneut anzuzeigen.

    Screenshot des Fensters

Problembehandlung

Dieser Abschnitt enthält Anleitungen zum Beheben der Probleme bei der Verwendung von Insights für Azure Stack HCI.

Problembehandlung für leere Arbeitsmappenseite ohne aufgefüllte Daten

Ausstellen. Es wird eine leere Arbeitsmappenseite ohne Aufgefüllte Daten angezeigt, wie im folgenden Screenshot gezeigt:

Screenshot einer leeren Arbeitsmappenseite.

Mögliche Ursachen. Es kann mehrere Ursachen für dieses Problem geben, z. B. die aktuelle Konfiguration von Insights oder eine unsachgemäße Konfiguration des zugeordneten DCR.

Lösung: Führen Sie zum Beheben des Problems die folgenden Schritte in Sequenz aus:

  1. Wenn Sie Insights kürzlich konfiguriert haben, warten Sie bis zu einer Stunde, bis AMA Daten sammelt.
  2. Überprüfen Sie die Konfiguration des zugeordneten DCR. Stellen Sie sicher, dass Ereigniskanäle und Leistungsindikatoren dem zugeordneten DCR als Datenquellen hinzugefügt werden, wie im Abschnitt "Datensammlungsregeln " beschrieben.
  3. Wenn das Problem nach der Ausführung der obigen Schritte weiterhin besteht und weiterhin keine Daten angezeigt werden, wenden Sie sich an den Kundensupport, um Unterstützung zu erhalten.

Ausführlichere Anleitungen zur Problembehandlung finden Sie in den Anleitungen zur Problembehandlung für den Azure Monitor-Agent.

Visualisierungen der Erkenntnisse

Sobald die Funktion Erkenntnisse aktiviert ist, finden Sie in den folgenden Tabellen Informationen zu allen Ressourcen.

Gesundheit

Liefert Integritätsfehler eines Clusters.

Metrik Beschreibung Einheit Beispiel
Fehler Kurzbeschreibung von Integritätsfehlern. Wenn Sie auf den Link klicken, öffnet sich ein Seitenfenster mit weiteren Informationen. Keine Einheit PoolCapacityThresholdExceeded
Fehlerhafter Ressourcentyp Der Typ der Ressource, bei der ein Fehler aufgetreten ist. Keine Einheit StoragePool
Fehlerhafte Ressourcen-ID Eindeutige ID für die Ressource, bei der ein Integritätsfehler aufgetreten ist. Eindeutige ID {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Severity Der Schweregrad des Fehlers kann warnend oder kritisch sein. Keine Einheit Warnung
Anfängliche Fehlerzeit Zeitstempel, wann der Server zuletzt aktualisiert wurde. Datetime 09.04.2022, 12:15:42 Uhr

Server

Metrik Beschreibung Einheit Beispiel
Server Die Namen der Server im Cluster. Keine Einheit VM-1
Letzte Aktualisierung Das Datum und die Uhrzeit der letzten Aktualisierung des Servers. Datetime 09.04.2022, 12:15:42 Uhr
Status Die Integrität der Serverressourcen im Cluster. Der Status kann auf fehlerfrei, warnend, kritisch oder sonstiges stehen Healthy
CPU-Auslastung Der Prozentsatz der Zeit, in der der Prozess die CPU genutzt hat. Percent 56 %
Speicherauslastung Die Speichernutzung des Serverprozesses entspricht dem Zähler Prozess\Private Bytes plus der Größe der im Speicher zugeordneten Daten. Percent 16 %
Logische Prozessoren Die Anzahl der logischen Prozessoren. Anzahl 2
CPUs Die Anzahl der CPUs. Anzahl 2
Betriebszeit Die Zeit, in der eine Maschine, insbesondere ein Computer, in Betrieb ist. Timespan 2.609 Std.
Website Der Name des Standorts, zu dem der Server gehört. Sitename SiteA
Domänenname Die lokale Domain, zu der der Server gehört. Keine Einheit Contoso.local

Virtuelle Computer

Liefert den Status aller virtuellen Maschinen im Cluster. Eine VM kann sich in einem der folgenden Status befinden: Ausführend, Angehalten, Fehlgeschlagen oder Sonstiges (Unbekannt, Startend, Momentaufnahme, Abspeichernd, Anhaltend, Pausieren, Wiederaufnehmen, Angehalten, Ausgesetzt).

Metrik Beschreibung Einheit Beispiel
Server Name des Servers Keine Einheit Sample-VM-1
Zuletzt aktualisiert Dadurch wird das Datum und die Uhrzeit der letzten Aktualisierung des Servers angezeigt. Datetime 09.04.2022, 12:24:02 Uhr
VMs gesamt Die Anzahl der VMs in einem Serverknoten. Anzahl 0 von 0 in Ausführung
Wird ausgeführt Die Anzahl der VMs, die in einem Serverknoten ausgeführt werden. Anzahl 2
Beendet Die Anzahl der angehaltenen VMs in einem Serverknoten. Anzahl 3
Fehler Die Anzahl der fehlerhaften VMs in einem Serverknoten. Anzahl 2
Andere Wenn sich der virtuelle Computer in einem der folgenden Zustände befindet (Unknown, Starting, Snapshotting, Saving, Stop, Pausing, Resuming, Paused, Suspended), wird er als "Other" betrachtet. Anzahl 2

Speicher

Die folgende Tabelle enthält die Integrität von Volumes und Laufwerken im Cluster:

Metrik Beschreibung Einheit Beispiel
Volumes Der Name des Datenträgers Keine Einheit ClusterPerformanceHistory.
Letzte Aktualisierung Das Datum und die Uhrzeit der letzten Aktualisierung des Speichers. Datetime 14.04.2022, 14:58:55 Uhr
Status Der Status des Volumes. Fehlerfrei, warnend, kritisch und sonstige. Healthy
Gesamtkapazität Die Gesamtkapazität des Geräts in Byte während des Berichtszeitraums. Byte 2,5 GB
Verfügbare Kapazität Die verfügbare Kapazität in Byte während des Berichtszeitraums. Byte 20B
Iops Ein-/Ausgabevorgänge pro Sekunde. Pro Sekunde 45/s
Durchsatz Anzahl von Bytes pro Sekunde, die die Application Gateway-Instanz bereitgestellt hat. Bytes pro Sekunde 5 B/Sek.
Latency Die Zeit, die für die Fertigstellung der E/A-Anfrage benötigt wird. Second 0.0016 s
Resilienz Die Kapazität, sich von Fehlern zu erholen. Maximiert Datenverfügbarkeit. Keine Einheit Drei-Wege-Spiegel
Deduplizierung Der Vorgang zum Verringern der physischen Anzahl von Daten, die auf dem Datenträger gespeichert werden müssen. Verfügbar oder nicht verfügbar Ja/Nein
Dateisystem Der Typ des Dateisystems. Keine Einheit ReFS

Azure Monitor – Preise

Wenn Sie die Überwachungsvisualisierung aktivieren, werden Protokolle aus:

  • Integritätsmanagement (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).

Sie werden basierend auf der Menge der aufgenommenen Daten und den Datenaufbewahrungseinstellungen Ihres Log Analytics-Arbeitsbereichs in Rechnung gestellt.

Für Azure Monitor gelten nutzungsbasierte Preise, und die ersten fünf GB pro Abrechnungskonto und Monat sind kostenlos. Da die Preise aufgrund verschiedener Faktoren wie der verwendeten Azure-Region variieren können, finden Sie mithilfe des Azure Monitor-Preisrechners die aktuellsten Preisberechnungen.

Nächste Schritte