Azure Operator Nexus Observability

Das Operator Nexus Observability Framework bietet operative Einblicke in Ihre lokalen Instanzen. Das Framework unterstützt Protokollierung, Überwachung und Warnung (LMA), Analysen und Visualisierung von Betriebsdaten (Plattform- und Workloads)-Daten und -Metriken.

Screenshot of Operator Nexus Logging, Monitoring and Alerting (LMA) Framework.

Abbildung: Operator Nexus Logging, Monitoring and Alerting (LMA) Framework

Die wichtigsten Highlights des Operator Nexus Observability Frameworks sind:

  • Zentrale Datenerfassung: Die Observability-Lösung operator Nexus basiert auf einer Sammlung aller Daten an einem zentralen Ort. An dieser Stelle können Sie die Überwachungsdaten aller lokalen Instanzen beobachten.
  • Gut definierte und getestete Tools: Die Lösung basiert auf Azure Monitor, der Telemetriedaten aus Ihrer Cloud und lokalen Instanzen sammelt, analysiert und verarbeitet.
  • Einfach zu erlernen und zu verwenden: Die Lösung erleichtert Es Ihnen, Probleme mit der Möglichkeit zu analysieren und zu debuggen, die Daten von innerhalb oder über alle Ihre Cloud- und lokalen Instanzen zu durchsuchen.
  • Visualisierungstools: Sie erstellen angepasste Dashboards und Arbeitsmappen nach Ihren Anforderungen.
  • Integrierte Warnungstools: Sie erstellen Warnungen basierend auf benutzerdefinierten Schwellenwerten. Sie können Warnungsvorlagen für alle Ihre Instanzen erstellen und wiederverwenden.

Dieser Artikel hilft Ihnen, das Observability-Framework von Operator Nexus zu verstehen, das aus einem Stapel von Komponenten besteht:

  • Azure Monitor sammelt und aggregiert Protokollierungsdaten aus den Operator Nexus-Komponenten
  • Azure Log Analytics Workspace (LAW) sammelt und aggregiert Protokollierungsdaten aus mehreren Azure-Abonnements und -Mandanten.
  • Analysen, Visualisierungen und Warnungen werden für die aggregierten Protokolldaten ausgeführt.

Plattformüberwachung

Operator Nexus bietet Ihnen Einblicke in die Leistung Ihrer Bereitstellungen, die aus Infrastrukturressourcen bestehen. Sie benötigen die Protokolle und Metriken, die aus diesen Plattformressourcen gesammelt und analysiert werden sollen. Sie erhalten wertvolle Erkenntnisse aus der zentralisierten Sammlung und Aggregation von Daten aus allen Quellen im Vergleich zu disaggregatierten Daten.

Diese Protokolle und Metriken werden verwendet, um den Status der Plattform zu beobachten. Sie können die Leistung sehen und analysieren, was falsch ist. Sie können analysieren, was die Situation verursacht hat. Die Visualisierung hilft Ihnen beim Konfigurieren der erforderlichen Warnungen und unter welchen Bedingungen. Sie können z. B. die Warnungen so konfigurieren, dass sie generiert werden, wenn Ressourcen nicht ordnungsgemäß ausgeführt werden oder wenn Schwellenwerte erreicht wurden. Sie können die gesammelten Protokolle und Analysen verwenden, um Probleme in der Umgebung zu debuggen.

Überwachen von Daten

Operator Nexus Observability ermöglicht es Ihnen, dieselbe Art von Daten wie andere Azure-Ressourcen zu sammeln. Die von den einzelnen Instanzen gesammelten Daten können in Ihrem GESETZ angezeigt werden.

Hier erfahren Sie mehr über die Überwachung von Azure-Ressourcen.

Sammlung und Routing

Operator Nexus Observability ermöglicht es Ihnen, Daten für jede Infrastrukturressource zu sammeln. Der Satz von Infrastrukturkomponenten umfasst:

  • Netzwerk fabric, das CEs, TORs, NPBs, Management Switches und den Terminalserver enthält.
  • Berechnen, das Bare Metal Server enthält.
  • Undercloud Control Plane (Kubernetes-Cluster, der für die Bereitstellung und verwaltung des Lebenszyklus der gesamten Plattform verantwortlich ist).

Die Erfassung von Protokolldaten aus diesen Ebenen ist bei der Erstellung Ihrer Operator Nexus-Instanz standardmäßig aktiviert. Diese gesammelten Protokolle werden an Ihren Azure Monitor LAW weitergeleitet.

Sie können auch Daten aus den Mandantenebenen sammeln, die für die Ausführung von containerisierten und virtualisierten Netzwerkfunktionen erstellt wurden. Die Protokolldaten, die gesammelt werden können, umfassen:

  • Sammlung von Syslog von virtuellen Computern (verwendet für VNFs oder CNF-Workloads).
  • Sammlung von Protokollen aus Kubernetes-Clustern und den oben bereitgestellten Anwendungen.

Sie müssen die Sammlung der Protokolle aus den Kubernetes-Mandantenclustern und virtuellen Computern aktivieren. Führen Sie die Schritte zum Bereitstellen der Azure-Überwachungs-Agents aus. Die Daten werden in Ihrem Azure LAW erfasst.

Speicher des Operator Nexus Logs

Daten in Azure Monitor-Protokollen werden in Tabellen gespeichert, wobei jede Tabelle ihren eigenen Satz an eindeutigen Eigenschaften hat.

Alle Ressourcenprotokolle in Azure Monitor weisen dieselben Felder auf, gefolgt von dienstspezifischen Feldern; siehe das allgemeine Schema.

Die Protokolle der Operator Nexus-Plattform werden in den folgenden Tabellen gespeichert:

Tabelle Beschreibung
syslog Syslog-Ereignisse auf Linux-Computern mit dem Log Analytics-Agent
ContainerInventory Details und aktueller Status der einzelnen Container.
ContainerLog Log lines collected from stdout and stderr streams for containers
ContainerNodeInventory Details zu Knoten, die als Containerhosts dienen.
InsightMetrics Metriken, die von Server, K8s, Containern gesammelt werden.
KubeEvents Kubernetes-Ereignisse und deren Eigenschaften.
KubeMonAgentEvents Ereignisse, die vom Azure Monitor Kubernetes-Agent für Fehler und Warnungen protokolliert werden.
KubeNodeInventory Details zu Knoten, die Teil des Kubernetes-Clusters sind
KubePodInventory Kubernetes-Pods und ihre Eigenschaften
KubePVInventory Kubernetes persistente Volumes und deren Eigenschaften.
KubeServices Kubernetes-Dienste und deren Eigenschaften
Heartbeat Aufzeichnungen, die von Log Analytics-Agents einmal pro Minute protokolliert werden, um über die Agentintegrität zu berichten

Operator-Nexusmetriken

Die Tabelle "InsightMetrics" im Abschnitt "Protokolle" enthält die Metriken, die von Bare Metal Machines und dem Undercloud Kubernetes-Cluster gesammelt werden. Darüber hinaus können einige ausgewählte Metriken, die aus der Untercloud gesammelt werden, beobachtet werden, indem sie die Registerkarte "Metriken" im Menü "Azure Monitor" öffnen.

Screenshot of Azure Monitor Metrics Selection.

Abbildung: Auswahl von Azure Monitor-Metriken

Details zur Verwendung dieses Tools finden Sie unter Analysieren von Metriken mit dem Azure Monitor-Metrik-Explorer.

Arbeitsmappen

Arbeitsmappen kombinieren Text, Protokollabfragen, Metriken und Parameter für die Datenanalyse und die Erstellung mehrerer Arten von umfangreichen Visualisierungen. Sie können die Azure Resource Manager-Beispielarbeitsmappenvorlagen für die Operator Nexus Logging and Monitoring verwenden, um Azure-Arbeitsmappen in Ihrem Azure LAW bereitzustellen.

Alerts

Sie können die Beispiel-Azure Resource Manager-Alarmvorlagen für Operator Nexus-Warnungsregeln verwenden. Sie sollten Schwellenwerte und Bedingungen für die Warnungen angeben. Anschließend können Sie diese Warnungsvorlagen in Ihrer lokalen Umgebung bereitstellen.

Log Analytic Workspace

Ein Log Analytics-Arbeitsbereich (LAW) ist eine einzigartige Umgebung zum Protokollieren von Daten aus Azure Monitor und anderen Azure-Diensten. Jeder Arbeitsbereich verfügt über ein eigenes Daten-Repository und eine eigene Konfiguration, kann aber Daten aus mehreren Diensten kombinieren. Jeder Arbeitsbereich besteht aus mehreren Datentabellen.

Ein einzelnes LAW kann erstellt werden, um alle relevanten Daten oder mehrere Arbeitsbereiche basierend auf den Betreiberanforderungen zu sammeln.