Freigeben über


Sammeln von GPU-Metriken von Nvidia DCGM-Exporter mit Azure Managed Prometheus

Nvidias DCGM-Exporter ermöglicht das Sammeln und Exportieren von Nvidia GPU-Metriken wie Auslastung, Arbeitsspeichernutzung, Stromverbrauch usw. Sie können diesen Exporter verwenden und die GPU-Überwachung mit Azure Managed Prometheus und Azure Managed Grafana aktivieren. Folgen Sie den Anweisungen im folgenden Link, um den Exporter bereitzustellen und die Metrikenerfassung einzurichten.

Überwachen von GPU-Metriken von NVIDIA DCGM-Exporter mit Azure Managed Prometheus und Azure Managed Grafana

Abfrage der GPU-Metriken

Die gesammelten Metriken werden im Azure Monitor-Arbeitsbereich gespeichert, der mit Managed-Prometheus verknüpft ist. Sie können die Metriken direkt aus dem Arbeitsbereich oder über die Azure Managed Grafana-Instanz abfragen, die mit dem Arbeitsbereich verbunden ist.

Anzeigen von Istio-Metriken im Azure Monitor Workspace mithilfe der folgenden Schritte:

  1. Navigieren Sie im Azure-Portal zu Ihrem AKS-Cluster.
  2. Wählen Sie unter "Überwachung" "Insights" und dann "Einstellungen überwachen" aus.

Diagramm, das zeigt, wie der Azure Monitor Workspace angezeigt wird.

  1. Klicken Sie auf die Azure Monitor Workspace-Instanz, und klicken Sie auf der Seite "Instanzübersicht" auf den Abschnitt Metriken, um die Metriken abzufragen.
  2. Alternativ können Sie auf die Verwaltete Grafana-Instanz klicken und auf der Seite "Instanzübersicht" auf die Endpunkt-URL klicken. Dadurch navigieren Sie zum Grafana-Portal, in dem Sie die Azure Container Storage-Metriken abfragen können. Die Datenquelle wird automatisch für Sie konfiguriert, damit Sie Metriken aus dem zugeordneten Azure Monitor-Arbeitsbereich abfragen können.

Weitere Informationen zum Abfragen von Prometheus-Metriken aus Azure Monitor Workspace finden Sie unter Query Prometheus-Metriken.

Problembehandlung

Informationen zur Problembehandlung finden Sie hier.