Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
NVIDIA DCGM Exporter permite recopilar y exportar métricas de GPU de NVIDIA, como el uso, el uso de memoria y el consumo de energía. Puede usar este exportador y habilitar la supervisión de GPU a través del servicio administrado de Azure Monitor para Prometheus y a través de Azure Managed Grafana.
Implementación de NVIDIA DCGM Exporter
Implemente el exportador y configure la recopilación de métricas siguiendo las instrucciones de Supervisión de métricas de GPU de NVIDIA DCGM Exporter con servicio administrado para Prometheus y Azure Managed Grafana en AKS.
Consulta de métricas de GPU
Las métricas descartadas se almacenan en el área de trabajo de Azure Monitor asociada al servicio administrado para Prometheus. Puede consultar las métricas directamente desde el área de trabajo o a través de la instancia de Grafana administrada de Azure que está conectada al área de trabajo.
Para ver las métricas de GPU de NVIDIA en el área de trabajo de Azure Monitor:
En Azure Portal, vaya al clúster de Azure Kubernetes Service.
En Supervisión, seleccione Insights, luego Configuración de supervisión.
Seleccione la instancia del área de trabajo de Azure Monitor. En la página de información general de la instancia, seleccione la sección Métricas para consultar las métricas.
Como alternativa, puede seleccionar la instancia de Grafana administrada de Azure. A continuación, en la página de información general de la instancia, seleccione la dirección URL del punto de conexión. Esta acción se abre en el portal de Grafana, donde puede consultar las métricas de Azure Container Storage. El origen de datos se configura automáticamente para que consulte las métricas desde el área de trabajo de Azure Monitor asociada.
Para más información sobre cómo consultar las métricas de Prometheus desde un área de trabajo de Azure Monitor, consulte Conexión de Grafana a métricas de Prometheus de Azure Monitor.
Solución de problemas
Si tiene algún problema, consulte la información de solución de problemas de la interfaz de Prometheus.