Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

En-têtes de table

Métrique : nom d’affichage de la métrique tel qu’il apparaît dans le Portail Azure.
Nom dans l’API Rest - Nom de la métrique comme indiqué dans l’API REST.
Unité : unité de mesure.
Agrégation : type d’agrégation par défaut. Valeurs valides : Moyenne, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Grains - de tempsIntervalles auxquels la métrique est échantillonné. Par exemple, PT1M indique que la métrique est échantillonné toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique peut être exportée dans les journaux Azure Monitor via les paramètres de diagnostic. Pour plus d’informations sur l’exportation de métriques, consultez Créer des paramètres de diagnostic dans Azure Monitor.

Pour plus d’informations sur la rétention des métriques, consultez Vue d’ensemble des métriques Azure Monitor.

Category Métrique Nom dans l’API REST Unité Agrégation Dimensions Grains de temps Exportation DS
Ressource Pourcentage d’utilisation de la mémoire processeur

Pourcentage d’utilisation de la mémoire sur une instance. L’utilisation est rapportée à intervalles d’une minute.
CpuMemoryUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Yes
Ressource Pourcentage d’utilisation de l’UC

Pourcentage d’utilisation du processeur sur une instance. L’utilisation est rapportée à intervalles d’une minute.
CpuUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Yes
Ressource Erreurs de collecte de données par minute

Nombre d’événements de collecte de données abandonnés par minute.
DataCollectionErrorsPerMinute Count Minimum, Maximum, Moyenne instanceId, reason, type PT1M No
Ressource Événements de collecte de données par minute

Nombre d’événements de collecte de données traités par minute.
DataCollectionEventsPerMinute Count Minimum, Maximum, Moyenne instanceId, type PT1M No
Ressource Capacité de déploiement

Nombre d’instances dans le déploiement.
DeploymentCapacity Count Minimum, Maximum, Moyenne instanceId, State PT1M No
Ressource Utilisation du disque

Pourcentage d’utilisation du disque sur une instance. L’utilisation est rapportée à intervalles d’une minute.
DiskUtilization Pourcentage Minimum, Maximum, Moyenne instanceId, disk PT1M Yes
Ressource Énergie GPU en joules

Énergie par intervalle en joules sur un nœud GPU. L’énergie est rapportée à intervalles d’une minute.
GpuEnergyJoules Count Minimum, Maximum, Moyenne instanceId PT1M No
Ressource Pourcentage d’utilisation de la mémoire GPU

Pourcentage d’utilisation de la mémoire GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.
GpuMemoryUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Yes
Ressource Pourcentage d’utilisation du GPU

Pourcentage d’utilisation du GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.
GpuUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Oui
Trafic Latence de requête P50

Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P50 Millisecondes Average <Aucune> PT1M Oui
Trafic Latence de requête P90

Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P90 Millisecondes Average <Aucune> PT1M Oui
Trafic Latence de requête P95

Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P95 Millisecondes Average <Aucune> PT1M Oui
Trafic Latence de requête P99

Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P99 Millisecondes Average <Aucune> PT1M Oui
Trafic Demandes par minute

Nombre de demandes envoyées au déploiement en ligne dans un délai d’une minute
RequestsPerMinute Count Average envoy_response_code PT1M Non