Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
En-têtes de table
Métrique : nom d’affichage de la métrique tel qu’il apparaît dans le Portail Azure.
Nom dans l’API Rest - Nom de la métrique comme indiqué dans l’API REST.
Unité : unité de mesure.
Agrégation : type d’agrégation par défaut. Valeurs valides : Moyenne, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Grains - de tempsIntervalles auxquels la métrique est échantillonné. Par exemple, PT1M
indique que la métrique est échantillonné toutes les minutes, PT30M
toutes les 30 minutes, PT1H
toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique peut être exportée dans les journaux Azure Monitor via les paramètres de diagnostic. Pour plus d’informations sur l’exportation de métriques, consultez Créer des paramètres de diagnostic dans Azure Monitor.
Pour plus d’informations sur la rétention des métriques, consultez Vue d’ensemble des métriques Azure Monitor.
Category | Métrique | Nom dans l’API REST | Unité | Agrégation | Dimensions | Grains de temps | Exportation DS |
---|---|---|---|---|---|---|---|
Ressource | Pourcentage d’utilisation de la mémoire processeur Pourcentage d’utilisation de la mémoire sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
CpuMemoryUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Yes |
Ressource | Pourcentage d’utilisation de l’UC Pourcentage d’utilisation du processeur sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
CpuUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Yes |
Ressource | Erreurs de collecte de données par minute Nombre d’événements de collecte de données abandonnés par minute. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Moyenne | instanceId , reason , type |
PT1M | No |
Ressource | Événements de collecte de données par minute Nombre d’événements de collecte de données traités par minute. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Moyenne | instanceId , type |
PT1M | No |
Ressource | Capacité de déploiement Nombre d’instances dans le déploiement. |
DeploymentCapacity |
Count | Minimum, Maximum, Moyenne | instanceId , State |
PT1M | No |
Ressource | Utilisation du disque Pourcentage d’utilisation du disque sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
DiskUtilization |
Pourcentage | Minimum, Maximum, Moyenne | instanceId , disk |
PT1M | Yes |
Ressource | Énergie GPU en joules Énergie par intervalle en joules sur un nœud GPU. L’énergie est rapportée à intervalles d’une minute. |
GpuEnergyJoules |
Count | Minimum, Maximum, Moyenne | instanceId |
PT1M | No |
Ressource | Pourcentage d’utilisation de la mémoire GPU Pourcentage d’utilisation de la mémoire GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
GpuMemoryUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Yes |
Ressource | Pourcentage d’utilisation du GPU Pourcentage d’utilisation du GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
GpuUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Oui |
Trafic | Latence de requête P50 Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P50 |
Millisecondes | Average | <Aucune> | PT1M | Oui |
Trafic | Latence de requête P90 Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P90 |
Millisecondes | Average | <Aucune> | PT1M | Oui |
Trafic | Latence de requête P95 Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P95 |
Millisecondes | Average | <Aucune> | PT1M | Oui |
Trafic | Latence de requête P99 Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P99 |
Millisecondes | Average | <Aucune> | PT1M | Oui |
Trafic | Demandes par minute Nombre de demandes envoyées au déploiement en ligne dans un délai d’une minute |
RequestsPerMinute |
Count | Average | envoy_response_code |
PT1M | Non |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour