Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.
Tabellenüberschriften
Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API – Metrischer Name, wie in der REST-API bezeichnet.
Einheit – Abrechnungseinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert, Minimum, Maximum, Gesamt, Anzahl.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird. PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M
alle 30 Minuten, PT1H
jede Stunde usw.
DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann.
Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.
Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.
Kategorie | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|---|
Resource | Prozentuale CPU-Speicherauslastung Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Prozentsatz der CPU-Auslastung Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Datensammlungsfehler pro Minute Die Anzahl der verworfenen Datensammlungsereignisse pro Minute. |
DataCollectionErrorsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , reason type |
PT1M | No |
Resource | Datensammlungsereignisse pro Minute Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute. |
DataCollectionEventsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , type |
PT1M | No |
Resource | Bereitstellungskapazität Die Anzahl der Instanzen in der Bereitstellung. |
DeploymentCapacity |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , State |
PT1M | No |
Resource | Datenträgerauslastung Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
DiskUtilization |
Percent | Minimum, Maximum, Mittelwert | instanceId , disk |
PT1M | Ja |
Resource | GPU-Energie in Joule Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet. |
GpuEnergyJoules |
Anzahl | Minimum, Maximum, Mittelwert | instanceId |
PT1M | No |
Resource | Prozentuale GPU-Speicherauslastung Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Prozentuale GPU-Auslastung Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Verkehr | Anforderungswartezeit P50 Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P50 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P90 Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P90 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P95 Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P95 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P99 Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P99 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungen pro Minute Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden |
RequestsPerMinute |
Anzahl | Average | envoy_response_code |
PT1M | No |