Teilen über


Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.

Tabellenüberschriften

Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API – Metrischer Name, wie in der REST-API bezeichnet.
Einheit – Abrechnungseinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert, Minimum, Maximum, Gesamt, Anzahl.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird. PT1M bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M alle 30 Minuten, PT1H jede Stunde usw.
DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann.

Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.

Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.

Kategorie Metrik Name in der REST-API Einheit Aggregation Dimensionen Aggregationsintervalle DS-Export
Resource Prozentuale CPU-Speicherauslastung

Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuMemoryUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Resource Prozentsatz der CPU-Auslastung

Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Resource Datensammlungsfehler pro Minute

Die Anzahl der verworfenen Datensammlungsereignisse pro Minute.
DataCollectionErrorsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, reasontype PT1M No
Resource Datensammlungsereignisse pro Minute

Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute.
DataCollectionEventsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, type PT1M No
Resource Bereitstellungskapazität

Die Anzahl der Instanzen in der Bereitstellung.
DeploymentCapacity Anzahl Minimum, Maximum, Mittelwert instanceId, State PT1M No
Resource Datenträgerauslastung

Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
DiskUtilization Percent Minimum, Maximum, Mittelwert instanceId, disk PT1M Ja
Resource GPU-Energie in Joule

Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet.
GpuEnergyJoules Anzahl Minimum, Maximum, Mittelwert instanceId PT1M No
Resource Prozentuale GPU-Speicherauslastung

Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuMemoryUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Resource Prozentuale GPU-Auslastung

Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Verkehr Anforderungswartezeit P50

Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P50 Millisekunden Average <none> PT1M Ja
Verkehr Anforderungswartezeit P90

Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P90 Millisekunden Average <none> PT1M Ja
Verkehr Anforderungswartezeit P95

Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P95 Millisekunden Average <none> PT1M Ja
Verkehr Anforderungswartezeit P99

Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P99 Millisekunden Average <none> PT1M Ja
Verkehr Anforderungen pro Minute

Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden
RequestsPerMinute Anzahl Average envoy_response_code PT1M No