Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

In der folgenden Tabelle sind die verfügbaren Metriken für den Ressourcentyp Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments aufgeführt.

Tabellenüberschriften

Metrik: Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API : Metrikname, wie in der REST-API bezeichnet.
Einheit : Maßeinheit.
Aggregation : Der Standardaggregationstyp . Gültige Werte: Durchschnitt, Minimum, Maximum, Total, Count.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Zeitkörnungen - Intervalle, in denen die Metrik stichprobeniert wird. Gibt beispielsweise an, PT1M dass die Metrik jede Minute, PT30M alle 30 Minuten, PT1H jede Stunde usw. erfasst wird.
DS-Export: Gibt an, ob die Metrik über Diagnoseeinstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Erstellen von Diagnoseeinstellungen in Azure Monitor.

Informationen zur Aufbewahrung von Metriken finden Sie unter Übersicht über Azure Monitor-Metriken.

Category Metrik Name in der REST-API Einheit Aggregation Dimensionen Zeitkörnungen DS-Export
Resource Prozentuale CPU-Speicherauslastung

Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuMemoryUtilizationPercentage Percent Minimum, Maximum, Average instanceId PT1M Yes
Resource Prozentsatz der CPU-Auslastung

Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuUtilizationPercentage Percent Minimum, Maximum, Average instanceId PT1M Yes
Resource Datensammlungsfehler pro Minute

Die Anzahl der verworfenen Datensammlungsereignisse pro Minute.
DataCollectionErrorsPerMinute Anzahl Minimum, Maximum, Average instanceId, reason, type PT1M No
Resource Datensammlungsereignisse pro Minute

Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute.
DataCollectionEventsPerMinute Anzahl Minimum, Maximum, Average instanceId, type PT1M No
Resource Bereitstellungskapazität

Die Anzahl der Instanzen in der Bereitstellung.
DeploymentCapacity Anzahl Minimum, Maximum, Average instanceId, State PT1M No
Resource Datenträgerverwendung

Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
DiskUtilization Percent Minimum, Maximum, Average instanceId, disk PT1M Yes
Resource GPU-Energie in Joule

Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet.
GpuEnergyJoules Anzahl Minimum, Maximum, Average instanceId PT1M No
Resource Prozentuale GPU-Speicherauslastung

Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuMemoryUtilizationPercentage Percent Minimum, Maximum, Average instanceId PT1M Yes
Resource GPU-Auslastung in Prozent

Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuUtilizationPercentage Percent Minimum, Maximum, Average instanceId PT1M Ja
Verkehr Anforderungswartezeit P50

Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P50 Millisekunden Average <keine> PT1M Ja
Verkehr Anforderungswartezeit P90

Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P90 Millisekunden Average <keine> PT1M Ja
Verkehr Anforderungswartezeit P95

Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P95 Millisekunden Average <keine> PT1M Ja
Verkehr Anforderungswartezeit P99

Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P99 Millisekunden Average <keine> PT1M Ja
Verkehr Anforderungen pro Minute

Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet werden
RequestsPerMinute Anzahl Average envoy_response_code PT1M Nein