Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
In der folgenden Tabelle sind die verfügbaren Metriken für den Ressourcentyp Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments aufgeführt.
Tabellenüberschriften
Metrik: Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API : Metrikname, wie in der REST-API bezeichnet.
Einheit : Maßeinheit.
Aggregation : Der Standardaggregationstyp . Gültige Werte: Durchschnitt, Minimum, Maximum, Total, Count.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Zeitkörnungen - Intervalle, in denen die Metrik stichprobeniert wird. Gibt beispielsweise an, PT1M
dass die Metrik jede Minute, PT30M
alle 30 Minuten, PT1H
jede Stunde usw. erfasst wird.
DS-Export: Gibt an, ob die Metrik über Diagnoseeinstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Erstellen von Diagnoseeinstellungen in Azure Monitor.
Informationen zur Aufbewahrung von Metriken finden Sie unter Übersicht über Azure Monitor-Metriken.
Category | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Zeitkörnungen | DS-Export |
---|---|---|---|---|---|---|---|
Resource | Prozentuale CPU-Speicherauslastung Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Average | instanceId |
PT1M | Yes |
Resource | Prozentsatz der CPU-Auslastung Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuUtilizationPercentage |
Percent | Minimum, Maximum, Average | instanceId |
PT1M | Yes |
Resource | Datensammlungsfehler pro Minute Die Anzahl der verworfenen Datensammlungsereignisse pro Minute. |
DataCollectionErrorsPerMinute |
Anzahl | Minimum, Maximum, Average | instanceId , reason , type |
PT1M | No |
Resource | Datensammlungsereignisse pro Minute Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute. |
DataCollectionEventsPerMinute |
Anzahl | Minimum, Maximum, Average | instanceId , type |
PT1M | No |
Resource | Bereitstellungskapazität Die Anzahl der Instanzen in der Bereitstellung. |
DeploymentCapacity |
Anzahl | Minimum, Maximum, Average | instanceId , State |
PT1M | No |
Resource | Datenträgerverwendung Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
DiskUtilization |
Percent | Minimum, Maximum, Average | instanceId , disk |
PT1M | Yes |
Resource | GPU-Energie in Joule Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet. |
GpuEnergyJoules |
Anzahl | Minimum, Maximum, Average | instanceId |
PT1M | No |
Resource | Prozentuale GPU-Speicherauslastung Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Average | instanceId |
PT1M | Yes |
Resource | GPU-Auslastung in Prozent Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuUtilizationPercentage |
Percent | Minimum, Maximum, Average | instanceId |
PT1M | Ja |
Verkehr | Anforderungswartezeit P50 Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P50 |
Millisekunden | Average | <keine> | PT1M | Ja |
Verkehr | Anforderungswartezeit P90 Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P90 |
Millisekunden | Average | <keine> | PT1M | Ja |
Verkehr | Anforderungswartezeit P95 Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P95 |
Millisekunden | Average | <keine> | PT1M | Ja |
Verkehr | Anforderungswartezeit P99 Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P99 |
Millisekunden | Average | <keine> | PT1M | Ja |
Verkehr | Anforderungen pro Minute Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet werden |
RequestsPerMinute |
Anzahl | Average | envoy_response_code |
PT1M | Nein |
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für